当前位置：首页 > 面试题库 >

Python-如何在pandas DataFrame中对连续值进行分组

殷浩慨

2023-03-14

问题内容：

我在DataFrame中有一列带有值：

[1, 1, -1, 1, -1, -1]

如何将它们这样分组？

[1,1] [-1] [1] [-1, -1]

问题答案：

你可以groupby通过自定义使用Series：

df = pd.DataFrame({'a': [1, 1, -1, 1, -1, -1]})
print (df)
   a
0  1
1  1
2 -1
3  1
4 -1
5 -1

print ((df.a != df.a.shift()).cumsum())
0    1
1    1
2    2
3    3
4    4
5    4
Name: a, dtype: int32

for i, g in df.groupby([(df.a != df.a.shift()).cumsum()]):
    print (i)
    print (g)
    print (g.a.tolist())

   a
0  1
1  1
[1, 1]
2
   a
2 -1
[-1]
3
   a
3  1
[1]
4
   a
4 -1
5 -1
[-1, -1]

类似资料：

如何对连续的行进行分组？

问题内容：所以，我有一张表，上面有这样的行：每次扫描警报时（即每次触发或清除警报时）都会添加“已扫描的警报”行。任何警报都会添加带有特定Ev_Custom1的行。第一列Ev_Message包含一个计算机ID，该ID使我可以将警报与其他计算机分开。（您不喜欢任意的列名吗？）超过900条独特的警报消息。我希望查询返回的内容是这样的：这将是两个日期之间过滤的查询。我可以更改进入表的数据，但是有9
如何在MySQL中进行连续分组？

问题内容：我如何返回在MySQL中实际上是“连续的” GROUP BY。换句话说，GROUP BY是否尊重记录集的顺序？例如，从下表中，col1是唯一的有序索引：返回：但我需要返回以下内容：问题答案：采用：这里的关键是创建一个允许分组的人为值。以前，更正了Guffa的答案：
如何在MySQL中进行连续分组依据？

问题内容：如何返回在MySQL中实际上是“连续的” GROUP BY的内容。换句话说，GROUP BY是否尊重记录集的顺序？例如，从下表中，col1是唯一的有序索引：返回：但我需要返回以下内容：问题答案：使用：这里的关键是创建一个允许分组的人为值。以前，更正了Guffa的答案：
如何使用MySQL对连续范围进行分组

问题内容：我有一个包含类别，日期和费率的表。每个类别在不同日期可以具有不同的费率，一个类别在给定日期只能具有一个费率。唯一索引（类别，日期，费率）我希望针对每个类别将所有连续的日期范围归为一组，并仅保留范围的开始和结束。对于前面的示例，我们将有：我在论坛中找到了一个类似的解决方案，但并未完全给出结果请参见SQL FIDDLE 如何在mysql中做同样的事情？请帮忙！问题答案： MySQL
Python-如何用pandasDataFrame中的先前值替换NaN？

问题内容：假设我有一个带有的DataFrame ：我需要做的是用上方的同一列中NaN的第一个非NaN值替换每个值。假设第一行永远不会包含NaN。因此，对于前面的示例，结果将是我可以遍历整个DataFrame的逐列，逐元素并直接设置值，但是是否有一种简单的方法（最佳无循环方法）来实现这一点？问题答案：你可以在上使用该方法，并将该方法指定为ffill（正向填充）：这个方法将上一个有效观
如何对连续负二项分布进行高效采样？

我想做的是利用我对连续负二项分布进行抽样的事实，这是得到头部所需要的试验数的分布，也就是说，如果f(X)是这个分布，那么f(X)给出了在我们遇到头部之前有X个尾部的概率，其中X不必是整数。如果我能对这个分布进行采样，那么我能做的就是，如果X是尾部的数量，那么我就能看到X是大于还是小于信用的数量；如果大于，那么我们用完所有的学分，但什么也没有发生，如果小于或等于，那么好事发生了，我们从学分的数目中减

Python-如何在pandas DataFrame中对连续值进行分组

相关阅读

相关文章

相关问答

相关工具

相关文档