当前位置：首页 > 面试题库 >

熊猫groupby而不将按列分组变成索引

赵高韵

2023-03-14

问题内容：

pandas groupby的默认行为是将group by列转换为index并将其从数据框的列列表中删除。例如，说我有一个包含这些列的dataFrame

col1|col2|col3|col4

如果我申请一个GROUPBY发言权列col2和col3这样

df.groupby(['col2','col3']).sum()

数据框df不再['col2','col3']在列列表中。它们将自动转换为结果数据帧的索引。

我的问题是如何对列执行groupby并将该列保留在数据框中？

问题答案：

df.groupby(['col2','col3'], as_index=False).sum()

类似资料：

熊猫，按操作列分组[重复]

我想得到这样的东西我用groupby关键字搜索了stackoverflow，没有找到与我类似的问题。
熊猫groupby：每组前3个值

问题内容：在 pandas groupby上发布了一个新的更通用的问题：每个组中的前3个值并存储在DataFrame中，并且在那里已经找到了可行的解决方案。在此示例中，我创建了一个数据帧，其中的一些随机数据间隔为5分钟。我想创建一个数据框（ df分组），其中列出了每小时的 3个最高值。即：从这一系列价值我非常接近解决方案，但我找不到最后一步的正确语法。我到现在为止（）的结果是：我想从
熊猫groupby嵌套JSON

问题内容：我经常使用pandas groupby生成堆积表。但是然后我经常想将生成的嵌套关系输出到json。有什么方法可以从生成的堆叠表中提取嵌套的json文件吗？假设我有一个df，例如：我可以：美丽！当然，我真正想做的是通过命令沿着grouped.to_json嵌套嵌套的json。但是该功能不可用。任何解决方法？所以，我真正想要的是这样的：唐问题答案：我认为熊猫没有内置任何东西可
熊猫在groupby内插

问题内容：我有一个包含以下信息的数据框：我想根据索引插入数据帧中的值，但仅在每个文件组中。插值，我通常会做和我一起做我希望插入的数据帧看起来像这样： NaN仍然存在于t = 6的位置，因为它们是file2组中的第一项。我怀疑我需要使用“应用”，但是还无法确切地知道如何… 任何帮助，将不胜感激。问题答案：
熊猫groupby为零值

问题内容：我在csv文件中有这样的数据我可以像这样阅读和分组我懂了我希望这个（顺序无所谓）我想知道是否有可能算零次问题答案：你可以用与：如果您需要使用输出：
Groupby和熊猫计数

我必须根据以下col1、col2和loc的数据进行分组，并计算col3中的项数。此外，还应考虑开始和结束日期，即日期应在2021 1月1日至2021 1月31日之间。最终结果应显示在col4中。数据预期输出

熊猫groupby而不将按列分组变成索引

相关阅读

相关文章

相关问答

相关工具

相关文档