当前位置：首页 > 面试题库 >

熊猫groupby和加入名单

司知

2023-03-14

问题内容：

我有一个数据框df，有两列，我想按一列分组并加入属于同一组的列表，例如：

column_a, column_b
1,         [1,2,3]
1,         [2,5]
2,         [5,6]

处理后：

column_a, column_b
1,         [1,2,3,2,5]
2,         [5,6]

我想保留所有重复项。我有以下问题：

数据框的dtype是对象。convert_objects（）不会自动将column_b转换为列表。我怎样才能做到这一点？
df.groupby（…）。apply（lambda x：…）中的函数适用于什么？x的形式是什么？清单？
我主要问题的解决方案？

提前致谢。

问题答案：

objectdtype是一个包罗万象的dtype，基本上意味着不是int，float，bool，datetime或timedelta。因此它将它们存储为列表。convert_objects尝试将列转换为这些dtype之一。

你要

In [63]: df
Out[63]: 
   a          b    c
0  1  [1, 2, 3]  foo
1  1     [2, 5]  bar
2  2     [5, 6]  baz


In [64]: df.groupby('a').agg({'b': 'sum', 'c': lambda x: ' '.join(x)})
Out[64]: 
         c                b
a                          
1  foo bar  [1, 2, 3, 2, 5]
2      baz           [5, 6]

这将根据列中的值对数据帧进行分组a。阅读有关[groupby]的更多信息。（http://pandas.pydata.org/pandas-
docs/stable/groupby.html
）。

这是在做常规列表sum（串联），就像[1, 2, 3] + [2, 5]

类似资料：

Groupby和熊猫计数

我必须根据以下col1、col2和loc的数据进行分组，并计算col3中的项数。此外，还应考虑开始和结束日期，即日期应在2021 1月1日至2021 1月31日之间。最终结果应显示在col4中。数据预期输出
熊猫groupby嵌套JSON

问题内容：我经常使用pandas groupby生成堆积表。但是然后我经常想将生成的嵌套关系输出到json。有什么方法可以从生成的堆叠表中提取嵌套的json文件吗？假设我有一个df，例如：我可以：美丽！当然，我真正想做的是通过命令沿着grouped.to_json嵌套嵌套的json。但是该功能不可用。任何解决方法？所以，我真正想要的是这样的：唐问题答案：我认为熊猫没有内置任何东西可
熊猫在groupby内插

问题内容：我有一个包含以下信息的数据框：我想根据索引插入数据帧中的值，但仅在每个文件组中。插值，我通常会做和我一起做我希望插入的数据帧看起来像这样： NaN仍然存在于t = 6的位置，因为它们是file2组中的第一项。我怀疑我需要使用“应用”，但是还无法确切地知道如何… 任何帮助，将不胜感激。问题答案：
熊猫groupby为零值

问题内容：我在csv文件中有这样的数据我可以像这样阅读和分组我懂了我希望这个（顺序无所谓）我想知道是否有可能算零次问题答案：你可以用与：如果您需要使用输出：
熊猫Groupby和总和只有一栏

问题内容：所以我有一个数据框df1，看起来像下面的样子：我想按A列分组，然后对B列求和，同时将值保留在C列中。问题是，当我说df.groupby（’A’）。sum（）列C被删除时，返回当我进行分组和求和时，如何解决这个问题并保留C列？问题答案：唯一的方法是将C包含在groupby中（groupby函数可以接受列表）。试试看：需要注意的另一件事是，如果需要在聚合后使用df，则还可以使
使用groupby的熊猫fillna

问题内容：我正在尝试使用具有相似列值的行来估算值。例如，我有这个数据框我想使用相似的列[‘one’]和[‘two’]的键，并且如果列[‘three’]并非完全是nan，则从具有相似的键的行中插值[ ‘3’] 这是我的愿望结果您会看到键1和3不包含任何值，因为现有值不存在。我试过使用groupby fillna（）这给了我一个错误。我尝试了正向填充，这给了我一个相当奇怪的结果，那就是它

相关阅读

使用groupby的熊猫fillna 熊猫groupby与bin计数熊猫的最大和最小日期groupby 熊猫groupby：每组前3个值在“熊猫人” groupby的结果中添加“计数”列？

相关文章

猫眼java开发小熊电器—Hr面配置DNS和解析域名 Haskell输入和输出 Scipy输入和输出

相关问答

熊猫Groupby列，并获得0的频率熊猫中的Groupby，用[]填充缺失的组熊猫分组和总和要列出的熊猫列名熊猫：获取数组中的所有Groupby值[重复]

相关工具

熊猫Flash播放器简单的加入购物车动画猫国建设者红猫软路由 TOM猫学说话demo

相关文档

变现猫接入文档 v1.4 fbreader 和移动 DM 和加解密 Elixir 进阶之 Mix 和 OTP 入门 Fortran 77 和 90/95 编程入门厘米游戏引擎接入指南和开发文档