当前位置：首页 > 面试题库 >

熊猫groupby与bin计数

许彦

2023-03-14

问题内容：

我有一个看起来像这样的DataFrame：

+----------+---------+-------+
| username | post_id | views |
+----------+---------+-------+
| john     |       1 |     3 |
| john     |       2 |    23 |
| john     |       3 |    44 |
| john     |       4 |    82 |
| jane     |       7 |     5 |
| jane     |       8 |    25 |
| jane     |       9 |    46 |
| jane     |      10 |    56 |
+----------+---------+-------+

我想将其转换为对属于某些bin的视图进行计数，如下所示：

+------+------+-------+-------+--------+
|      | 1-10 | 11-25 | 25-50 | 51-100 |
+------+------+-------+-------+--------+
| john |    1 |     1 |     1 |      1 |
| jane |    1 |     1 |     1 |      1 |
+------+------+-------+-------+--------+

我试过了：

bins = [1, 10, 25, 50, 100]
groups = df.groupby(pd.cut(df.views, bins))
groups.username.count()

但它仅提供汇总计数，而不提供用户计数。如何获得用户的垃圾箱计数？

总计计数（使用我的真实数据）如下所示：

impressions
(2500, 5000]         2332
(5000, 10000]        1118
(10000, 50000]        570
(50000, 10000000]      14
Name: username, dtype: int64

问题答案：

您可以按垃圾箱和用户名分组，计算分组大小，然后使用unstack()：

>>> groups = df.groupby(['username', pd.cut(df.views, bins)])
>>> groups.size().unstack()
views     (1, 10]  (10, 25]  (25, 50]  (50, 100]
username
jane            1         1         1          1
john            1         1         1          1

类似资料：

Groupby和熊猫计数

我必须根据以下col1、col2和loc的数据进行分组，并计算col3中的项数。此外，还应考虑开始和结束日期，即日期应在2021 1月1日至2021 1月31日之间。最终结果应显示在col4中。数据预期输出
熊猫groupby嵌套JSON

问题内容：我经常使用pandas groupby生成堆积表。但是然后我经常想将生成的嵌套关系输出到json。有什么方法可以从生成的堆叠表中提取嵌套的json文件吗？假设我有一个df，例如：我可以：美丽！当然，我真正想做的是通过命令沿着grouped.to_json嵌套嵌套的json。但是该功能不可用。任何解决方法？所以，我真正想要的是这样的：唐问题答案：我认为熊猫没有内置任何东西可
熊猫在groupby内插

问题内容：我有一个包含以下信息的数据框：我想根据索引插入数据帧中的值，但仅在每个文件组中。插值，我通常会做和我一起做我希望插入的数据帧看起来像这样： NaN仍然存在于t = 6的位置，因为它们是file2组中的第一项。我怀疑我需要使用“应用”，但是还无法确切地知道如何… 任何帮助，将不胜感激。问题答案：
熊猫groupby为零值

问题内容：我在csv文件中有这样的数据我可以像这样阅读和分组我懂了我希望这个（顺序无所谓）我想知道是否有可能算零次问题答案：你可以用与：如果您需要使用输出：
熊猫使用groupby的计数创建新列

问题内容：我有一个如下所示的df：我正在尝试创建一个如下所示的df：我试过了但这不是我要寻找的。任何指导表示赞赏问题答案：那不是新的专栏，而是新的DataFrame：要获得想要的结果，请使用：要获得“新列”，您可以使用transform：我建议阅读docs的split- apply-combine部分。
使用groupby的熊猫fillna

问题内容：我正在尝试使用具有相似列值的行来估算值。例如，我有这个数据框我想使用相似的列[‘one’]和[‘two’]的键，并且如果列[‘three’]并非完全是nan，则从具有相似的键的行中插值[ ‘3’] 这是我的愿望结果您会看到键1和3不包含任何值，因为现有值不存在。我试过使用groupby fillna（）这给了我一个错误。我尝试了正向填充，这给了我一个相当奇怪的结果，那就是它

相关阅读

使用groupby的熊猫fillna 熊猫Groupby如何在DataFrame中显示零计数根据范围与大熊猫的Bin值熊猫groupby和加入名单在“熊猫人” groupby的结果中添加“计数”列？

相关文章

面试结束了，猫猫镇楼天猫双11高并发架构是怎么设计的？猫眼ios AQS的总体设计与架构统计学面试题与解析1

相关问答

熊猫中的Groupby，用[]填充缺失的组具有别名和“正常”数据帧的Groupby和count（）：python熊猫与mssql 熊猫：获取数组中的所有Groupby值[重复]熊猫:使用groupby重新创建数据透视表与熊猫一起漂流

相关工具

熊猫Flash播放器 BIN Framework JS Bin get-bin-path 《Redis 设计与实现》

相关文档

Redis 设计与实现计算与推断思维程序设计思想与方法雪城大学计算机与网络安全讲义 JavaScript 设计模式与开发实践学习笔记