当前位置：首页 > 面试题库 >

使用groupby的熊猫fillna

岳俊雅

2023-03-14

问题内容：

我正在尝试使用具有相似列值的行来估算值。

例如，我有这个数据框

one | two | three
1      1     10
1      1     nan
1      1     nan
1      2     nan
1      2     20
1      2     nan
1      3     nan
1      3     nan

我想使用相似的列[‘one’]和[‘two’]的键，并且如果列[‘three’]并非完全是nan，则从具有相似的键的行中插值[ ‘3’]

这是我的愿望结果

one | two | three
1      1     10
1      1     10
1      1     10
1      2     20
1      2     20
1      2     20
1      3     nan
1      3     nan

您会看到键1和3不包含任何值，因为现有值不存在。

我试过使用groupby fillna（）

df['three'] = df.groupby(['one','two'])['three'].fillna()

这给了我一个错误。

我尝试了正向填充，这给了我一个相当奇怪的结果，那就是它向前填充了第2列。我正在使用此代码进行正向填充。

df['three'] = df.groupby(['one','two'], sort=False)['three'].ffill()

感谢您的时间。

问题答案：

如果每个组仅使用一个非NaN的值ffill（前向填充）和bfill每组（向后填充），所以需要apply有lambda：

df['three'] = df.groupby(['one','two'], sort=False)['three']
                .apply(lambda x: x.ffill().bfill())
print (df)
   one  two  three
0    1    1   10.0
1    1    1   10.0
2    1    1   10.0
3    1    2   20.0
4    1    2   20.0
5    1    2   20.0
6    1    3    NaN
7    1    3    NaN

但是，如果每个组有多个值，并且需要用NaN某个常量替换-例如mean按组：

print (df)
   one  two  three
0    1    1   10.0
1    1    1   40.0
2    1    1    NaN
3    1    2    NaN
4    1    2   20.0
5    1    2    NaN
6    1    3    NaN
7    1    3    NaN

df['three'] = df.groupby(['one','two'], sort=False)['three']
                .apply(lambda x: x.fillna(x.mean()))
print (df)
   one  two  three
0    1    1   10.0
1    1    1   40.0
2    1    1   25.0
3    1    2   20.0
4    1    2   20.0
5    1    2   20.0
6    1    3    NaN
7    1    3    NaN

类似资料：

熊猫groupby嵌套JSON

问题内容：我经常使用pandas groupby生成堆积表。但是然后我经常想将生成的嵌套关系输出到json。有什么方法可以从生成的堆叠表中提取嵌套的json文件吗？假设我有一个df，例如：我可以：美丽！当然，我真正想做的是通过命令沿着grouped.to_json嵌套嵌套的json。但是该功能不可用。任何解决方法？所以，我真正想要的是这样的：唐问题答案：我认为熊猫没有内置任何东西可
熊猫在groupby内插

问题内容：我有一个包含以下信息的数据框：我想根据索引插入数据帧中的值，但仅在每个文件组中。插值，我通常会做和我一起做我希望插入的数据帧看起来像这样： NaN仍然存在于t = 6的位置，因为它们是file2组中的第一项。我怀疑我需要使用“应用”，但是还无法确切地知道如何… 任何帮助，将不胜感激。问题答案：
熊猫groupby为零值

问题内容：我在csv文件中有这样的数据我可以像这样阅读和分组我懂了我希望这个（顺序无所谓）我想知道是否有可能算零次问题答案：你可以用与：如果您需要使用输出：
Groupby和熊猫计数

我必须根据以下col1、col2和loc的数据进行分组，并计算col3中的项数。此外，还应考虑开始和结束日期，即日期应在2021 1月1日至2021 1月31日之间。最终结果应显示在col4中。数据预期输出
熊猫使用groupby的计数创建新列

问题内容：我有一个如下所示的df：我正在尝试创建一个如下所示的df：我试过了但这不是我要寻找的。任何指导表示赞赏问题答案：那不是新的专栏，而是新的DataFrame：要获得想要的结果，请使用：要获得“新列”，您可以使用transform：我建议阅读docs的split- apply-combine部分。
熊猫groupby与bin计数

问题内容：我有一个看起来像这样的DataFrame：我想将其转换为对属于某些bin的视图进行计数，如下所示：我试过了：但它仅提供汇总计数，而不提供用户计数。如何获得用户的垃圾箱计数？总计计数（使用我的真实数据）如下所示：问题答案：您可以按垃圾箱和用户名分组，计算分组大小，然后使用：

相关阅读

熊猫groupby与bin计数熊猫groupby和加入名单熊猫：使用groupby重新采样时间序列熊猫在groupby中的as_index是什么？熊猫groupby：每组前3个值

相关文章

小熊电器—Hr面猫眼前端一面猫眼前端二面天猫一面凉经七猫运营笔试

相关问答

马克斯和敏在熊猫Groupby约会熊猫：获取数组中的所有Groupby值[重复]使用熊猫read_csv压缩熊猫将groupby函数有效地应用于每一列[重复]大熊猫

相关工具

熊猫Flash播放器猫国建设者红猫软路由 TOM猫学说话demo 仿天猫App可打开列表

相关文档

变现猫接入文档 v1.4 TypeScript 使用手册 Sanic 使用教程 FreeBSD 使用手册 Pholcus 使用手册