当前位置：首页 > 面试题库 >

在大熊猫数据框中提取具有最大值的行

沈永贞

2023-03-14

问题内容：

但是，即使该组中有多个具有最大值的记录，我也只需要每组一个记录。

在下面的示例中，我需要一条记录用于“ s2”。对我来说，哪一个都没关系。

>>> df = DataFrame({'Sp':['a','b','c','d','e','f'], 'Mt':['s1', 's1', 's2','s2','s2','s3'], 'Value':[1,2,3,4,5,6], 'count':[3,2,5,10,10,6]})
>>> df
   Mt Sp  Value  count
0  s1  a      1      3
1  s1  b      2      2
2  s2  c      3      5
3  s2  d      4     10
4  s2  e      5     10
5  s3  f      6      6
>>> idx = df.groupby(['Mt'])['count'].transform(max) == df['count']
>>> df[idx]
   Mt Sp  Value  count
0  s1  a      1      3
3  s2  d      4     10
4  s2  e      5     10
5  s3  f      6      6
>>>

问题答案：

您可以使用 first

In [14]: df.groupby('Mt').first()
Out[14]: 
   Sp  Value  count
Mt                 
s1  a      1      3
s2  c      3      5
s3  f      6      6

设置as_index=False来实现你的目标

In [28]: df.groupby('Mt', as_index=False).first()
Out[28]: 
   Mt Sp  Value  count
0  s1  a      1      3
1  s2  c      3      5
2  s3  f      6      6

再次更新

很抱歉误解您的意思。如果您要一个组中最大数量的组，可以先对其进行排序

In [196]: df.sort('count', ascending=False).groupby('Mt', as_index=False).first()
Out[196]: 
   Mt Sp  Value  count
0  s1  a      1      3
1  s2  e      5     10
2  s3  f      6      6

类似资料：

熊猫最大值指数

问题内容：我有一个包含屏幕名称，tweet，收藏夹等的Pandas DataFrame。我想找到“ favcount”（我已经做过）的最大值，并返回该“ tweet”的屏幕名称我似乎找不到任何东西，任何人都可以帮助我朝正确的方向发展吗？问题答案：使用来获取最大价值的指标。那你可以用编辑：现已弃用，切换为
PySpark获取具有最大日期的数据框列的值

我需要在pyspark数据框中使用窗口上的max date行中的列值创建一个新列。鉴于下面的数据框架，我需要根据最近日期的调整系数为每个资产的每个记录设置一个名为max_adj_factor的新列。
熊猫：设置最大行数

查看以下：问题是它不会在ipython笔记本中按默认值打印所有行，但我必须切片才能查看结果行。即使以下选项也不会更改输出：有人知道如何显示整个阵列吗？
基于列的最大值删除熊猫数据帧行

我有这样一个数据帧：我如何摆脱第四行，因为它有sq_resid的最大值？注意：最大值将从一个数据集更改到另一个数据集，所以仅仅删除第4行是不够的。我已经尝试了一些方法，比如我可以删除像下面这样留下数据帧的最大值，但是无法删除整行。
如何在没有索引的大熊猫中转置数据框？

问题内容：可以肯定，这非常简单。我正在读取一个csv文件并具有数据框：我想换位得到但是，当我执行df.T时，如何摆脱最上面的索引？问题答案：您可以先将索引设置为数据框中的第一列（或通常要用作索引的列），然后再转置该数据框。例如，如果要用作索引的列是，则可以执行以下操作：要么
根据另一个列熊猫数据框提取列值

问题内容：我有点被困在提取另一个变量的条件变量的值上。例如，以下数据框：如何获得when的价值？每当我提取的值时，我都会得到一个对象，而不是字符串。问题答案：您可以用来获取满足条件的序列，然后获取第一个元素：

相关阅读

获取具有列最大值的行如何删除熊猫数据框中具有重复列值的行？在Spark数据框列中获取最大值的最佳方法从整个熊猫数据框中返回最大值，而不是基于列或行更新大熊猫的价值

相关文章

多益大数据开发提前批科大讯飞大数据一面杭州大华提前批大数据开发Java方向hr面歌尔大数据博世大数据

相关问答

大熊猫read_csv 熊猫 - 从另一列中删除重复的行，但具有最大值的行除外如何将熊猫数据帧的第n行提取为熊猫数据帧？熊猫数据框中的列到行查找熊猫中每个标签的每列的最小值和最大值。数据帧[重复]

相关工具

熊猫Flash播放器数据库自动更新及自动赋值工具数据库处理框架大众ERP Redis数据查看工具

相关文档

大数据实验手册大数据入门指南大数据学习指南数据挖掘十大算法 Excel 数据透视表应用大全