当前位置：首页 > 面试题库 >

在每个熊猫数据框行中查找前n个最高价值列的名称

颜阳炎

2023-03-14

问题内容：

我有以下数据框：

  id     p1 p2 p3 p4
  1      0  9  1  4
  2      0  2  3  4
  3      1  3 10  7
  4      1  5  3  1
  5      2  3  7 10

我需要以某种方式重塑数据框，以使每个id的前3列具有最高的值。结果将是这样的：

 id top1 top2 top3
  1  p2   p4   p3
  2  p4   p3   p2
  3  p3   p4   p2
  4  p2   p3   p4/p1
  5  p4   p3   p2

它显示了每本广告的前三名最畅销书user_id。我已经使用dplyrR中的包完成了此操作，但是我正在寻找等效的pandas。

问题答案：

您可以np.argsort用来查找每一行的
n个最大项的索引：

import numpy as np
import pandas as pd

df = pd.DataFrame({'id': [1, 2, 3, 4, 5],
 'p1': [0, 0, 1, 1, 2],
 'p2': [9, 2, 3, 5, 3],
 'p3': [1, 3, 10, 3, 7],
 'p4': [4, 4, 7, 1, 10]})
df = df.set_index('id')

nlargest = 3
order = np.argsort(-df.values, axis=1)[:, :nlargest]
result = pd.DataFrame(df.columns[order], 
                      columns=['top{}'.format(i) for i in range(1, nlargest+1)],
                      index=df.index)

print(result)

产量

   top1 top2 top3
id               
1    p2   p4   p3
2    p4   p3   p2
3    p3   p4   p2
4    p2   p3   p1
5    p4   p3   p2

类似资料：

熊猫组：如何在每组的多个列中找到N个最大值？

我记录一个设备，每15分钟读取3个值（，，）。它们可以重复。我需要找出每小时在该间隔内读取的12个值中最大的3个值是什么。我对它们何时发生不感兴趣，只对它们的值感兴趣。目前，我的算法还远远不够高效和快速：在每组中循环：我想去掉这个循环，使用原生的pandas/numpy方法。可能吗？编辑：在这篇文章的末尾提出了一个可行的解决方案以下是代码：回报：解决方案我在代码中实现这个解决方案
在每个组熊猫数据框中对列进行排序并选择前n行

问题内容：我有一个这样的数据框：我要然后然后为每个pidx 然后是每个组的前2名。我正在寻找的结果是这样的：我试过的是：这似乎可行，但我不知道如果处理庞大的数据集，这是否是正确的方法。我还能使用什么其他最佳方法来获得这种结果？问题答案：有两种解决方案： 1.和合计： 2.和合计：时间：
查找熊猫中每个标签的每列的最小值和最大值。数据帧[重复]

我有一个名为的，它有4列，如下所示：我想要的是找到关于类的每一列的最小值和最大值。换句话说，我希望得到一个类似于下面的结果：
查找每行最大值的列名
根据另一个列熊猫数据框提取列值

问题内容：我有点被困在提取另一个变量的条件变量的值上。例如，以下数据框：如何获得when的价值？每当我提取的值时，我都会得到一个对象，而不是字符串。问题答案：您可以用来获取满足条件的序列，然后获取第一个元素：
熊猫groupby：每组前3个值

问题内容：在 pandas groupby上发布了一个新的更通用的问题：每个组中的前3个值并存储在DataFrame中，并且在那里已经找到了可行的解决方案。在此示例中，我创建了一个数据帧，其中的一些随机数据间隔为5分钟。我想创建一个数据框（ df分组），其中列出了每小时的 3个最高值。即：从这一系列价值我非常接近解决方案，但我找不到最后一步的正确语法。我到现在为止（）的结果是：我想从

相关阅读

抓住每个组中具有最高价值的行？通过列值复制熊猫数据框中的行排序熊猫数据框中每一行的最快方法在熊猫数据框中查找连续的片段从整个熊猫数据框中返回最大值，而不是基于列或行

相关文章

插值查找算法 Struts2设置多个复选框缺省值数据分析校招面试最常考察的四个点 n个结点的二叉树种类查找最佳页面大小

相关问答

我的查询在每个名称的“n”行上方的一列中显示“n”个最近日期。我想要每个名字的“n”最近日期栏查找一个值是否退出熊猫数据框列使用'in'不工作？熊猫：查找不在另一个数据帧中的数据帧行[重复]numpython：为另一列中的每个唯一值从一列中查找最高值熊猫-用另一个数据帧的值填充一个数据帧的每一行

相关工具

熊猫Flash播放器数据库处理框架 Redis数据查看工具仿天猫App可打开列表丁丁主数据查重工具

相关文档

KDB+ 高性能列式数据库中文教程每周一个 Python 3 模块中文版 Uragano 高性能 RPC 框架中文文档每个程序员都应该了解的内存知识每个程序员上辈纸都是法力无边的巫师