当前位置: 首页 > 面试题库 >

使用pandas查找最多两列或更多列

宓茂才
2023-03-14
问题内容

我有一个列的数据帧AB。我需要创建一个列C,以便为每个记录/行:

C = max(A, B)

我应该怎么做呢?


问题答案:

您可以这样获得最大值:

>>> import pandas as pd
>>> df = pd.DataFrame({"A": [1,2,3], "B": [-2, 8, 1]})
>>> df
   A  B
0  1 -2
1  2  8
2  3  1
>>> df[["A", "B"]]
   A  B
0  1 -2
1  2  8
2  3  1
>>> df[["A", "B"]].max(axis=1)
0    1
1    8
2    3

所以:

>>> df["C"] = df[["A", "B"]].max(axis=1)
>>> df
   A  B  C
0  1 -2  1
1  2  8  8
2  3  1  3

如果您知道“ A”和“ B”是唯一的列,那么您甚至可以逃脱

>>> df["C"] = df.max(axis=1)

.apply(max, axis=1)我猜你也可以使用。



 类似资料:
  • 问题内容: 如何作为熊猫数据框方程的一部分引用两个数据框的最小值?我尝试使用无法正常工作的python函数。很抱歉,如果在某处有充分的文档证明,但无法找到有效的解决方案来解决此问题。我正在寻找与此类似的东西: 我也尝试使用pandas函数,该函数也不起作用。 这个错误让我感到困惑。数据列只是数字和名称,我不确定索引在哪里起作用。 问题答案: 如果要获取两列或更多列的行,请使用并指定。

  • 问题内容: 假设我有一个数据列,其中包含,和,我想按升序按列对数据帧进行排序,然后按降序按列对数据帧进行排序,我该怎么做? 问题答案: 从0.17.0版开始,不推荐使用该方法,而推荐使用。 sort在0.20.0版本中被完全删除。参数(和结果)保持不变: 你可以使用的升序参数sort: 例如: 如@renadeen所评论 默认情况下,排序不正确!因此,你应该将方法的结果分配给变量,或者将添加到方法

  • 我想执行如下查询: 使用Spring的我应该使用这样的东西: 现在想象一下,我不想检查4列,而是检查10或20列,方法名会很长! 我在这个答案中看到,我可以使用在许多列中搜索相同的文本,但我希望每个列都有不同的文本值。 有什么方法可以缩短find方法并动态添加列(以及相应的值)吗? 谢谢

  • 本文向大家介绍更改Pandas Dataframe中一列或多列的数据类型,包括了更改Pandas Dataframe中一列或多列的数据类型的使用技巧和注意事项,需要的朋友参考一下 在本教程中,我们将学习一种或多种列数据类型到另一种数据类型的转换。我们将使用DataFrame.astype()方法。 我们必须传递来自Python,Pandas或Numpy的任何数据类型以更改列元素的数据类型。我们还可

  • 我试图找出一个字符串是否跨多个列存在。如果字符串存在,则返回1;如果不存在,则返回0,作为dataframe中的新系列。 搜索论坛后,我明白str.contains可以使用,但我正在搜索100多个列,因此一次使用单个系列对我来说是没有效率的。 如果相关,列中有一些NAs。 简化数据帧示例: 例如,如果我对查找“AA”感兴趣,我想返回以下数据帧。 目标数据帧示例: 非常感谢你的帮助。

  • 我一直在想方设法找出解决这个问题的最好办法。 我有一个包含3列的电子表格。 列是日期(每月明细) 列包括时间(每小时细分) 列包含特定日期该小时内发生的事件计数 我想做的是找出事件发生的最常见时间。所以我并不需要日期,我只是想知道一天中最有可能发生事件的时间,这样我就可以从最好的时间到最坏的时间排序。 因此,我知道我需要以某种方式将与不同日期相匹配的小时数,以及它们的事件总数结合起来,但我不知道如