当前位置: 首页 > 面试题库 >

获取在pandas的各列中具有相同值的行

爱唯
2023-03-14
问题内容

在pandas中,给定一个DataFrame D:

+-----+--------+--------+--------+   
|     |    1   |    2   |    3   |
+-----+--------+--------+--------+
|  0  | apple  | banana | banana |
|  1  | orange | orange | orange |
|  2  | banana | apple  | orange |
|  3  | NaN    | NaN    | NaN    |
|  4  | apple  | apple  | apple  |
+-----+--------+--------+--------+

当三列或更多列返回以下内容时,如何返回其所有列具有相同内容的行:

+-----+--------+--------+--------+   
|     |    1   |    2   |    3   |
+-----+--------+--------+--------+
|  1  | orange | orange | orange |
|  4  | apple  | apple  | apple  |
+-----+--------+--------+--------+

请注意,当所有值均为NaN时,它将跳过行。

如果这仅仅是两列,我通常会这样做,D[D[1]==D[2]]但是我不知道如何针对两列以上的DataFrames进行概括。


问题答案:

与Andy Hayden的答案类似,检查min是否等于max(然后所有行元素都是重复的):

df[df.apply(lambda x: min(x) == max(x), 1)]


 类似资料:
  • 问题内容: 我有一个包含人姓,名,部门的SQLite数据库,我需要进行查询以向我显示具有相同名字和姓氏的任何人。我发现以下语句应该可以满足单个字段的要求,但是当我尝试使用它来提取所有具有相同姓氏的记录时,它似乎对我不起作用。我怎样才能做到这一点? 问题答案: 尝试: GROUP BY合并名称值相同的行。 HAVING删除不符合条件的组。 上面的查询将列出名字和姓氏,以及实际上有重复的所有名字/姓氏

  • DB有一个表,即。这些字段包括,,。 我需要得到属于某个且具有相同值的行的数量总和。 例如,表中有值:(2,3,4),(2,1,5),( 1 2,2,4),然后我需要获得以及第一行和第三行中其他列的总和。第二行也将出现在结果中。 让我们假设控制器名称为,模型名称为。 我应该如何编写查询? 编辑:表格有以下值:(2,3,4),(2,1,5),( 1 2,2,4)

  • 问题内容: 我试图找到具有重复值,但仅基于选定的列数,而不是单个列或整个行的行。例如,如果我的表如下所示: 我的问题是: 查找行的“地址和状态”字段与另一行的“地址和状态”字段匹配的行的所有ID。 该查询的答案将是: 有任何想法吗? 意见建议: 如何从单个表中选择同一行中的多列值 问题答案: 请尝试以下方法:

  • 我有一张像这样的桌子: 我试图设置一个sql查询语句,如果每一行的room值相同,则该语句将提取名称。 这是到目前为止我的代码,但它返回一个空列表: 尝试: 会有一个空名单? 我想得到一份清单 非常感谢。 更新E::: 我已经尝试将执行的查询替换为: 现在我得到一个错误: sqlite3。操作错误:靠近“选择”:语法错误

  • 我讨论这个问题已经有一段时间了,但没有结果。这几乎是一个重复的问题,至少有一个其他的问题在这里,但我不能完全弄清楚如何做,确切地说,我正在寻找从网上相关的答案。 我有一个熊猫数据帧(我们称之为),看起来像: 其中是索引。我想将其转换为类似以下内容: 因此,基本上,每个对应于相同索引的都应该组合到一个列表(或一个集合,或一个元组)中,该列表成为对应索引的。并且,如图所示,在相似的索引行之间是相同的,