当前位置：首页 > 面试题库 >

如何在Pandas数据框中查找哪些列包含任何NaN值

郭麒

2023-03-14

问题内容：

给定一个熊猫数据框，其中包含可能在此处和附近散布的NaN值：

问题： 如何确定哪些列包含NaN值？特别是，我可以获取包含NaN的列名称的列表吗？

问题答案：

更新： 使用熊猫0.22.0

较新的Pandas版本具有新的方法‘DataFrame.isna（）’和‘DataFrame.notna（）’

In [71]: df
Out[71]:
     a    b  c
0  NaN  7.0  0
1  0.0  NaN  4
2  2.0  NaN  4
3  1.0  7.0  0
4  1.0  3.0  9
5  7.0  4.0  9
6  2.0  6.0  9
7  9.0  6.0  4
8  3.0  0.0  9
9  9.0  0.0  1

In [72]: df.isna().any()
Out[72]:
a     True
b     True
c    False
dtype: bool

作为列列表：

In [74]: df.columns[df.isna().any()].tolist()
Out[74]: ['a', 'b']

选择这些列（至少包含一个NaN值）：

In [73]: df.loc[:, df.isna().any()]
Out[73]:
     a    b
0  NaN  7.0
1  0.0  NaN
2  2.0  NaN
3  1.0  7.0
4  1.0  3.0
5  7.0  4.0
6  2.0  6.0
7  9.0  6.0
8  3.0  0.0
9  9.0  0.0

旧答案：

尝试使用isnull（）：

In [97]: df
Out[97]:
     a    b  c
0  NaN  7.0  0
1  0.0  NaN  4
2  2.0  NaN  4
3  1.0  7.0  0
4  1.0  3.0  9
5  7.0  4.0  9
6  2.0  6.0  9
7  9.0  6.0  4
8  3.0  0.0  9
9  9.0  0.0  1

In [98]: pd.isnull(df).sum() > 0
Out[98]:
a     True
b     True
c    False
dtype: bool

或作为@root建议的更清晰的版本：

In [5]: df.isnull().any()
Out[5]:
a     True
b     True
c    False
dtype: bool

In [7]: df.columns[df.isnull().any()].tolist()
Out[7]: ['a', 'b']

选择一个子集-所有列至少包含一个NaN值：

In [31]: df.loc[:, df.isnull().any()]
Out[31]:
     a    b
0  NaN  7.0
1  0.0  NaN
2  2.0  NaN
3  1.0  7.0
4  1.0  3.0
5  7.0  4.0
6  2.0  6.0
7  9.0  6.0
8  3.0  0.0
9  9.0  0.0

类似资料：

如何在Pandas dataframe中查找哪些列包含任何NaN值

给定一个包含可能分散在各处的NaN值的pandas数据frame：问题：如何确定哪些列包含NaN值？特别是，我可以获得包含NANS的列名列表吗？
Pandas：如何在数据框列中查找特定模式？

问题内容：我想在pandas数据框列中找到一个特定的模式，并返回相应的索引值以对数据框进行子集化。这是带有可能模式的示例数据框：生成数据框的代码段：数据框：下面，感兴趣的格局发生的日期来，这就是我想要结束了一下：所需的输出：如果同一模式多次出现，我希望以相同的方式对数据帧进行子集化，并计算该模式出现的次数，但是只要我将第一步弄清楚，我希望这会更直接。感谢您的任何建议！问题答案：
如何查找哪些列没有任何数据（所有值均为NULL）？

问题内容：我在数据库中有几个表。我想查找哪些列（在哪些表中）没有任何值（列中都为NULL）。在下面的示例中，结果应该是我不知道如何创建这种查询。非常感谢您的帮助！问题答案：对于单列，返回不为null的行数：您可以为所有列生成查询。根据Martin的建议，您可以使用排除不能为空的列。例如：如果表的数量很大，则可以类似的方式为所有表生成查询。所有表的列表在中。
pandas数据框选择行，其中列表列包含任何字符串列表

问题内容：我有一个看起来像这样的Pandas DataFrame：而且我想提取仅包含那些行的DataFrame，其中包含的任何行。因此结果应如下所示：最简单的方法是什么？供测试用：问题答案： IIUC重新创建您的df，然后使用with应该比
如何计算pandas数据帧中列中的NaN值

我想在数据的每一列中找到的数量，这样，如果某一列的少于某个阈值，我就可以删除该列。我看了一下，但没有找到任何功能。对我来说太慢了，因为大多数值都是不同的，而且我只对计数感兴趣。
如何在Pandas数据框中传播列

问题内容：我有以下熊猫数据框：产生此结果：我如何传播，以便最终得到这个：问题答案：使用或：但是，如果重复，需要或集合体，或可以改变，…： ValueError：索引包含重复的条目，无法重塑编辑：对于设置为和的清洁：

相关阅读

Python-如何在pandas数据框的列中将所有NaN值替换为零如何查找String是否包含html数据？如何检查stdin是否包含一些数据？检查pandas的dataframe列中是否包含某些值 Python和Pandas：如何查询列表类型列是否包含某些内容？

相关文章

innodb是如何存数据的大数据的真正价值在哪里呢 Python list列表查找元素 Pandas设置数据显示格式判断数组中是否包含某个元素

相关问答

如何在Panda中查找哪些行的值超过某些列（例如20列）？如何从包含特定列中任何字符串的数据框中删除行将包含NaN的Pandas列转换为dtype'int'ICMP（ping）请求中包含哪些数据？如果数据框中的行包含列表中的值，如何删除这些行？[副本]

相关工具

数据库处理框架 Redis数据查看工具公共集合框架包 Pandas 丁丁主数据查重工具

相关文档

Python 和 Pandas 数据分析教程 Pandas 函数手册 KDB+ 高性能列式数据库中文教程 Python Pandas 中文教程 Pandas Cookbook 秘籍