当前位置: 首页 > 知识库问答 >
问题:

如何计算熊猫数据帧中某列中的 NaN 值?

井疏珂
2023-03-14

我想在我的数据的每一列中找到< code>NaN的数目。

共有3个答案

姬坚成
2023-03-14

您可以从非 nan 值的计数中减去总长度:

count_nan = len(df) - df.count()

你应该在你的数据上计时。对于小型系列,与<code>isnull</code>解决方案相比,速度提高了3倍。

於彬
2023-03-14

让我们假设df是熊猫数据帧。

然后

df.isnull().sum(axis = 0)

这将给出每列中 NaN 值的数量。

如果需要,每行中的NaN值,

df.isnull().sum(axis = 1)
华化
2023-03-14

使用< code>isna()方法(或者它的别名< code>isnull(),这也与旧的pandas版本兼容

>>> s = pd.Series([1,2,3, np.nan, np.nan])

>>> s.isna().sum()   # or s.isnull().sum() for older pandas versions
2

对于多个列,这也适用于:

>>> df = pd.DataFrame({'a':[1,2,np.nan], 'b':[np.nan,1,np.nan]})

>>> df.isna().sum()
a    1
b    2
dtype: int64
 类似资料:
  • 我想在数据的每一列中找到的数量,这样,如果某一列的少于某个阈值,我就可以删除该列。我看了一下,但没有找到任何功能。对我来说太慢了,因为大多数值都是不同的,而且我只对计数感兴趣。

  • 问题内容: 我想统计数据框中某些单词出现的次数。我知道使用“ str.contains” 目前,我正在使用上面的代码。是否有一种匹配正则表达式并获得出现次数的方法?就我而言,我有一个大的数据框,我想匹配大约100个字符串。 问题答案: 更新:原始答案计算包含子字符串的行。 要计算子字符串的所有出现次数,可以使用: 该方法接受正则表达式: 例如: 要计算出现的次数,您可以对布尔系列求和:

  • 我有一个熊猫数据框,如下所示: 我如何将每分钟的数据分组,并计算每分钟每个状态的数量,以获得此数据帧:

  • 我有两个熊猫数据框 步骤2:对于flag=1的行,AA_new将计算为var1(来自df2)*组“A”和val“AA”的df1的'cal1'值*组“A”和val“AA”的df1的'cal2'值,类似地,AB_new将计算为var1(来自df2)*组“A”和val“AB”的df1的'cal1'值*组“A”和val“AB”的df1的'cal2'值 我的预期输出如下所示: 以下基于其他stackflow

  • 我有一个熊猫数据框,看起来像这样。 我想确定猫和蝙蝠是重复的相同值,因此想删除一条记录,只保留第一条记录。所得到的数据帧应该只具有。

  • 假设熊猫数据帧如下所示: 如何将第三行(如row3)提取为pd数据帧?换句话说,row3.shape应该是(1,5),row3.head()应该是: