当前位置: 首页 > 面试题库 >

Python:如何删除特定列为空/ NaN的行?

萧英光
2023-03-14
问题内容

我有一个csv文件。我读了:

import pandas as pd
data = pd.read_csv('my_data.csv', sep=',')
data.head()

它的输出如下:

id    city    department    sms    category
01    khi      revenue      NaN       0
02    lhr      revenue      good      1
03    lhr      revenue      NaN       0

我想删除sms列为空/ NaN的所有行。什么是有效的方法


问题答案:

使用dropna带有参数subset的指定检查列NaNS:

data = data.dropna(subset=['sms'])
print (data)
   id city department   sms  category
1   2  lhr    revenue  good         1

用另一种解决方案boolean indexingnotnull

data = data[data['sms'].notnull()]
print (data)
   id city department   sms  category
1   2  lhr    revenue  good         1

另一种选择query

print (data.query("sms == sms"))
   id city department   sms  category
1   2  lhr    revenue  good         1

时机

#[300000 rows x 5 columns]
data = pd.concat([data]*100000).reset_index(drop=True)

In [123]: %timeit (data.dropna(subset=['sms']))
100 loops, best of 3: 19.5 ms per loop

In [124]: %timeit (data[data['sms'].notnull()])
100 loops, best of 3: 13.8 ms per loop

In [125]: %timeit (data.query("sms == sms"))
10 loops, best of 3: 23.6 ms per loop


 类似资料:
  • 我想删除列为空/nan的所有行。做这件事的有效方法是什么?

  • 问题内容: 我有这个DataFrame,只想要EPS列不是的记录NaN: …例如df.drop(....)要得到这个结果的数据框: 我怎么做? 问题答案: 不要。就拿行,其中是有限的:

  • 本文向大家介绍python如何删除列为空的行,包括了python如何删除列为空的行的使用技巧和注意事项,需要的朋友参考一下 1.摘要 dropna()方法,能够找到DataFrame类型数据的空值(缺失值),将空值所在的行/列删除后,将新的DataFrame作为返回值返回。 2.函数详解 函数形式:dropna(axis=0, how='any', thresh=None, subset=None

  • 问题内容: 这是对该问题的扩展,OP希望知道如何删除单列值为NaN的行。 我想知道如何删除 2 (或更多)列中的值 均为 NaN的行。使用第二个答案的创建的数据框: 如果我使用命令,特别是使用,那么它将完成一个“或”类型的放置并离开: 我想要的是一个“和”类型放置,它将放置行中的列索引为1 和 2的行删除。这将留下: 仅删除第一行的位置。 有任何想法吗? 编辑:更改数据框值以保持一致性 问题答案:

  • 我有这个,并且只需要列不是的记录: ...即。类似于的内容,以获取结果数据规则: 我该怎么做?

  • 问题内容: 我有以下数据框 我尝试了以下 但是,每当我尝试拟合回归模型时 ,我仍然会收到此错误 我们如何同时删除和值? 问题答案: 使用并检查带有的行。最后,使用布尔数组对数据帧进行切片。