我有一个csv文件。我读了:
import pandas as pd
data = pd.read_csv('my_data.csv', sep=',')
data.head()
它的输出如下:
id city department sms category
01 khi revenue NaN 0
02 lhr revenue good 1
03 lhr revenue NaN 0
我想删除sms
列为空/ NaN的所有行。什么是有效的方法?
使用dropna
带有参数subset
的指定检查列NaN
S:
data = data.dropna(subset=['sms'])
print (data)
id city department sms category
1 2 lhr revenue good 1
用另一种解决方案boolean indexing
和notnull
:
data = data[data['sms'].notnull()]
print (data)
id city department sms category
1 2 lhr revenue good 1
另一种选择query
:
print (data.query("sms == sms"))
id city department sms category
1 2 lhr revenue good 1
时机
#[300000 rows x 5 columns]
data = pd.concat([data]*100000).reset_index(drop=True)
In [123]: %timeit (data.dropna(subset=['sms']))
100 loops, best of 3: 19.5 ms per loop
In [124]: %timeit (data[data['sms'].notnull()])
100 loops, best of 3: 13.8 ms per loop
In [125]: %timeit (data.query("sms == sms"))
10 loops, best of 3: 23.6 ms per loop
我想删除列为空/nan的所有行。做这件事的有效方法是什么?
问题内容: 我有这个DataFrame,只想要EPS列不是的记录NaN: …例如df.drop(....)要得到这个结果的数据框: 我怎么做? 问题答案: 不要。就拿行,其中是有限的:
本文向大家介绍python如何删除列为空的行,包括了python如何删除列为空的行的使用技巧和注意事项,需要的朋友参考一下 1.摘要 dropna()方法,能够找到DataFrame类型数据的空值(缺失值),将空值所在的行/列删除后,将新的DataFrame作为返回值返回。 2.函数详解 函数形式:dropna(axis=0, how='any', thresh=None, subset=None
问题内容: 这是对该问题的扩展,OP希望知道如何删除单列值为NaN的行。 我想知道如何删除 2 (或更多)列中的值 均为 NaN的行。使用第二个答案的创建的数据框: 如果我使用命令,特别是使用,那么它将完成一个“或”类型的放置并离开: 我想要的是一个“和”类型放置,它将放置行中的列索引为1 和 2的行删除。这将留下: 仅删除第一行的位置。 有任何想法吗? 编辑:更改数据框值以保持一致性 问题答案:
我有这个,并且只需要列不是的记录: ...即。类似于的内容,以获取结果数据规则: 我该怎么做?
问题内容: 我有以下数据框 我尝试了以下 但是,每当我尝试拟合回归模型时 ,我仍然会收到此错误 我们如何同时删除和值? 问题答案: 使用并检查带有的行。最后,使用布尔数组对数据帧进行切片。