当前位置：首页 > 面试题库 >

使用熊猫删除一列中的非数字行

农飞星

2023-03-14

问题内容：

有一个像下面这样的数据框，它有一个不干净的列“ id”，它应该是数字列

id, name
1,  A
2,  B
3,  C
tt, D
4,  E
5,  F
de, G

是否有一种简洁的方法删除行，因为tt和de不是数值

tt,D
de,G

使数据框干净？

id, name
1,  A
2,  B
3,  C
4,  E
5,  F

问题答案：

您可以使用标准的字符串方法，isnumeric并将其应用于id列中的每个值：

import pandas as pd
from io import StringIO

data = """
id,name
1,A
2,B
3,C
tt,D
4,E
5,F
de,G
"""

df = pd.read_csv(StringIO(data))

In [55]: df
Out[55]: 
   id name
0   1    A
1   2    B
2   3    C
3  tt    D
4   4    E
5   5    F
6  de    G

In [56]: df[df.id.apply(lambda x: x.isnumeric())]
Out[56]: 
  id name
0  1    A
1  2    B
2  3    C
4  4    E
5  5    F

或者，如果您想id用作索引，则可以执行以下操作：

In [61]: df[df.id.apply(lambda x: x.isnumeric())].set_index('id')
Out[61]: 
   name
id     
1     A
2     B
3     C
4     E
5     F

编辑。添加时间

虽然情况下与pd.to_numeric未使用apply的方法，它比与施加慢几乎两倍np.isnumeric于str列。另外，我使用pandas添加了选项，str.isnumeric它键入的次数更少，但使用起来还是更快pd.to_numeric。但是pd.to_numeric更笼统，因为它可以与任何数据类型一起使用（不仅限于字符串）。

df_big = pd.concat([df]*10000)

In [3]: df_big = pd.concat([df]*10000)

In [4]: df_big.shape
Out[4]: (70000, 2)

In [5]: %timeit df_big[df_big.id.apply(lambda x: x.isnumeric())]
15.3 ms ± 2.02 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

In [6]: %timeit df_big[df_big.id.str.isnumeric()]
20.3 ms ± 171 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)

In [7]: %timeit df_big[pd.to_numeric(df_big['id'], errors='coerce').notnull()]
29.9 ms ± 682 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)

类似资料：

从熊猫列中删除非ASCII字符

问题内容：我已经尝试解决这个问题一段时间了，我试图从DB_user列中删除非ASCII字符并尝试将它们替换为空格。但是我不断出错。这是我的数据框的外观：我正在使用此功能，这是我在研究SO问题时遇到的。我不断收到错误：但是，我认为通过使用filter_func函数中的循环，可以通过在’ord’中输入一个char来解决这个问题。因此，当它遇到非ASCII字符时，应将其替换为空格。有人可以帮我
删除非英语行熊猫[复制]

df.审查：目的是删除非英文行。我试过这个和这个，但都没用。下面的代码错误地将所有行标记为英语。
基于列值删除熊猫中的数据帧行

我有以下数据帧：我需要删除等于的行。最有效的方法是什么？
如何用熊猫删除数据集中的列？[副本]

现在我正在上一门机器学习课程。现在我应该导入我的数据集之后，我读了一个“CSV”文件导入我的数据集，我想删除一个列，但我不知道如何做。
从熊猫中的字符串中删除字符

问题内容：我对此有一个类似的问题：Pandas DataFrame：从一列中的字符串中删除不需要的部分。所以我用了：大多数项目以“ PPI /”开头，但并非全部。似乎当没有’PPI /’后缀的项目遇到此错误时： AttributeError：“ float”对象没有属性“ lstrip” 我在这里想念什么吗？问题答案：使用replace：或string.replace：
删除小数点子熊猫列（字符串类型）

我想从字符串类型的熊猫列中删除小数点 Df 我正试着去掉那一栏的小数 df['Net Sales']已经是字符串类型。我尝试如下： < code>df['净销售额'] = df['净销售额']。astype(str)。替换(' \.0 '，''，regex=True) 但我得到的错误如下： < code>ValueError:基数为10的int()的文本无效:“1567.55” 谢谢。

相关阅读

在熊猫数据框中删除全零的行熊猫列列表中每行的第一个非空值如何从熊猫数据框中的字符串项中删除数字根据熊猫中的条件删除行如何根据条件删除熊猫数据框中的列？

相关文章

Python list列表删除元素 Java11 删除/弃用的 API DB2删除数据库 CouchDB删除数据库 MariaDB删除数据库

相关问答

删除熊猫DataFrame列中字符串条目的末尾如何删除熊猫数据帧中列的重复值的行？基于列的最大值删除熊猫数据帧行 Python熊猫-基于2个数据帧的列删除行删除给定字符串条件的熊猫中的数据

相关工具

熊猫Flash播放器仿天猫App可打开列表猫国建设者红猫软路由数字绘

相关文档

Krpano 非官方中文文档 Linux C 函数使用手册 KDB+ 高性能列式数据库中文教程变现猫接入文档 v1.4 Sphinx 中文使用手册