当前位置：首页 > 面试题库 >

Python：Pandas根据字符串长度过滤字符串数据

夏晋

2023-03-14

问题内容：

我喜欢过滤掉字符串长度不等于10的数据。

如果我尝试过滤掉列A或B的字符串长度不等于10的任何行，则尝试这样做。

df=pd.read_csv('filex.csv')
df.A=df.A.apply(lambda x: x if len(x)== 10 else np.nan)
df.B=df.B.apply(lambda x: x if len(x)== 10 else np.nan)
df=df.dropna(subset=['A','B'], how='any')

这工作缓慢，但正在工作。

但是，当A中的数据不是字符串而是数字（有时在read_csv读取输入文件时解释为数字）时，有时会产生错误。

  File "<stdin>", line 1, in <lambda>
TypeError: object of type 'float' has no len()

我相信应该有更高效，更优雅的代码来代替。

根据下面的答案和评论，我找到的最简单的解决方案是：

df=df[df.A.apply(lambda x: len(str(x))==10]
df=df[df.B.apply(lambda x: len(str(x))==10]

要么

df=df[(df.A.apply(lambda x: len(str(x))==10) & (df.B.apply(lambda x: len(str(x))==10)]

要么

df=df[(df.A.astype(str).str.len()==10) & (df.B.astype(str).str.len()==10)]

问题答案：

import pandas as pd

df = pd.read_csv('filex.csv')
df['A'] = df['A'].astype('str')
df['B'] = df['B'].astype('str')
mask = (df['A'].str.len() == 10) & (df['B'].str.len() == 10)
df = df.loc[mask]
print(df)

应用于filex.csv：

A,B
123,abc
1234,abcd
1234567890,abcdefghij

上面的代码打印

            A           B
2  1234567890  abcdefghij

类似资料：

根据字符串长度修剪字符串

问题内容：如果长度超过10个字符，我想修剪字符串。假设字符串长度为12（），则新的修剪后的字符串将包含。我该如何实现？问题答案： s = s.substring(0, Math.min(s.length(), 10)); 这样使用字符串可以避免在字符串已经短于的情况下出现异常。笔记：上面做了真正的修剪。如果您实际上想将截断的最后三个（！）字符替换为点，请使用Apache Commons
elasticsearch按字符串字段的长度过滤

问题内容：我试图获取记录在“标题”中，然后是X个字符。注意：并非所有记录都包含标题字段。我努力了：结果，我得到这个错误：我该如何解决？问题答案：您需要考虑到某些文档可能具有空字段。因此，您可以使用常规的空安全运算符。另外，请确保改用POST方法：
7.4 字符串长度

要求出字符串的长度（字符的个数），我们可以使用length函数。调用这个函数的语法和我们前面看到的有点不同： int length; length = fruit.length(); 对于这种函数调用，我们称之为在字符串变量fruit上**调用（invoke）**length函数。“调用（invoke）”这个词可能看起来有点奇怪，但是后面我们还会遇到很多在对象上调用函数的例子。函数调用的语法称
如何通过字符串长度在`sqlalchemy`中过滤？

问题内容：如何按字符串长度过滤？此代码段：给了我以下错误：在哪里：问题答案：您需要使用SQL函数生成器来创建函数：
MySQL-如何通过字符串长度选择数据

问题内容：有MySQL函数可以执行此操作（当然不是）吗？问题答案：您正在寻找获取字符串中的字符数。对于多字节字符集，将为您提供字符串占用的字节数，同时将返回字符数。
按长度将字符串拆分为字符串？

问题内容：有没有办法在不知道字符串长度的情况下，将一个字符长的字符串切成4个字符串，每个字符长？例如：问题答案：

相关阅读

按长度将字符串拆分为字符串？限制字符串长度 Java Unicode字符串长度根据Pandas中的字符串列表过滤出行根据定界符将字符串分成2个字符串

相关文章

XQuery字符串函数 VB.Net字符串 Dart字符串 Swift字符串 Matlab字符串

相关问答

Base-64字符数组或字符串的长度无效字符串文本字长字符串长度有限的strod 在字符串数组中查找最长的字符串字符串数组的长度之和[duplicate]

相关工具

字符云监控系统数字绘乱码过滤器活字格 - 百度地图插件滚动数字Label

相关文档

格式化字符串漏洞利用百度站长平台工具使用手册学习 RxJS 操作符数据科学鲜活的数据数据可视化指南