我想查看数据框内特定列中是否存在特定字符串。
我遇到了错误
ValueError:系列的真值不明确。使用a.empty,a.bool(),a.item(),a.any()或a.all()。
import pandas as pd
BabyDataSet = [('Bob', 968), ('Jessica', 155), ('Mary', 77), ('John', 578), ('Mel', 973)]
a = pd.DataFrame(data=BabyDataSet, columns=['Names', 'Births'])
if a['Names'].str.contains('Mel'):
print "Mel is there"
a['Names'].str.contains('Mel')
将返回大小为布尔值的指标向量 len(BabyDataSet)
因此,您可以使用
mel_count=a['Names'].str.contains('Mel').sum()
if mel_count>0:
print ("There are {m} Mels".format(m=mel_count))
或者any()
,如果您不在乎有多少条记录与您的查询匹配
if a['Names'].str.contains('Mel').any():
print ("Mel is there")
即使数据类型是object,如何检查列是字符串还是其他类型(例如int或float)? (理想情况下,我希望此操作矢量化,而不是检查每一行…) 和在执行 但是,有方法,例如,但没有。 类似地,可以对其进行数学运算,例如 这与其他SO问题不同。他们问列内是否有字符串(而不是整列)。例如: Python:检查dataframe列是否包含字符串类型 检查字符串是否在数据帧中 检查dataframe列中的
我有一个相当大的数据帧(11k行和20列)。其中一列的数据类型是混合的,主要是数字(float),其中有少量字符串分散在各处。 在使用混合列中的数据执行一些统计分析之前,我通过查询其他列来对该数据帧进行子集划分(但如果存在字符串,则无法执行此操作)。99%的时间,一旦子集这个列是纯数字的,但很少字符串值会在子集中结束,我需要捕获它。 通过Pandas混合类型列循环检查字符串(或者反过来检查整个列是
如果列表中的值存在于其中一个dataframe列中,我需要迭代列表并执行特定操作。我试着按照下面的方法做,但发现了下面的错误 '错误:#序列的真值不明确。使用a.empty、a.bool()、a.item()、a.any()或a.all() 所需输出:
我试图检查python列中是否包含某个值。我正在使用,这无疑是一个很好的工具。问题是我有超过350K行,输出不会显示所有行,这样我就可以看到值是否实际包含。简单地说,我只想知道(Y/N)列中是否包含特定的值。我的代码如下:
我想检查数据帧中的列是否由字符串组成,以便为机器学习目的用数字标记它们。有些列由数字组成,我不想更改它们。列示例如下所示: 谢谢=)
问题内容: 我想检查数据框中的一列是否包含字符串。我本以为可以仅通过检查dtype来完成此操作,但事实并非如此。包含字符串的pandas系列仅具有dtype’object’,它也用于其他数据结构(如列表): 产生: 有什么方法可以检查一列是否仅包含字符串? 问题答案: 您可以使用它来查看列中的所有元素是否都是字符串 只检查是否有字符串