当前位置：首页 > 面试题库 >

如何在熊猫数据框中使用带有多个表达式的str.contains（）？

姜弘化

2023-03-14

问题内容：

我想知道是否有一种更有效的方法来使用Pandas中的str.contains（）函数来一次搜索两个部分字符串。我想在数据框中的给定列中搜索包含“ nt”或“
nv”的数据。现在，我的代码如下所示：

    df[df['Behavior'].str.contains("nt", na=False)]
    df[df['Behavior'].str.contains("nv", na=False)]

然后我将一个结果附加到另一个。我想做的是使用一行代码来搜索包含“ nt”或“ nv”或“
nf”的任何数据。我已经尝试了一些我认为应该可行的方法，包括仅在术语之间插入一条管道，但是所有这些都会导致错误。我已经检查了文档，但是我不认为这是一个选择。我收到这样的错误：

    ---------------------------------------------------------------------------
    TypeError                                 Traceback (most recent call last)
    <ipython-input-113-1d11e906812c> in <module>()
    3 
    4 
    ----> 5 soctol = f_recs[f_recs['Behavhtml" target="_blank">ior'].str.contains("nt"|"nv", na=False)]
    6 soctol

    TypeError: unsupported operand type(s) for |: 'str' and 'str'

有快速的方法吗？感谢您的帮助，我是一个初学者，但是喜欢数据处理的熊猫。

问题答案：

是一个正则表达式，应位于一个字符串中：

"nt|nv"  # rather than "nt" | " nv"
f_recs[f_recs['Behavior'].str.contains("nt|nv", na=False)]

Python不允许您|在字符串上使用or（）运算符：

In [1]: "nt" | "nv"
TypeError: unsupported operand type(s) for |: 'str' and 'str'

类似资料：

使用熊猫数据框中的数据创建多个Excel工作表

问题内容：刚开始使用pandas和python。我有一个工作表，已读入数据框并应用了前向填充（ffill）方法。然后，我想创建一个包含两个工作表的Excel文档。在应用填充方法之前，一个工作表将在数据框中包含数据，而在下一个工作表将应用了填充方法的数据框。最终，我打算为数据框的特定列中的每个数据唯一实例创建一个工作表。然后，我想对结果应用某些vba格式-但我不确定哪个dll或插件，或者
熊猫数据框到JSON列表格式

问题内容：我有大熊猫表格数据框要转换为JSON。标准的.to_json（）函数不会为JSON创建紧凑格式。如何仅使用pandas获得这样的JSON输出格式？这是用于表格数据的JSON的一种非常紧凑的格式。（我可以在行上循环。…但是）问题答案：看来你需要先于：由于尚未实现： ValueError：选项“ orient”的值“ list”无效编辑：如果index不是column，请添加：
如何按多列过滤熊猫数据框

问题内容：要按单列过滤数据帧（df），如果我们考虑男性和女性的数据，则可以：问题1-但是，如果数据跨越多年并且我只想看2014年的男性，该怎么办？用其他语言，我可能会做类似的事情：（除了我要执行此操作，并在新的数据框对象中获取原始数据框的子集）问题2。如何循环执行此操作，并为每个唯一的年份和性别集创建一个数据框对象（例如，2013-男，2013-女，2014-男和2014-女的df 问题
Python：熊猫合并了多个数据框

问题内容：我有不同的数据框，需要根据日期列将它们合并在一起。如果我只有两个数据帧，则可以使用来对三个数据帧进行操作，但是，使用多个数据帧将变得非常复杂且难以读取。所有数据框都有一个共同的列- ，但是它们没有相同数量的行或列，而我只需要每个数据框共有每个日期的那些行。因此，我正在尝试编写一个递归函数，该函数返回一个包含所有数据的数据框，但是它不起作用。那我应该如何合并多个数据框？我试图dif
如何跨熊猫的多个数据框列“选择不同”？

问题内容：我正在寻找一种等效于SQL的方法 pandas sql比较与无关。仅适用于单个列，因此我想我可以合并这些列，或将它们放在列表/元组中并进行比较，但这似乎是熊猫应该以更原生的方式进行的操作。我是否缺少明显的东西，或者没有办法做到这一点？问题答案：您可以使用该方法来获取DataFrame中的唯一行：如果只想使用某些列来确定唯一性，则也可以提供关键字参数。请参阅文档字符串。
如何从熊猫数据框中删除行列表？

我有一个数据帧df：然后我想删除列表中指示的具有某些序列号的行，假设这里是然后离开：如何或什么功能可以做到这一点？

相关阅读

如何跨熊猫的多个数据框列“选择不同”？如何在熊猫数据框中切换列行如何在熊猫数据框中重置索引？如何在没有索引的大熊猫中转置数据框？如何确定熊猫数据框列中列表的长度？

相关文章

AngularJS 表达式 EL表达式 JSP表达式 XPath表达式 JasperReports 报表表达式

相关问答

熊猫数据帧：将长正则表达式分割成多行如何在熊猫数据框中找到重复数据？[重复]熊猫数据框中的列到行 dplyr/rlang:带有多个表达式的parse_expr 在熊猫数据框中规范化列

相关工具

熊猫Flash播放器 Quartz 表达式生成器正则表达式测试器 WizTools.org正则表达式测试工具数据库处理框架

相关文档

正则表达式 java.util.regex 正则表达式中文教程正则表达式（regular expression）Java 正则表达式教程 Python 正则表达式操作指南