基于“不在”条件从数据帧中删除行[重复]

彭霄

2023-03-14

当日期列的值在日期列表中时，我想从熊猫数据帧中删除行。以下代码不起作用：

a=['2015-01-01' , '2015-02-01']

df=df[df.datecolumn not in a]

我得到以下错误：

ValueError：序列的真值不明确。使用a.empty、a.bool（）、a.item（）、a.any（）或a.all（）。

共有2个答案

姬衡

2023-03-14

您可以使用Series.isin：

df = df[~df.datecolumn.isin(a)]

虽然错误消息表明可以使用all（）或any（），但只有当您希望将结果减少为单个布尔值时，它们才有用。然而，这不是您现在要做的，即根据外部列表测试Series中每个值的成员资格，并保持结果不变（即，布尔系列，然后将用于切片原始DataFrame）。

你可以在Gotchas中阅读更多关于这方面的内容。

史谦

2023-03-14

您可以使用pandas.Dataframe.isin。

熊猫。Dateframe.isin将返回布尔值，这取决于每个元素是否在列表中。然后用~反转它，将True转换为False，反之亦然。

import pandas as pd

a = ['2015-01-01' , '2015-02-01']

df = pd.DataFrame(data={'date':['2015-01-01' , '2015-02-01', '2015-03-01' , '2015-04-01', '2015-05-01' , '2015-06-01']})

print(df)
#         date
#0  2015-01-01
#1  2015-02-01
#2  2015-03-01
#3  2015-04-01
#4  2015-05-01
#5  2015-06-01

df = df[~df['date'].isin(a)]

print(df)
#         date
#2  2015-03-01
#3  2015-04-01
#4  2015-05-01
#5  2015-06-01

类似资料：

Python基于一列删除重复数据帧[duplicate]

我有一个这样的数据帧（）：我想基本上删除重复记录，以便字段是唯一的。我不关心被丢弃的记录，在这种情况下，地址已经被删除，所以唯一通过的是拼写错误。我想要以下结果的数据框：在R中，基本上是这样做的：但是我需要一种方法在熊猫身上做到这一点。
基于列值删除熊猫中的数据帧行

我有以下数据帧：我需要删除等于的行。最有效的方法是什么？
基于列值删除Python中的数据帧行[duplicate]

我有一个数据集，我想根据该行的2或列值从数据框中删除行。例如-我有关于美国所有电视节目的数据帧，我需要根据电视节目的季节和剧集删除电视节目的特定行。就像我需要删除高谭市电视台的行，但只删除包含第四季和第十集的行。如果我能在这方面得到帮助，我将不胜感激。
编辑：Pyspark：基于另一个数据帧删除行，该数据帧具有许多列的条件

我有两个数据帧df1和df2。我想根据df2列值过滤或删除df1上的行 df2，我必须检查客户名称、产品、年份、数量和金额，然后如果df1的所有值都相同，我必须放弃。(即，如果customername = Gopi，product = ball，year = 2020，qty = 0和amount，则删除请让我知道如何实现，谢谢。 DF1： df2: 预期产出：
根据两个相关条件删除数据帧行

我有一个相当大的数据帧（几百列），我想对它执行以下操作。我在下面用一个玩具数据框和一个简单的条件来说明我需要什么。对于每一行：条件#1：检查其中两列的值是否为零（0）。如果这是真的，请保留该行并继续下一行。如果任一列的值为零（0），则条件为真。如果条件#1为False（第1列或第4列中没有零），请检查行中所有剩余的列。如果任何剩余列的值为零，则删除该行。我希望过滤后的数据帧作为一个新的、独立
在数据帧中删除重复项[duplicate]

我有一个这样的专栏：我希望专栏看起来像这样：只希望保留重复记录的第一个或最后一个。目前，我使用的是：但它不起作用。我错过了什么吗？

基于“不在”条件从数据帧中删除行[重复]

共有2个答案

相关问答

相关文章

相关阅读

相关工具

相关文档