当前位置: 首页 > 知识库问答 >
问题:

“子集”不适用于drop_重复数据帧

彭阳荣
2023-03-14

我有一个df,看起来像这样:

    A                B    C               D     NEW
0   1       Adhoc_Task  WID          WI_DTL      []  
1   1  Arun_adhoc_load  ATT           IXN_1  (IXN,)
2   1  Arun_adhoc_load  ATT          IXN_10  (IXN,)
3   1  Arun_adhoc_load  ATT         IXN_100  (IXN,)
4   1  Arun_adhoc_load  ATT         IXN_101  (IXN,)
5   2    Batch_Support  ATT      CDS_STATUS      []
6   2    Batch_Support  ATT     CDS_CONTROL      []
7   2    Batch_Support  ATT  CDS_ORA_STATUS      []
8   2    Batch_Support  ATT      REP_FILTER      []
9   1      online_load  ATT           TAX_3  (TAX,)
10  1      online_load  ATT           TAX_4  (TAX,)
11  1      online_load  ATT           TAX_8  (TAX,)
12  1      online_load  ATT          TAX_11  (TAX,)

所需的输出如下所示:

    A                B    C               D     NEW
0   1       Adhoc_Task  WID          WI_DTL      []  
1   1  Arun_adhoc_load  ATT           IXN_1  (IXN,)
5   2    Batch_Support  ATT      CDS_STATUS      []
9   1      online_load  ATT           TAX_3  (TAX,)

我试图删除基于列B的重复行。然而,当我运行时

df.drop_duplicates(subset = ['B'], keep='first', inplace=True)

我得到以下错误:

TypeError: drop_duplicates() got an unexpected keyword argument 'subset'

我正在从python 3运行pandas 0.19.1,因此我在这里查看了文档:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.drop_duplicates.html

对于子集,我没有最模糊的地方。如何根据一列中的值从DataFrame中删除重复项?

共有1个答案

柴英光
2023-03-14

无论代码中的原因是什么,df都变成了Series对象。检查type(df)就在失败的drop_duplicates调用之前。该函数没有Series的子集参数。

 类似资料:
  • 更新:带有XYPlot的JPanel封装在JSplitPanel中。当我移动分隔符(用XYPlot放大JPanel)时,有两个XYPlot,第一个(在第一次单击时获得,第二个(如果第二次单击到另一个行/dataset->XYPlot)。

  • 在用pygame编写代码时,我意识到VSCode并没有显示相当多pygame模块的itellisense,而是将这些模块显示为变量。经过深入研究,我发现如果您< code > import py game . display as display ,intellisense会显示得很好。有没有什么方法可以让我不用像这样导入这些模块就可以使用intelliense?

  • 我正在用eclipse 3.0(Firefox浏览器)运行一个简单的java程序。。但在运行之后,我发现以下错误: 线程“main”java中出现异常。lang.IllegalStateException:驱动程序可执行文件的路径必须由webdriver设置。壁虎。驱动系统属性; 有人能给我在火狐上运行的变通方法吗?注意:在所有程序运行正常之前,但是在火狐升级后,会出错。

  • 我希望对spring服务的参数使用java bean验证注释。考虑以下服务:

  • 对于以下两个数据帧: 我只想保留中列中的值与的列中的值重叠的行,即生成以下数据帧: 我已经尝试了很多方法,但我对python和pandas还不熟悉,不喜欢R的语法。为什么这行代码不起作用,什么会起作用?