当前位置: 首页 > 面试题库 >

熊猫/ Python:如何串联两个没有重复的数据框?

严狐若
2023-03-14
问题内容

我想将两个数据框A,B连接到一个没有重复行的新数据框(如果B中的行已经存在于A中,则不要添加):

数据框A:数据框B:

   I    II    I    II
0  1    2     5    6
1  3    1     3    1

新数据框:

     I    II
  0  1    2
  1  3    1
  2  5    6

我怎样才能做到这一点?


问题答案:

最简单的方法是只进行串联,然后删除重复项。

>>> df1
   A  B
0  1  2
1  3  1
>>> df2
   A  B
0  5  6
1  3  1
>>> pandas.concat([df1,df2]).drop_duplicates().reset_index(drop=True)
   A  B
0  1  2
1  3  1
2  5  6

reset_index(drop=True)是后来修复指标concat()drop_duplicates()。没有它,您将拥有[0,1,0]而不是的索引[0,1,2]dataframe如果不立即重置,可能会导致进一步操作的问题。



 类似资料:
  • 我正在尝试连接到数据帧。它们看起来像这样 期望的最终目标是: 我一直试图使用pd.merge和。连接函数与on='外'设置不成功

  • 我有1个数据帧,我想选择所有没有重复的行 我的df: 我的输出应该是: 我正在使用熊猫数据框 有什么建议吗?

  • 我的任务是突出显示熊猫数据框中的所有电子邮件副本。是否有一个函数用于此操作,或者有一种方法可以删除所有非重复项,从而为我留下一个很好的列表,列出数据集中的所有重复项? 该表由六列组成: 我想摆脱最后一列,因为最后一封邮件不是重复的。

  • 我有一个csv格式的表格,看起来像这样。我想转置该表,以便指示符名称列中的值是新列, 我希望最终结果是这样的: 我尝试过使用熊猫数据框架,但没有多大成功。 你有没有想过如何做到这一点? 谢谢

  • 问题内容: 我有两个,都被索引。我需要将元素添加在一起以形成一个new ,但前提是索引和列相同。如果该项不存在于之一,则应将其视为零。 我试过使用,但这无论索引和列如何。还尝试了一个简单的方法,但是如果两个数据框都没有该元素,则给出a 。 有什么建议? 问题答案: 怎么样

  • 这似乎是非常基本的知识,但我还是卡住了,尽管我有一些数据处理的理论背景(通过其他软件)。值得一提的是,我是蟒蛇和熊猫图书馆的新手。 我的任务是将系列名称列的值作为单独的列(从长到宽转换)。我花了很长时间尝试不同的方法,但只有错误。 例如: 我犯了一个错误: ...很多短信...通过值的长度是2487175,索引暗示2 有谁能指导我完成这个过程吗?谢谢 它用于代码“mydata=mydata”。pi