当前位置: 首页 > 知识库问答 >
问题:

检查其他数据集中是否存在所有ID[重复]

蒋飞捷
2023-03-14

我有一个df1,看起来像这样:

ParentID   Name
12         kids
29         jdö

第二个df2看起来像这样:

ParentID   Location
34         56789
12         5608

我想检查df1中的所有父ID是否都存在于df2中。如果没有,我想在新的df中提取它们,例如:

ParentID   Name
29         jdö

我相信可以使用连接,但我不确定如何使用

result = left.join(right, on=["key1", "key2"], how="inner")

共有1个答案

微生德泽
2023-03-14

使用指标=参数,然后过滤第一个数据帧:

x = df1[df1.merge(df2, how="left", indicator=True)._merge.eq("left_only")]
print(x)

印刷品:

   ParentID Name
1        29  jdö
 类似资料:
  • 我对连接没有太多经验,下面的查询结果不正确。我有一个名为products的表,希望检查表product\u links中是否有记录。我只想获取product\u链接中没有行的项目列表。 当我运行下面的查询时,我只得到一行。有什么建议吗?谷歌帮不了我,或者我用错误的关键词搜索。

  • 我使用一个java jdbc应用程序从DB中获取大约500,000条记录。使用的数据库是Oracle。当每一行被取出时,我就将数据写入文件。由于获取整个数据需要大约一个小时,所以我尝试增加结果集的获取大小。我在多个链接中看到,在增加读取大小的同时,应该小心内存消耗。增加读取大小实际上会增加jvm使用的堆内存吗?< br >假设提取大小为10,程序查询总共返回100行。在第一次提取期间,结果集包含1

  • 类似于内置方法existsById,我想用Spring数据JPA创建一个existsAllById方法。为了实现这一点,我向repository界面添加了以下方法。 然而,Hibernate似乎不喜欢我对大小的使用,并向我报告了以下错误: 引起:org.hibernate.hql.internal.ast.QuerySyntaException:意外的表达式?发现集合函数大小[选择大小写当(cou

  • 问题内容: 我现在用来检查此功能的函数如下: 有用。我正在寻找的是是否有更好的方法来做到这一点。 问题答案: ECMAScript 2016 包含一种专门用于解决问题的数组方法,因此现在是首选方法。 _从2018年7月开始,如果您需要支持IE,则可以在polyfill中使用几乎所有 主流 浏览器。 编辑:请注意,如果数组中的项目是一个对象,则返回false。这是因为相似的对象是JavaScript

  • 问题内容: 我正在使用Java JDBC应用程序从数据库中获取约500,000条记录。使用的数据库是Oracle。取出每一行后,我立即将数据写入文件。由于完成整个数据的获取大约需要一个小时,因此我试图增加结果集的获取大小。我已经在多个链接中看到,在增加访存大小的同时,应该注意内存消耗。增加获取大小实际上是否会增加jvm使用的堆内存? 假设获取大小为10,并且程序查询总共返回100行。在第一次读取期