问题：

将SQL联接查询转换为pyspark语法

方斌

2023-03-14

# "invalid" records, where there is a matching `record_id` for rv_df
SELECT DISTINCT(r.id) FROM core_record AS r LEFT OUTER JOIN core_recordvalidation rv ON r.id = rv.record_id WHERE r.job_id = 41 AND rv.record_id is not null;

# "valid" records, where there is no matching `record_id` for rv_df
SELECT DISTINCT(r.id) FROM core_record AS r LEFT OUTER JOIN core_recordvalidation rv ON r.id = rv.record_id WHERE r.job_id = 41 AND rv.record_id is not null;

任何帮助都将不胜感激！

共有1个答案

柯甫

2023-03-14

只是不得不离开几个小时。找到了一个适合我用例的解决方案。

首先，从rv_df中只选择distincentrecord_id:

rv_df = rv_df.select('record_id').distinct()

然后用它来表示相交和不交：

# Intersection:
j_df = r_df.join(rv_df, r_df.id == rv_df.record_id, 'leftsemi').select(r_df['*'])

# Disjoint:
j_df = r_df.join(rv_df, r_df.id == rv_df.record_id, 'leftanti').select(r_df['*'])

类似资料：

将SQL查询转换为Linq（包含左联接）

问题内容：我有一个在SQL中完美运行的查询，但是我有最糟糕的时间将其转换为linq。该表（下面的表1）保存了多种记录类型的状态更改。联接需要设置两个字段以创建有效联接：SubmissionId（状态所属的表的pk）和SubmissionTypeId（确定状态所属的表）。我已经尝试过使用x.DefaultIfEmpty（）中的y到x进行多次迭代，并且无法在正确的位置设置where子句。我需要从T
将SQL查询转换为ElasticSearch查询

问题内容：我想将以下SQL查询转换为Elasticsearch之一。谁能帮上忙我尝试了以下方法：但不确定我是否做对了，因为它无法验证结果。似乎要在聚合内添加查询。问题答案：假设您使用Elasticsearch 2.x，则有可能在Elasticsearch中具有 -semantics。我不知道2.0之前的可能性。您可以使用新的Pipeline Aggregation Bucket Se
将sql查询转换为CriteriaQuery

我有两个表，它们通过一个外键来维护它们之间的父子关系。查询如下所示。我想在使用jpa的同时使用标准版。所以有人可以帮助我使用标准版吗表“child”的“notification\u id\u child”列是外键，并引用表“parent”的主键。
将SQL查询转换为Rails AREL查询？

问题内容：多亏了Erwin Brandstetter在我之前的问题“具有has_many关系的订单”中的帮助，我的SQL查询才能正常工作。如何将该SQL转换为ActiveRecords或AREL查询以在范围中使用？我最近来的是在朋友的帮助下… …这给了我一个错误：更新：我之前的问题对相关的架构和查询有完整的描述。但是基本上Articles have_many Metrics和一个Metr
将SQL语法转换为ActiveRecord查询的工具

问题内容：有很多问题可以帮助将特定的SQL查询转换为ActiveRecord查询。是否有一些帮助/指导[在线]工具可以自动进行转换？问题答案：这是您正在寻找的工具：http : //www.scuttle.io/
如何将左联接中有联接的sql转换为查询生成器？

但是，我的查询生成器是错误的。它会显示错误消息 SQLState[42000]:语法错误或访问冲突：1064您的SQL语法中有错误；查看与您的MySQL server版本相对应的手册以获得正确的语法和生成的SQL SQL：从左联接中选择.*(内联接对。=。和。=。和谁能帮我解决我的问题？多谢了。

将SQL联接查询转换为pyspark语法

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档