问题：

Dataframe：使用显式定义的连接列连接Dataframe

璩涵衍

2023-03-14

假设我有两个数据帧df1:col1 col2 col3
df2:col1 col2 col4

我想使用col1和col2连接两个数据帧，而不定义新的别名表名。

我不想做

df=df1.join（df2，（df1.col1==df2.col1）

所以最终的数据帧只有col1 col2 col3 col4

如何实现这一点？

共有1个答案

宋凌龙

2023-03-14

对于spark数据帧，使用如下所示。

df3 = df1.join(df2, ['col1', 'col2'])
df3.show()

类似资料：

PySpark DataFrame-动态连接多列

假设我在Spark上有两个数据帧现在，我想通过多个列（任何大于1的数字）连接它们我拥有的是第一个数据帧的列数组和第二个数据帧中的列数组，这些数组具有相同的大小，我希望通过这些数组中指定的列进行连接。例如：因为这些数组大小可变，所以我不能使用这种方法: 是否有任何方法可以动态连接多个列？
使用Pandas合并，联接和连接DataFrame

本文向大家介绍使用Pandas合并，联接和连接DataFrame，包括了使用Pandas合并，联接和连接DataFrame的使用技巧和注意事项，需要的朋友参考一下在本教程中，我们将学习使用pandas 库合并，联接和连接DataFrame 。我认为您已经熟悉数据框和熊猫库。让我们一一看这三个操作。合并我们有一个名为pandas.merge()的方法，该方法类似于数据库联接操作来合并数据帧。
显式与隐式SQL连接

问题内容：显式内部连接与隐式内部连接是否存在效率差异？例如：与问题答案：在性能方面，它们是完全相同的（至少在SQL Server中）。 PS：请注意，自SQL Server 2005起不赞成使用该语法。（仍支持问题中使用的语法）弃用“旧样式” JOIN语法：只是部分事情
如何使用Datastax连接器从Spark Dataframe更新特定的Cassandra列集

我有一个只有几个列的Cassandra表，我想更新其中的一个（对于多个列，还有什么？）来自Spark 2.4.0。但是如果我没有提供所有的列，那么记录就不会得到更新。 Cassandra模式：
使用自定义证书的Android https连接

我的连接代码如下所示：干杯，马尔辛
使用 mysql c 连接器的未定义引用

我正在尝试使用mySQL c连接器。我已经按照mysql指南https://dev . MySQL . com/doc/connector-CPP/8.0/en/connector-CPP-installation-binary . html下载并解压了二进制文件当我包括 xdevapi 像这样我得到以下错误 /tmp/cc6dzD4k.o:在函数` mysqlx::string::opera

Dataframe：使用显式定义的连接列连接Dataframe

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档