当前位置: 首页 > 知识库问答 >
问题:

Dataframe:使用显式定义的连接列连接Dataframe

璩涵衍
2023-03-14

假设我有两个数据帧df1:col1 col2 col3
df2:col1 col2 col4

我想使用col1和col2连接两个数据帧,而不定义新的别名表名。

我不想做

df=df1.join(df2,(df1.col1==df2.col1)

所以最终的数据帧只有col1 col2 col3 col4

如何实现这一点?

共有1个答案

宋凌龙
2023-03-14

对于spark数据帧,使用如下所示。

df3 = df1.join(df2, ['col1', 'col2'])
df3.show()
 类似资料:
  • 假设我在Spark上有两个数据帧 现在,我想通过多个列(任何大于1的数字)连接它们 我拥有的是第一个数据帧的列数组和第二个数据帧中的列数组,这些数组具有相同的大小,我希望通过这些数组中指定的列进行连接。例如: 因为这些数组大小可变,所以我不能使用这种方法: 是否有任何方法可以动态连接多个列?

  • 本文向大家介绍使用Pandas合并,联接和连接DataFrame,包括了使用Pandas合并,联接和连接DataFrame的使用技巧和注意事项,需要的朋友参考一下 在本教程中,我们将学习使用pandas 库合并,联接和连接DataFrame 。我认为您已经熟悉数据框和熊猫库。让我们一一看这三个操作。 合并 我们有一个名为pandas.merge()的方法,该方法类似于数据库联接操作 来合并数据帧。

  • 问题内容: 显式内部连接与隐式内部连接是否存在效率差异?例如: 与 问题答案: 在性能方面,它们是完全相同的(至少在SQL Server中)。 PS:请注意,自SQL Server 2005起不赞成使用该语法。(仍支持问题中使用的语法) 弃用“旧样式” JOIN语法:只是部分事情

  • 我有一个只有几个列的Cassandra表,我想更新其中的一个(对于多个列,还有什么?)来自Spark 2.4.0。但是如果我没有提供所有的列,那么记录就不会得到更新。 Cassandra模式:

  • 我的连接代码如下所示: 干杯,马尔辛

  • 我正在尝试使用mySQL c连接器。我已经按照mysql指南https://dev . MySQL . com/doc/connector-CPP/8.0/en/connector-CPP-installation-binary . html下载并解压了二进制文件 当我包括 xdevapi 像这样 我得到以下错误 /tmp/cc6dzD4k.o:在函数` mysqlx::string::opera