问题：

熊猫合并具有不同列的两个数据帧

益炜

2023-03-14

我肯定错过了一些简单的东西。尝试合并熊猫中的两个数据帧，它们的列名基本相同，但右边的数据帧有一些左边没有的列，反之亦然。

>df_may

  id  quantity  attr_1  attr_2
0  1        20       0       1
1  2        23       1       1
2  3        19       1       1
3  4        19       0       0

>df_jun

  id  quantity  attr_1  attr_3
0  5         8       1       0
1  6        13       0       1
2  7        20       1       1
3  8        25       1       1

我已尝试使用外部联接进行联接：

mayjundf = pd.DataFrame.merge(df_may, df_jun, how="outer")

但这会产生：

Left data columns not unique: Index([....

我还指定了一个要连接的列（例如，on="id"），但这会重复所有列，除了"id"，如attr_1_x、attr_1_y，这并不理想。我还传递了整个列列表（有很多）到on：

mayjundf = pd.DataFrame.merge(df_may, df_jun, how="outer", on=list(df_may.columns.values))

其产生：

ValueError: Buffer has wrong number of dimensions (expected 1, got 2)

我错过了什么？我想得到一个附加了所有行的df，并且在可能的情况下填充attr_1、attr_2、attr_3，在它们不显示的地方填充NaN。这似乎是一个非常典型的数据搜索工作流，但我被卡住了。

提前感谢。

共有2个答案

司徒翼

2023-03-14

我今天在使用concat、append或merge时遇到了这个问题，我通过添加一个按顺序编号的helper列，然后进行外部联接来解决这个问题

helper=1
for i in df1.index:
    df1.loc[i,'helper']=helper
    helper=helper+1
for i in df2.index:
    df2.loc[i,'helper']=helper
    helper=helper+1
df1.merge(df2,on='helper',how='outer')

凤经国

2023-03-14

我认为在这种情况下，concat就是您想要的：

In [12]:

pd.concat([df,df1], axis=0, ignore_index=True)
Out[12]:
   attr_1  attr_2  attr_3  id  quantity
0       0       1     NaN   1        20
1       1       1     NaN   2        23
2       1       1     NaN   3        19
3       0       0     NaN   4        19
4       1     NaN       0   5         8
5       0     NaN       1   6        13
6       1     NaN       1   7        20
7       1     NaN       1   8        25

通过在这里传递ax=0，您将df堆叠在一起，我相信这就是您想要的，然后在它们各自的dfs中不存在的地方产生NaN值。

类似资料：

熊猫合并：合并同一列上的两个数据帧，但保留不同的列

我有两个熊猫数据帧共享一个共同的列名。我想合并公共列名，但保留与第二个dataFrame中的所有不同列，其中公共列名称匹配。下面是两个数据帧的示例：我希望预期的结果是：也就是说，当列“A”匹配时，我希望保留I，J，K，L的行，并且不等于“NaN ”,对于DF1中的列也是如此。我已经尝试了所有的pd.merge选项，但是它们似乎没有做我上面要求的事情。例如，在“A”上匹配并将所有键保留在左侧
pandas合并具有不同列的两个数据框

问题内容：我肯定在这里错过了一些简单的事情。尝试在熊猫中合并具有相同列名的两个数据框，但右侧的数据框具有一些左侧没有的列，反之亦然。我试着加入外部联接：但这产生了：我还指定了一个要连接的单列（例如on =“ id”），但是它复制了除“ id”以外的所有列，例如attr_1_x，attr_1_y，这并不理想。我也将整个列列表（有很多）传递给了“ on”：产生：我想念什么？我想获得一个带有
合并具有不同列数的两个表

问题内容：我有两个表（表A和表B）。它们具有不同的列数-假设表A具有更多列。如何合并这两个表，并为表B没有的列获取空值？问题答案：为具有较少列的表添加额外的列作为null
熊猫加入/合并/合并两个数据框

问题内容：我在加入熊猫方面遇到问题，并且试图找出问题所在。假设我有一个x：我应该能够通过简单的连接命令在y = x上将y与索引上的y联接，除了同名具有+2。我希望决赛对双方都有1941个非值。我也尝试过合并，但是我有同样的问题。我以为正确的答案是pandas.concat（[x，y]），但这也不符合我的预期。编辑：如果您在加入方面遇到问题，请阅读下面的韦斯答案。我有一个重复的时间戳。问
大熊猫：在多列上合并（合并）两个数据框

问题内容：我正在尝试使用两列来连接两个熊猫数据框：但出现以下错误：任何想法应该是正确的方法吗？谢谢！问题答案：尝试这个 https://pandas.pydata.org/pandas- docs/stable/reference/api/pandas.DataFrame.merge.html left_on：要在左侧DataFrame中加入的标签或列表或类似数组的字段名称。可以是Dat
具有多索引列的熊猫数据框-合并级别

问题内容：我有一个数据框，具有以下的multiindex列：如何将列索引级别展平/合并为：“ Level1 | Level2”，例如，。等等？如果这不可能，是否有办法像我上面所做的那样不创建多索引列？问题答案：您可以随时更改列：

熊猫合并具有不同列的两个数据帧

共有2个答案

相关问答

相关文章

相关阅读

相关工具

相关文档