当前位置: 首页 > 面试题库 >

通过列名称连接熊猫数据框

乔伯寅
2023-03-14
问题内容

我有两个具有以下列名称的数据框:

frame_1:
event_id, date, time, county_ID

frame_2:
countyid, state

我想通过加入(左)on获得以下列的数据框county_ID = countyid

joined_dataframe
event_id, date, time, county, state

如果我要连接的列不是索引,我无法弄清楚该怎么做。最简单的方法是什么?谢谢!


问题答案:

您可以按以下方式使用left_on和right_on选项:

pd.merge(frame_1, frame_2, left_on='county_ID', right_on='countyid')

从问题中我不能确定您是否只想合并密钥是否位于左侧数据框中。如果是这种情况,则以下将执行此操作(以上内容实际上会进行多对多合并)

pd.merge(frame_1, frame_2, how='left', left_on='county_ID', right_on='countyid')


 类似资料:
  • 你能帮我连接两个数据帧吗。 我有两个数据帧。 DF1: DF2: 我需要基于前两个数据帧创建一个数据帧,左连接两列。列index和val2在两个数据帧中具有相同的名称。df3的结果应该如下所示: 应该删除df1中不存在的df2中的索引,如果df1中的索引具有与df2中相同的val2,则应该将1添加到新的列val3中,否则:NaN。 非常感谢提前!

  • 问题内容: 支持多级列名: 此功能非常有用,因为它允许“水平”地将同一数据框的多个版本附加到区分实例的列名称的第一级(在我的示例中)。 想象一下我已经有一个这样的数据框: 有没有一种好方法可以向列名添加另一个级别,类似于行索引: 问题答案: 无需创建元组列表 采用: 结果数据框: 2014年1月25日起提出要求

  • 我有两个非常大的系列,只包含连接键。在不使用索引的情况下(在本例中没有意义),我希望以最有效的方式通过值将一个系列左键连接到另一个系列。 现在,我添加了一列1,这样我就可以使用和一个左连接,这样我就可以确定中的每个键是否也存在于Right中。 我确信我可以在不创建两个未使用的列的情况下完成这项工作,但是似乎希望为联接使用索引。有没有办法让两个系列的值保持不变?有没有更快的numpy版本? 例如:

  • 问题内容: 我引用的数据框如下(是列名): 但是我不想被硬编码,我想要一个变量来使其动态。怎么做? TIA 问题答案: 您可以使用方括号对列进行索引: 因此,当您接受输入为a时,您可以执行以下操作: 此外,将列作为属性访问可能导致模棱两可的行为。如具有列命名,并尝试做这可能要列不同的值,或者如果你有一个名为一样像任何有效的方法DF柱或那么这将导致语法错误。 因此,我强烈建议您使用方括号来选择列。

  • 问题内容: 我有一个熊猫数据框列表,我想将其合并为一个熊猫数据框。我正在使用Python 2.7.10和Pandas 0.16.2 我从以下位置创建了数据框列表: 这将返回数据帧列表 这是一些样本数据 我想将,和组合成一个熊猫数据框。另外,使用该选项时将大表直接读入数据框的方法将非常有帮助。 问题答案: 鉴于所有数据框都具有相同的列,您可以简单地将它们:

  • 我想对两个不同的数据帧执行一些sql操作。不幸的是,就像我处理的数据一样,拼写通常是不同的。 下面是一个示例,其中userid属于df1,username属于df2。有人帮我吗?