当前位置：首页 > 面试题库 >

Python-pandas三向联接列上的多个数据框

翁硕

2023-03-14

问题内容：

我有3个CSV文件。每个人都有第一列作为人物的（字符串）名称，而每个数据框中的所有其他列都是该人物的属性。

如何将所有三个CSV文档“连接”在一起以创建单个CSV，并且每一行都具有该人的字符串名称的每个唯一值的所有属性？

join()pandas中的函数指定我需要一个多索引，但是我对层次化索引方案与基于单个索引进行联接有何关系感到困惑。

问题答案：

假设进口：

import pandas as pd

John Galt的答案基本上是一项reduce手术。如果我有几个数据帧，则将它们放在这样的列表中（通过列表推导或循环或其他方式生成）：

dfs = [df0, df1, df2, dfN]

假设它们有一些共同的列，例如name你的示例，我将执行以下操作：

df_final = reduce(lambda left,right: pd.merge(left,right,on='name'), dfs)

这样，你的代码应该可以与要合并的任意数量的数据框一起使用。

编辑2016年8月1日：对于使用Python 3的用户：reduce已移入functools。因此，要使用此功能，你首先需要导入该模块：

from functools import reduce

类似资料：

pandas三向连接列上的多个数据帧

我有3个CSV文件。每个数据框都有第一列作为人的（字符串）名称，而每个数据框中的所有其他列都是该人的属性。如何将所有三个CSV文档“连接”在一起，创建一个单个CSV，每行都具有该人字符串名称的每个唯一值的所有属性？ Pandas中的函数指定我需要一个多索引，但是我对分层索引方案与基于单个索引进行连接有什么关系感到困惑。
Pandas左外连接多个列上的多个数据框

问题内容：我是使用DataFrame的新手，我想知道如何在一系列表的多个列上执行等效于左外部联接的SQL 例：本质上，我想做类似以下SQL代码的操作（注意df3在Year上没有加入）：结果应如下所示：我曾尝试使用合并和联接，但无法弄清楚如何在多个表上以及涉及多个联接时执行此操作。有人可以帮我吗？谢谢问题答案：合并他们在两个步骤，和第一，然后那到结果。我从df3删除了year，因为您
多个数据库联接

问题内容：我有三个表：，，和。该表包含类别的名称和其类别的ID 。在包含两列：为这篇文章的ID和该职位的类别的ID。该表包含有关后多列-如，等我在网址中有一个名为parent_id的变量，它对应于一个类别。我想列出所有属于parent_id值类别的帖子（而不是类别）。例如，假设parent_id值为5。每个帖子可能属于ID为20的类别，但该类别属于父类别（其ID为5）。我想列出所有属于
Python Pandas-比较2个数据框，多个参数

问题内容：我有两张桌子。一个（下面的df）大约有18,000行，另一个（下面的映射文件）大约有80万行。我需要一个可以与如此大的DataFrames一起使用的解决方案。这是一个玩具示例：表1-df 表2-映射文件我正在尝试执行以下操作（我的语法是错误的，但是我认为这个想法会出现）：换句话说：我需要遍历mapfile中的每个项目（行），看看它的位置是否在df中每个CHR的任何START和EN
在pandas数据框中选择多个列

问题内容：我在不同的列中有数据，但是我不知道如何提取数据以将其保存在另一个变量中。如何选择然后将其保存到df1中？我试过了似乎没有任何工作。问题答案：列名（字符串）无法按照你尝试的方式进行切片。在这里，你有两个选择。如果从上下文中知道要切出哪些变量，则可以通过将列表传递给语法来仅返回那些列的视图。或者，如果需要对它们进行数字索引而不是按其名称进行索引（例如，你的代码应在不知道前两列
合并两个pandas数据框（在同一列上连接）

问题内容：我有2个数据框： restaurant_ids_dataframe 和 restaurant_review_frame 我想使用熊猫中的DataFrame.join（）命令将这两个DataFrame加入一个单一的数据框中。我尝试了以下代码行：但是，当我尝试这样做时，出现以下错误：我对熊猫很陌生，不知道就执行join语句而言我在做什么错。任何帮助将非常感激。问题答案：您可以使

相关阅读

合并两个pandas数据框（在同一列上连接）Python-pandas过滤串联的多个子串聚合多个联接表上的函数 Python（Pandas）在多索引数据框的每个lvl上添加小计融化pandas数据框的上三角矩阵

相关文章

Python Pandas统计函数银联数据 Pandas数据重采样联通上海产品经理三面高途数据分析面经三面（已意向）

相关问答

将多个excel文件导入python pandas并连接到一个数据帧中基于多个列的连接python Python，熊猫连接多个数据帧如何用不同的标记分隔符连接多个Pandas数据帧列？基于多个条件向Python数据帧添加新列[duplicate]

相关工具

SQL Server 数据库发布向导 Pandas 蓝牙接收与发送数据《Python Cookbook》第三版中文版数源三街 NFT

相关文档

Python 和 Pandas 数据分析教程 Python Pandas 中文教程 Python 数据结构 Python 数据结构 Python 数据科学