当前位置：首页 > 面试题库 >

在pandas中合并两个数据框

薛弘济

2023-03-14

问题内容：

我正在使用下面的代码合并两个csv（数据帧）：

import pandas as pd
a = pd.read_csv(file1,dtype={'student_id': str})
df = pd.read_csv(file2)
c=pd.merge(a,df,on='test_id',how='left')
c.to_csv('test1.csv', index=False)

我有以下CSV文件

文件1：

test_id, student_id
1, 01990
2, 02300
3, 05555

文件2：

test_id, result
1, pass
3, fail

合并后

test_id, student_id , result
1, 1990, pass
2, 2300,
3, 5555, fail

如果您注意到student_id的开头附加了0，应该将其视为文本，但是在合并并使用to_csv函数后，它将其转换为数字并删除了前导0。

即使在to_csv之后，如何将列保持为“文本”？

我认为它的to_csv函数可以再次保存为数字添加了dtype = {‘student_id’：str}。

问题答案：

a = pd.read_csv(file1, dtype={‘test_id’: object})
df = pd.read_csv(file2, dtype={‘test_id’: object})

================================================== ============

In[28]: pd.merge(a, b, on='test_id', how='left')
Out[28]: 
  test_id   student_id  result
0      01         1990    pass
1      02         2300     NaN
2     003         5555    fail

类似资料：

合并两个pandas数据框（在同一列上连接）

问题内容：我有2个数据框： restaurant_ids_dataframe 和 restaurant_review_frame 我想使用熊猫中的DataFrame.join（）命令将这两个DataFrame加入一个单一的数据框中。我尝试了以下代码行：但是，当我尝试这样做时，出现以下错误：我对熊猫很陌生，不知道就执行join语句而言我在做什么错。任何帮助将非常感激。问题答案：您可以使
在pandas / python中的数据框中合并两列文本

问题内容：我在Python中使用熊猫有数据框。其中两列分别命名为和。我想创建一个名为的变量。问题答案：如果两个列都是字符串，则可以直接将它们连接起来：如果其中一列（或两列）都不是字符串类型，则应首先将其转换为字符串，这样做时要小心！如果需要连接多个字符串列，可以使用：其中是分隔符。
在PySpark中合并两个数据帧

我有两个数据帧，DF1和DF2，DF1是存储来自DF2的任何附加信息的主机。假设DF1是以下格式， DF2包含DF1中已经存在的2个条目和两个新条目。(itemId和item被视为一个组，可以被视为连接的键) 我需要合并两个数据框，以便增加现有项目计数并插入新项目。结果应该是这样的：我有一种方法可以做到这一点，但不确定这种方法是否有效或正确
pandas合并具有不同列的两个数据框

问题内容：我肯定在这里错过了一些简单的事情。尝试在熊猫中合并具有相同列名的两个数据框，但右侧的数据框具有一些左侧没有的列，反之亦然。我试着加入外部联接：但这产生了：我还指定了一个要连接的单列（例如on =“ id”），但是它复制了除“ id”以外的所有列，例如attr_1_x，attr_1_y，这并不理想。我也将整个列列表（有很多）传递给了“ on”：产生：我想念什么？我想获得一个带有
熊猫加入/合并/合并两个数据框

问题内容：我在加入熊猫方面遇到问题，并且试图找出问题所在。假设我有一个x：我应该能够通过简单的连接命令在y = x上将y与索引上的y联接，除了同名具有+2。我希望决赛对双方都有1941个非值。我也尝试过合并，但是我有同样的问题。我以为正确的答案是pandas.concat（[x，y]），但这也不符合我的预期。编辑：如果您在加入方面遇到问题，请阅读下面的韦斯答案。我有一个重复的时间戳。问
大熊猫：在多列上合并（合并）两个数据框

问题内容：我正在尝试使用两列来连接两个熊猫数据框：但出现以下错误：任何想法应该是正确的方法吗？谢谢！问题答案：尝试这个 https://pandas.pydata.org/pandas- docs/stable/reference/api/pandas.DataFrame.merge.html left_on：要在左侧DataFrame中加入的标签或列表或类似数组的字段名称。可以是Dat

相关阅读

大熊猫：在多列上合并（合并）两个数据框合并pandas数据框列表按索引合并两个数据框合并两个数组将数据合并到两个目标表中

相关文章

Pandas数据重采样 PDFBox合并多个PDF文档 Pandas设置数据显示格式 Tableau数据混合 Tableau数据聚合

相关问答

在Apache spark中合并两个列名不同的数据集根据值合并两个二进制数据.帧将 pyspark 中的两个数据帧合并为一列合并两个数据帧而不复制项合并两个ObjectNode

相关工具

Pandas Sklearn-pandas pandas-profiling Pandas AI 数据库处理框架

相关文档

Python 和 Pandas 数据分析教程 Pandas 函数手册 Python Pandas 中文教程 SQL 合计函数 Pandas Cookbook 秘籍