当前位置：首页 > 面试题库 >

pandas结合了多个csv文件

邵羽

2023-03-14

问题内容：

我想将多个csv文件合并为一个df。

它们都是这种通用格式，带有两个索引列：

                                           1     2
CU0112-005287-7 Output Energy, (Wh/h)   0.064   0.066
CU0112-005287-7 Lights (Wh)                0     0

                                            1     2
CU0112-001885-L Output Energy, (Wh/h)   1.33    1.317
CU0112-001885-L Lights (Wh)             1.33    1.317

等等…

合并的df为：

                                           1     2
CU0112-005287-7 Output Energy, (Wh/h)   0.064   0.066
CU0112-005287-7 Lights (Wh)                0     0
CU0112-001885-L Output Energy, (Wh/h)   1.33    1.317
CU0112-001885-L Lights (Wh)             1.33    1.317

我正在尝试此代码：

import os
import pandas as pd
import glob

files = glob.glob(r'2017-12-05\Aggregated\*.csv')   //folder which contains all the csv files

df = pd.merge([pd.read_csv(f, index_col=[0,1])for f in files], how='outer')

df.to_csv(r'\merged.csv')

但我收到此错误：

TypeError: merge() takes at least 2 arguments (2 given)

问题答案：

我认为你需要concat，而不是merge：

df = pd.concat([pd.read_csv(f, index_col=[0,1]) for f in files])

类似资料：

Python Pandas-读取包含多个表的csv文件

我有一个文件。使用Pandas，从这个文件中获得两个DataFrame和的最佳策略是什么？输入如下所示：到目前为止，我想到的最好的方法是转换这个文件转换为Excel工作簿（），将表格拆分为工作表并使用：然而：这种方法需要模块。这些日志文件必须被实时分析，这样就可以更好地找到一种方法来分析它们，因为它们来自日志。真正的日志比那两个有更多的表。
pandas结合了两个字符串而忽略了nan值

问题内容：我有两列带有字符串。我想将它们结合起来并忽略值。这样：我试过了，但是如果任一列是nan，那都会创建一个nan值。我也考虑过使用。我想我可以解决这个问题，然后再使用一些，但这似乎很可行。问题答案：调用并传递一个空的str作为填充值，然后使用param ：
将多个csv文件导入pandas并将其合并到一个数据帧中

我有多个csv文件（每个文件包含N行（例如，1000行）和43列）。我想把文件夹中的几个csv文件读入pandas，并将它们合并到一个数据帧中。不过我还没能弄明白。问题是，数据帧的最终输出（即，）将所有列（即43列）合并到代码的一列（见附图）屏幕截图中选定行和列的示例（文件一）选择的行和列（文件二）Client_IDClient_NamePointer_of_Bins日期权重C00000
尝试将多个csv文件导入pandas时出错

我试图将一个目录中的几个csv文件读入pandas，并将它们连接到一个大数据帧中，但出现以下错误：这是我的密码我不知道为什么它不起作用。我试图用chmod解决这个问题，但一切都变了
使用Spring批处理将多个csv文件合并为单个csv

我有一个商业案例，使用Spring batch将多个csv文件（每个文件大约1000个，包含1000条记录）合并成单个csv。请帮助我提供方法和性能方面的指导和解决方案。到目前为止，我已经尝试了两种方法，方法1。 Tasklet chunk与multiResourceItemReader一起从目录中读取文件，FlatFileItemWriter作为项目编写器。这里的问题是，它的处理速度非常
Pandas文本文件到CSV

对理解这一差异的任何帮助都是感激的。

相关阅读

导入CSV文件作为pandas DataFrame 合并多个CSV文件而无需重复标题（使用Python）jQuery：合并多个JSON结果 R结合多个`data.frames`（`lapply`，`mapply`）用pandas在CSV文件中写评论

相关文章

Pandas merge合并操作 Python Pandas聚合函数 Python Pandas读取文件 R语言CSV文件我投了100多份Java简历，结果一个面试机会都没有

相关问答

将多个csv文件导入pandas并连接到一个数据帧中在多个CSV中读取到Pandas Dataframe[重复]使用EOL LF将csv文件合并为一个csv 合并多个聚合的结果 Pandas：使用循环和分层索引将多个csv文件导入dataframe

相关工具

鱼了个鱼 Pandas Sklearn-pandas pandas-profiling Pandas AI

相关文档

Python Pandas 中文教程 Pandas Cookbook 秘籍 Pandas 官方教程 Pandas 函数手册程序开发文章合集