当前位置: 首页 > 知识库问答 >
问题:

如何连接众多DF的熊猫[复制]

侯和惬
2023-03-14

这与关于这个主题的几个问题相似。

import pandas as pd

df1 = pd.read_csv('df1.csv')#1st
df2 = pd.read_csv('df2.csv')#2nd
df3 = pd.read_csv('df3.csv')#3rd ect

concat_df = pd.concat([df1, df2, df3])

共有1个答案

桂学
2023-03-14

我希望这能有所帮助。

import os
import glob
import pandas as pd

allFiles = glob.glob(os.getcwd()+ "/*.csv")
list_ = []

for file_ in allFiles:
    df = pd.read_csv(file_,index_col=None, header=0)
    list_.append(df)

frame = pd.concat(list_)
print(frame)

相似-将多个csv文件导入到pandas中,并连接到一个DataFrame中

 类似资料:
  • 输入df。mean() 输出: 输入 (正确)输出: “a”中的类型值col=int 其他col具有str值 为什么会发生这种情况

  • 我有一个csv文件列表,我使用 我目前正在尝试遍历csv列表,并使用方法将axis参数设置为1,以按列将所有数据帧添加到一起。 它是工作的希望,但我遇到的问题,因为所有的数据帧都有相同的冒号名称,当我连接他们我得到例如10列都与关键"日期" 不管怎样,我能给哥伦布起个独一无二的名字吗?比如伦敦约会,柏林约会?显然,这些名称基于数据帧的名称。

  • 假设我有两个数据帧。 DF1:col1,col2,col3, DF2:col2,col4,col5 如何水平连接这两个数据帧,并使用col1、col2、col3、col4和col5?现在,我在做pd。concat([DF1,DF2],axis=1),但它最终有两个col2。假设两个col2中的所有值都相同,我只希望有一列。

  • 这就是我正在使用的桌子 我需要用“持续时间”访问数据点 上述命令单独运行正常,但当我将其作为: 有一个错误,因此如何在Pandas-Python中的一个语句中使用这两个条件

  • 我有两个不同形状的df。一个包含单词及其频率,另一个包含单词及其引理。 第一个df总是将一个单词映射到一个频率,第二个df将许多单词映射到一个引理(多次)。例如: DF1: 和df2: 我想将引理信息添加到,通过搜索的每个单词,将其与中的单词进行比较,并从中提取引理信息以将其添加回。 对于df1中的值是否始终相同,有一些有用的答案,但由于我想对每一行中包含不同单词的行执行此操作,因此我不确定如何继

  • 我一直在阅读“返回视图与副本”的链接。我真的不明白Pandas中的链式赋值概念是如何工作的,以及、或的用法是如何影响它的。 我获得以下代码行的警告,其中是熊猫数据框,是该数据框中的列(系列)名称: 看看这段代码,很明显我在做一些次优的事情吗?如果是这样,你能告诉我替换代码行吗? 我知道以下警告,并认为我的警告是误报: 链接分配警告/例外旨在通知用户可能无效的分配。可能存在误报;意外报告链式作业的情