当前位置: 首页 > 知识库问答 >
问题:

将csv文件作为数据帧加载[重复]

路阳华
2023-03-14

这是一个noob问题,但如果不使用Pandas(pd.read),我如何导入CSV文件并将其加载到DataFrame对象,以便调用它(例如print(loaded_file))并用Python(2.7)打印文件内容?

共有3个答案

陈野
2023-03-14
import pandas as pd
data = pd.read_csv('file_name')
孙德宇
2023-03-14

只要阅读每一行并拆分,还注意到你需要知道hoy来解析类型,例如:

def getCSV(filePath, sep=";"):
    with open(filePath, "r") as f:
        return [l.split(sep) for l in f]

然后将其加载到数据帧中:

import pandas as pd
csvdata = getCSV("/da/real/path/file.csv")
pd.DataFrame(csvdata)
吕胤
2023-03-14

Unicodesv库也可用于读取。csv文件。

import unicodecsv
import pandas as pd

def read_csv(data):
""" Returns a list of dicts from .csv file passed in as data"""
    with open(data, "rb") as f:
        reader = list(unicodecsv.DictReader(f))
        return reader

file = read_csv('filename.csv') # call the function and pass in your 'filename'

pd.DataFrame(file) # call pd.DataFrame() function with file as an argument 
                   # to convert it to DataFrame object
 类似资料:
  • 我想在spark中读取一个CSV,将其转换为DataFrame,并使用将其存储在HDFS中 在Apache Spark中将CSV文件加载为DataFrame的正确命令是什么?

  • 我正在尝试使用下面的代码将数据帧作为文本格式文件加载到HDFS和S3中<代码>数据帧名称为最终数据。 使用上述代码,我可以成功加载数据。但文件名和我提供的不一样,也不是文本格式。已创建一个目录,其名称如我所述。 目录名称- /user/test/File/test_20170918055206.txt -bash-4.2$hdfs dfs-ls/user/test/File/test\u 2017

  • 我有3个维度为(a*2、b*2、c*2)的数据帧,而a、b、c是不同的数字。我想把它们添加到一个csv文件中,但每次都写不出来。我使用了csv的熊猫数据帧输出端 但做不到。 我的代码- 但是,我得到的最终输出是最后一个数据帧,而不是所有其他数据帧。

  • Python是如何将CSV文件读入pandas数据帧的(我可以使用它进行统计操作,可以有不同类型的列,等等)? 我的CSV文件有以下内容: 在R中,我们将使用以下方法读取此文件: 这将返回一个R数据。框架: 有没有类似python的方法来获得相同的功能?

  • 我有多个csv文件保存在一个文件夹中,具有相同的列布局,并希望将其作为pandas中的数据帧加载到python中。 这个问题与这条线索非常相似。 我使用以下代码: 还有更好的解决方案吗? 这需要很多时间。 谢啦

  • 我在pandas中有一个数据帧,我想把它写到CSV文件中。我使用的是: 并得到错误: 有没有什么方法可以很容易地解决这个问题(例如,我的数据帧中有unicode字符)?还有,有没有一种方法可以使用“to-tab”方法(我认为不存在)写入以制表符分隔的文件,而不是CSV?

  • 我正在使用Spark 2.3,我需要将Spark数据帧保存到csv文件中,我正在寻找更好的方法。。查看相关/类似的问题,我发现了这个问题,但我需要一个更具体的: 如果DataFrame太大,如何避免使用Pandas?因为我使用了函数(下面的代码),它产生了: 内存不足错误(无法分配内存)。 使用文件I/O直接写入csv是更好的方法吗?它可以保留分隔符吗? 使用df。聚结(1)。写选项(“标题”、“

  • (希望有人能帮我解决这个问题)非常感谢!!