当前位置: 首页 > 知识库问答 >
问题:

在多个CSV中读取到Pandas Dataframe[重复]

杨利
2023-03-14
import pandas as pd
import os
import glob

path = "/file/path/"
all_files = glob.glob(os.path.join(path, "*.csv"))

for file in all_files:
    file_name = os.path.splitext(os.path.basename(file))[0]
    dfn = pd.read_csv(file)
    dfn.index.name = file_name

我得到错误消息“UnicodeDecodeError:'UTF-8'编解码器不能解码位置137中的字节0xA3:无效的开始字节”。

共有1个答案

锺离珂
2023-03-14

在UTF-8和'Latin1'字符表中,0xa3是英镑符号;并且是非ASCII的。因此,将'latin1'传递给encoding参数应该可以解决这个问题。

所以这一行:

dfn = pd.read_csv(file)

变成:

dfn = pd.read_csv(file, encoding='latin1')
 类似资料:
  • pyspark新手,希望将csv文件读取到数据帧。似乎不能让人读。有什么帮助吗? ()中的Py4JJavaError回溯(最近一次调用)----

  • 我有一个csv,我正试图读入一个对象数组。我一直得到以下错误。。。JAVAutil。输入不匹配异常我认为这是因为它读取的文件是按空格分割的,而不是按逗号分割的。我想我需要用绳子。split()方法,但我不确定具体怎么做。任何建议。这是我到目前为止的代码。。。 以下是我正在使用的文本文件:

  • 我在on文件夹的几个zip文件中有几个csv文件,例如: null zip中的一个csv是这样工作的: 你知道如何优化这个循环吗?

  • 问题内容: 我正在尝试根据我已经拥有的csv检查提取数据的值。它只会循环遍历CSV的行一次,我只能检查feed.items()的一个值。我需要在某个地方重置值吗?有没有更好/更有效的方法来做到这一点?谢谢。 问题答案: 您可以通过重置文件对象的读取位置来“重置” CSV迭代器。

  • 我正在使用python,我有一个文件(

  • 如何在JMeter中将一个csv文件循环到另一个csv文件,其中第一个csv文件包含所有登录数据,另一个csv文件包含交易数据。我应该运行1个出纳员应该处理30笔交易的地方。