当前位置: 首页 > 知识库问答 >
问题:

在Python中读取文件时的统码错误

步胜
2023-03-14

我目前正在学习Python,遇到了以下错误:

Traceback (most recent call last):   
  File "file.py", line 22, in module
    for word in file.read():
  File "C:\Users\user\AppData\Local\Continuum\Anaconda3\lib\encodings\cp1252.py" line 23, in decode
    return codecs.charmap_decode(input,self.errors,decoding_table)[0] 
UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 6552: character maps to undefined

这是我的代码:

file=open('xyz.txt')

dict={}

ignorelist=set( line.strip() for line in open('ignorelist'))

for word in file.read():
    word = word.replace(".","")
    word = word.replace(",","")

    if word not in ignorelist:
        if word not in dict:
            dict[word] = 1
        else:
            dict[word] += 1

d=collections.Counter(dict)

for word, count in d.most_common(10):
    print(word, ": ", count)

为什么会出现这种情况?

共有1个答案

孔鸿宝
2023-03-14

您能否通过指定编码来尝试此更改:

file=open('xyz.txt', encoding='utf8')

(< code>ignorelist文件可能也需要它)

 类似资料:
  • 我试图读取CSV文件,但它抛出了一个错误。我无法理解我的语法有什么问题,或者我是否需要向我的read_csv添加更多属性。 我试了一下这个解决办法 UnicodeDecodeError:“utf-8”编解码器无法解码位置21中的字节0x96:起始字节也无效。但它不起作用 [错误] UnicodeDecodeError回溯(最近一次调用)pandas/_libs/解析器。大熊猫中的pyx_图书馆。解

  • 我正在尝试阅读包含以下内容的pdf文件: 如果我打开它,它可以工作,但是如果我尝试使用编解码器.open(文件名,编码=“utf8”,mode=“rb”)来获取unicode字符串,我得到了以下异常: 您知道从此文件的内容中获取 unicode 字符串的方法吗? PS:我使用的是蟒蛇 2.7

  • 问题内容: 在Linux中,有一个文件,顾名思义就是管道。因此,假设我想使用Python从中读取前50个字节,然后运行以下代码: 我们可以看到打开文件的速度很快(如果拥有超级用户权限)-但是,如果那时文件为空,它将简单地阻塞(即使有内容,内容也将被转储,直到没有内容为止)。更多内容,然后该文件将再次阻止)。然后我必须按- 用… 中断Python脚本。 如何让Python 2.7读取超时? 也就是说

  • 我正在运行一个程序,可以处理30000个类似的文件。他们中的一些人正在停止并产生这个错误...

  • 问题内容: 是否可以用Python读取二进制MATLAB .mat文件? 我已经看到SciPy声称支持读取.mat文件,但是我没有成功。我安装了SciPy 0.7.0版,但找不到该方法。 问题答案: 需要导入,…

  • 问题内容: 这个问题已经在这里有了答案 : Python中的Windows路径 (5个答案) 4年前关闭。 追溯(最近一次通话): 产品中的文件“”,第1行= pd.read_csv(’C:\ amazon_baby.csv’) 在parser_f中的第562行的文件“ C:\ Users \ kvsn \ Anaconda3 \ lib \ site-packages \ pandas \ io