我目前正在学习Python,遇到了以下错误:
Traceback (most recent call last):
File "file.py", line 22, in module
for word in file.read():
File "C:\Users\user\AppData\Local\Continuum\Anaconda3\lib\encodings\cp1252.py" line 23, in decode
return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 6552: character maps to undefined
这是我的代码:
file=open('xyz.txt')
dict={}
ignorelist=set( line.strip() for line in open('ignorelist'))
for word in file.read():
word = word.replace(".","")
word = word.replace(",","")
if word not in ignorelist:
if word not in dict:
dict[word] = 1
else:
dict[word] += 1
d=collections.Counter(dict)
for word, count in d.most_common(10):
print(word, ": ", count)
为什么会出现这种情况?
您能否通过指定编码来尝试此更改:
file=open('xyz.txt', encoding='utf8')
(< code>ignorelist文件可能也需要它)
我试图读取CSV文件,但它抛出了一个错误。我无法理解我的语法有什么问题,或者我是否需要向我的read_csv添加更多属性。 我试了一下这个解决办法 UnicodeDecodeError:“utf-8”编解码器无法解码位置21中的字节0x96:起始字节也无效。但它不起作用 [错误] UnicodeDecodeError回溯(最近一次调用)pandas/_libs/解析器。大熊猫中的pyx_图书馆。解
我正在尝试阅读包含以下内容的pdf文件: 如果我打开它,它可以工作,但是如果我尝试使用编解码器.open(文件名,编码=“utf8”,mode=“rb”)来获取unicode字符串,我得到了以下异常: 您知道从此文件的内容中获取 unicode 字符串的方法吗? PS:我使用的是蟒蛇 2.7
问题内容: 在Linux中,有一个文件,顾名思义就是管道。因此,假设我想使用Python从中读取前50个字节,然后运行以下代码: 我们可以看到打开文件的速度很快(如果拥有超级用户权限)-但是,如果那时文件为空,它将简单地阻塞(即使有内容,内容也将被转储,直到没有内容为止)。更多内容,然后该文件将再次阻止)。然后我必须按- 用… 中断Python脚本。 如何让Python 2.7读取超时? 也就是说
我正在运行一个程序,可以处理30000个类似的文件。他们中的一些人正在停止并产生这个错误...
问题内容: 是否可以用Python读取二进制MATLAB .mat文件? 我已经看到SciPy声称支持读取.mat文件,但是我没有成功。我安装了SciPy 0.7.0版,但找不到该方法。 问题答案: 需要导入,…
问题内容: 这个问题已经在这里有了答案 : Python中的Windows路径 (5个答案) 4年前关闭。 追溯(最近一次通话): 产品中的文件“”,第1行= pd.read_csv(’C:\ amazon_baby.csv’) 在parser_f中的第562行的文件“ C:\ Users \ kvsn \ Anaconda3 \ lib \ site-packages \ pandas \ io