我只是尝试解码类似\ uXXXX \ uXXXX \ uXXXX的字符串。但我得到一个错误:
$ python
Python 2.7.6 (default, Sep 9 2014, 15:04:36)
[GCC 4.2.1 Compatible Apple LLVM 6.0 (clang-600.0.39)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> print u'\u041e\u043b\u044c\u0433\u0430'.decode('utf-8')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/encodings/utf_8.py", line 16, in decode
return codecs.utf_8_decode(input, errors, True)
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-4: ordinal not in range(128)
我是Python新手。怎么了 谢谢!
Python试图提供帮助。您 无法解码 Unicode数据,因为它已经被解码。因此,Python首先将对数据 进行编码
(使用ASCII编解码器)以获取要解码的字节。正是这种隐式编码失败。
如果您具有Unicode数据,则仅将其 编码 为UTF-8是有意义的,而不能解码:
>>> print u'\u041e\u043b\u044c\u0433\u0430'
Ольга
>>> u'\u041e\u043b\u044c\u0433\u0430'.encode('utf8')
'\xd0\x9e\xd0\xbb\xd1\x8c\xd0\xb3\xd0\xb0'
如果需要Unicode值,则只需使用Unicode文字(u'...'
)。无需进一步解码。
相同的隐式转换发生在另一个方向。如果您尝试对字节串进行编码,则会触发隐式解码:
>>> u'\u041e\u043b\u044c\u0433\u0430'.encode('utf8').encode('utf8')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeDecodeError: 'ascii' codec can't decode byte 0xd0 in position 0: ordinal not in range(128)
问题内容: 我想解析我的XML文档。所以我将我的XML文档存储如下 现在我的下面是我的代码 我低于错误 问题答案: 看来您要达到UTF-8字节顺序标记(BOM)。尝试使用此Unicode字符串并提取出BOM: 我使用而不是因为在您的情况下您可能多次出现BOM表,这可能是由于串联的文件内容引起的。
我目前正在使用Django countries为表单字段获取ISO国家名称列表。它在我的网站上显示时没有错误,但在Django的管理网站上,由于存在非ASCII国家名称,它会导致上述错误: Unicode错误提示:无法编码/解码的字符串是:itan 我已经读到类似的问题可以通过属性来解决,但是如果不接触Django Admin本身,这似乎不是很可行。如果有人能解决这个问题,我将不胜感激。 Mode
当我测试从twitter上的数据挖掘时,我有一个麻烦,我通过Word搜索数据。 It错误 为什么会有这样的问题?
问题内容: 我在处理从不同网页(在不同站点上)获取的文本中的字符时遇到问题。我正在使用。 问题是该错误并不总是可重现的。它有时可以在某些页面上使用,有时它会通过抛出来发声。我已经尝试了几乎所有我能想到的东西,但是我没有发现任何能正常工作而不抛出某种与相关的错误的东西。 导致问题的代码部分之一如下所示: 这是运行上述代码段时在某些字符串上生成的堆栈跟踪: 我怀疑这是因为某些页面(或更具体地说,来自某
问题内容: 当上传具有非ASCII字符的文件时,出现UnicodeEncodeError: 我使用MySQL,nginx和FastCGI运行Django 1.2。 根据Django Trac数据库,这是已解决的问题,但是我仍然有问题。欢迎提供有关如何修复的任何建议。 编辑:这是我的图像字段: 问题答案: 在对此进行更多调查之后,我发现我尚未在我的主要Nginx配置文件中设置字符集: 通过添加以上内
问题内容: 我的python(2.7版)脚本运行良好,可以从本地html文件中获取一些公司名称,但是当涉及到某些特定的国家/地区名称时,则会出现此错误“UnicodeEncodeError:’ascii’编解码器无法编码字符” 此公司名称到来时特别出错 公司名称: KühlfixKälteanlagenIng。Gerhard Doczekal&Co. KG 链接无法处理 错误显示在这行代码中: 问