当前位置: 首页 > 面试题库 >

在Python中解码双重编码的utf8

强硕
2023-03-14
问题内容

我通过xmlrpc从我的一个客户那里获得的字符串有问题。他给我发送了两次编码的utf8字符串:(因此,当我在python中获取它们时,我有一个unicode对象,该对象必须再解码一次,但显然python不允许这样做。我注意到我的客户端但是我需要在修复之前先进行快速解决。

来自tcp转储的原始字符串:

<string>Rafa\xc3\x85\xc2\x82</string>

它将转换为:

u'Rafa\xc5\x82'

我们得到的最好的是:

eval(repr(u'Rafa\xc5\x82')[1:]).decode("utf8")

结果是正确的字符串,它是:

u'Rafa\u0142'

但是,这很丑陋,不能在生产代码中使用。如果有人知道如何以更合适的方式解决此问题,请写信。谢谢克里斯


问题答案:
>>> s = u'Rafa \ xc5 \ x82'
>>> s.encode('raw_unicode_escape')。decode('utf-8')
u'Rafa \ u0142'
>>>


 类似资料:
  • 问题内容: 我正在针对似乎渴望返回双重UTF-8编码字符串的应用程序进行工作。 我发送使用UTF-8编码的字符串,因此变成(等于)。 服务器 应 仅回显我发送的内容,但返回以下内容:(应为)。如果我将其解码采用变,使用UTF-8,它看起来像一个......的unicode字符串,包含原始字符串编码。 但是Python不允许我在不重新编码的情况下解码unicode字符串-由于某种原因而失败,这使我逃

  • 问题内容: 我用python脚本下载了一个网页。在大多数情况下,这可以正常工作。 但是,这个有一个响应标头:GZIP编码,当我尝试打印此网页的源代码时,它的腻子中包含所有符号。 如何将其解码为普通文本? 问题答案: 我使用zlib从Web解压缩压缩的内容。

  • 问题内容: 我正在尝试检查许多网站的页面上是否有某个单词。该脚本可以在15个站点上正常运行,然后停止。 UnicodeDecodeError:’utf8’编解码器无法解码位置15344处的字节0x96:无效的起始字节 我在stackoverflow上进行了搜索,发现了很多问题,但似乎无法理解我的情况出了什么问题。 我想解决它,或者如果有错误,请跳过该站点。请为我提供新手建议,下面的代码本身花了我一

  • 问题内容: 这个问题已经在这里有了答案 : Unicode错误序数不在范围内 (1个答案) 3年前关闭。 我只是无法了解其功能以及如何在python2.7上工作 我尝试了以下声明 直到这里,我认为这很清楚;将Unicode代码转换为相应的utf-8 / 16/32字节字符串。 但是当我编写代码时: 为什么在unicode类型上的含义?为什么第一个(使用utf8)而不是后者可以工作?是因为pytho

  • 我正在尝试提交一个包含UTF-8字符的表单。 问题是,在查询日志中,日语字符是乱码的,从响应来看,它们似乎是双重编码的(UTF-8)。 如果我使用GET而不是POST,一切都会正常。谁能帮帮我吗?这在哪里得到双重编码?我该怎么修?

  • 问题内容: 如何在Python中的ut8mb4中编码内容? 我有两组数据:正在从Parse迁移到新的MySQL数据库的数据,以及向前传输的数据(仅与新数据库通信)。我的数据库是utf8mb4,用于存储表情符号和带重音的字母。 当我使用python脚本时,第一组数据仅能正确显示(涉及表情符号和重音符号时): 并且在PHP中从MySQL数据库读取时: 当我不包含第二部分数据时,仅能正确显示第二组数据(