当前位置: 首页 > 面试题库 >

如何在python中取消对urlencoded unicode字符串的引用?

周育
2023-03-14
问题内容

我有一个类似“Tanım”的Unicode字符串,以某种方式编码为“
Tan%u0131m”。我如何将这个编码后的字符串转换回原始的unicode。显然urllib.unquote不支持unicode。


问题答案:

%uXXXX是一种非标准的编码方案,尽管实施仍继续存在于JavaScript领域,但已被w3c拒绝。

更常见的技术似乎是对字符串进行UTF-8编码,然后使用%XX使用%XX转义所得到的字节。urllib.unquote支持此方案:

>>> urllib2.unquote("%0a")
'\n'

不幸的是,如果您确实 需要
支持%uXXXX,则可能必须安装自己的解码器。否则,简单地以UTF-8编码您的unicode,然后%转义所得到的字节,可能会更可取。

一个更完整的示例

>>> u"Tanım"
u'Tan\u0131m'
>>> url = urllib.quote(u"Tanım".encode('utf8'))
>>> urllib.unquote(url).decode('utf8')
u'Tan\u0131m'


 类似资料:
  • 我有一个统一码转义字符串: 我想将此字符串转换为unicode未转义的版本 我该怎么做?

  • 问题内容: 有没有一种方法可以在Python中对字符串进行子字符串化,以从第三个字符到字符串末尾获取新的字符串? 也许喜欢吗? 如果离开第二部分意味着“直到最后”,而如果离开第一部分,它是否从头开始? 问题答案: Python称这个概念为“切片”,它不仅适用于字符串,还适用于更多的领域。看看这里的一个全面的介绍。

  • 问题内容: 如何将(度)字符转换为字符串? 问题答案: 将此行放在源代码的顶部 如果您的编辑器使用其他编码,请替换为utf-8 然后,您可以直接在源代码中包含utf-8字符

  • 本文向大家介绍如何在Python中取消转义的反斜杠字符串?,包括了如何在Python中取消转义的反斜杠字符串?的使用技巧和注意事项,需要的朋友参考一下 有两种方法可以在Python中转义反斜杠转义的字符串。首先是使用literal_eval评估字符串。请注意,在此方法中,您需要将字符串用另一层引号引起来。例如: 另一种方法是使用字符串类中的decode('string_escape')方法。例如,

  • 在编写以下代码时,无法取消对字符的引用错误 在线if(A. charAt(i-1). equals(B. charAt(j-1)))

  • 问题内容: 我将提取字符串中包含的所有数字。哪个更适合pur 例: 结果: 问题答案: 如果只想提取正整数,请尝试以下操作: 我认为这比正则表达式示例更好,原因有三点。首先,你不需要其他模块;其次,它更具可读性,因为你无需解析迷你语言;第三,它更快(因此可能更): 这将无法识别浮点数,负整数或十六进制格式的整数。如果你不能接受这些限制,则可以通过以下亭亭玉立的答案解决问题。