例如,如果我有一个 unicode 字符串,则可以将其编码为 ASCII 字符串,如下所示:
>>> u'\u003cfoo/\u003e'.encode('ascii')
'<foo/>'
但是,我有例如以下 ASCII 字符串:
'\u003foo\u003e'
…我想将其转换为与上述第一个示例相同的 ASCII 字符串:
'<foo/>'
我花了一些时间才弄清楚这一点,但此页面的最佳答案是:
>>> s = '\u003cfoo/\u003e'
>>> s.decode( 'unicode-escape' )
u'<foo/>'
>>> s.decode( 'unicode-escape' ).encode( 'ascii' )
'<foo/>'
还有一个“ raw-unicode-escape”编解码器,用于处理另一种指定Unicode字符串的方法-有关更多详细信息,请检查链接页面的“
Unicode构造函数”部分(因为我不是那么喜欢Unicode的人)。
编辑:另请参见Python标准编码。
我有一个统一码转义字符串: 我想将此字符串转换为unicode未转义的版本 我该怎么做?
问题内容: 我需要将unicode字符串转换为具有以unicode编码的非ascii字符的字符串。例如,字符串“汉字Max”应显示为“ \ u6F22 \ u5B57 Max”。 我尝试过的 的不同组合 新的String(sourceString.getBytes(encoding1),encoding2) Apache StringEscapeUtils也会转义ascii字符,例如双引号 Str
问题内容: 当我尝试使用“ unicode(head.contents [3])”获取标签的内容时,我得到类似于以下的输出:“ Christensen Sk \ xf6ld”。我希望转义序列作为字符串返回。如何在python中做? 问题答案: 假设Python将名称视为普通字符串,则首先必须将其解码为unicode: 实现此目的的另一种方法: 注意字符串前面的“ u”,表示它是未编码的。如果进行打
问题内容: 我现在正在尝试将unicode字体转换为android中的ascii。我写了下面的代码将unicode字体转换为ascii,但是失败了。因为转换后结果无法正确显示。 unicode字体=’ေနေကာင္းပါသလား’类似于’\ u100F \ u1039 \ u100D’ 问题答案: 使用java.text.Normalizer类将unicode转换为ascii。这是答案的示例代码h
问题内容: 我有一个Unicode转义的字符串: 我想将此字符串转换为unicode非转义版本 我该怎么做呢? 问题答案: 对其进行编码(使用任何编解码器,utf-8可能都可以),然后使用对其进行解码:
我需要读入带有unicode转义的标准ascii样式字符串,并将其转换为包含utf8编码等价物的std::字符串。因此,例如“\u03a0”(包含6个字符的std::字符串)应转换为包含两个字符的std::字符串,分别为0xCE和0xA0,以原始二进制格式。 如果有一个简单的答案使用icu或boost我会很高兴,但我还没有找到一个。 (这类似于将Unicode字符串转换为转义ASCII字符串,但注