当前位置: 首页 > 面试题库 >

如何在Python中找出Unicode字符的编号/名称?

周阳成
2023-03-14
问题内容

在Python中:

>>>"\N{BLACK SPADE SUIT}"
>>>'♠'
>>>"\u2660"
>>>'♠'

现在,假设我有一个不知道其名称或编号的字符。是否有Python函数提供以下信息:

>>>wanted_function('♠')
>>>["BLACK SPADE SUIT", "u2660"]


问题答案:

您可能会发现unicodedata模块很方便:

>>> s = "\N{BLACK SPADE SUIT}"
>>> s
'♠'
>>> import unicodedata
>>> unicodedata.name(s)
'BLACK SPADE SUIT'
>>> ord(s)
9824
>>> hex(ord(s))
'0x2660'


 类似资料:
  • 问题内容: 给定一个Unicode字符,返回其脚本的最简单方法是什么(如“ Latin”,“ Hangul”等)?unicodedata似乎没有提供这种功能。 问题答案: 我希望有人以前做过,但是显然没有,所以这就是我最后的目的。下面的模块(我称它为)进行了扩展,并提供了它为unicode char返回一个元组(脚本名称,类别)。例: 模块:https://gist.github.com/2204

  • 问题内容: 这是我可以创建的最简单的代码来显示我的问题。轴标签符号原意是六点星形,但显示为方框。如何更改它以便显示星星?我尝试添加评论: 像以前的答案一样,但是它不起作用,或者使用或也不起作用。帮助将不胜感激。 问题答案: 您需要一种具有给定Unicode字符的字体,STIX字体应包含星号。您需要找到或下载STIX字体,当然,使用给定符号的任何其他ttf文件也应该可以。

  • 问题内容: 例如,我有一个这样的文件名-проба.xml,但无法从PHP脚本中打开它。 如果我将php脚本设置为utf-8,则脚本中的所有文本均为utf-8,因此当我将其传递给file_get_contents时: 我收到文件不存在的错误。这样做的原因是,在Windows(XP)中,所有带有非拉丁字符的文件名都是Unicode(UTF-16)。好,所以我尝试了这个: 但是错误仍然存​​在,因为f

  • 问题内容: 我正在处理python-lastfm库返回的unicode字符串。 我假设在途中某个地方,该库获取了错误的编码,并返回了可能包含无效字符的unicode字符串。 例如,我期望变量a中的原始字符串为“G​​lück” \ xfc是转义值252,它对应于latin1编码的“ü”。它以某种方式以python无法自行处理的方式嵌入到unicode字符串中。 如何将其转换回包含原始“Glück”

  • 问题内容: 当我尝试使用“ unicode(head.contents [3])”获取标签的内容时,我得到类似于以下的输出:“ Christensen Sk \ xf6ld”。我希望转义序列作为字符串返回。如何在python中做? 问题答案: 假设Python将名称视为普通字符串,则首先必须将其解码为unicode: 实现此目的的另一种方法: 注意字符串前面的“ u”,表示它是未编码的。如果进行打

  • 问题内容: 我有一个字符串,该字符串是通过阅读HTML网页获得的,其中包含带有项目符号的项目符号,该项目符号带有“•”之类的符号。请注意,该文本是使用Python 2.7的网页的HTML来源。 我知道项目符号字符的unicode字符为,但是实际上如何用其他东西替换该unicode字符呢? 我试着做 但它似乎不起作用…我该怎么做? 问题答案: 将字符串解码为Unicode。假设它是UTF-8编码的: