当前位置：首页 > 面试题库 >

在Python中，如何列出与POSIX扩展正则表达式[[：space：]`匹配的所有字符？

楚威

2023-03-14

问题内容：

在Python中，如何列出POSIX扩展正则表达式匹配的所有字符[:space:]？

有没有一种编程的方法来提取覆盖的Unicode代码点[:space:]？

问题答案：

使用生成器代替列表推导，而xrange不是range：

>>> s = u''.join(unichr(c) for c in xrange(0x10ffff+1))
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "<stdin>", line 1, in <genexpr>
ValueError: unichr() arg not in range(0x10000) (narrow Python build)

哎呀：一般使用sys.maxunicode。

>>> s = u''.join(unichr(c) for c in xrange(sys.maxunicode+1))
>>> import re
>>> re.findall(r'\s', s)
[u'\t', u'\n', u'\x0b', u'\x0c', u'\r', u' ']

糟糕：嗯，“不间断空间”等如何？

>>> re.findall(r'\s', s, re.UNICODE)
[u'\t', u'\n', u'\x0b', u'\x0c', u'\r', u'\x1c', u'\x1d', u'\x1e', u'\x1f', u' '
, u'\x85', u'\xa0', u'\u1680', u'\u180e', u'\u2000', u'\u2001', u'\u2002', u'\u2
003', u'\u2004', u'\u2005', u'\u2006', u'\u2007', u'\u2008', u'\u2009', u'\u200a
', u'\u2028', u'\u2029', u'\u202f', u'\u205f', u'\u3000']

那是什么东西？unicodedata.name是你的朋友：

>>> from unicodedata import name
>>> for c in re.findall(r'\s', s, re.UNICODE):
...     print repr(c), name(c, '')
...
u'\t'
u'\n'
u'\x0b'
u'\x0c'
u'\r'
u'\x1c'
u'\x1d'
u'\x1e'
u'\x1f'
u' ' SPACE
u'\x85'
u'\xa0' NO-BREAK SPACE
u'\u1680' OGHAM SPACE MARK
u'\u180e' MONGOLIAN VOWEL SEPARATOR
u'\u2000' EN QUAD
u'\u2001' EM QUAD
u'\u2002' EN SPACE
u'\u2003' EM SPACE
u'\u2004' THREE-PER-EM SPACE
u'\u2005' FOUR-PER-EM SPACE
u'\u2006' SIX-PER-EM SPACE
u'\u2007' FIGURE SPACE
u'\u2008' PUNCTUATION SPACE
u'\u2009' THIN SPACE
u'\u200a' HAIR SPACE
u'\u2028' LINE SEPARATOR
u'\u2029' PARAGRAPH SEPARATOR
u'\u202f' NARROW NO-BREAK SPACE
u'\u205f' MEDIUM MATHEMATICAL SPACE
u'\u3000' IDEOGRAPHIC SPACE

类似资料：

Posix正则表达式捕获组匹配序列

我在一个c程序中有以下文本字符串和regex模式：多谢了。
与正则表达式匹配的正则表达式

有没有人试图描述与正则表达式匹配的正则表达式？由于重复的关键字，这个主题几乎不可能在网上找到。它可能在实际应用程序中不可用，因为支持正则表达式的语言通常具有解析它们的方法，我们可以将其用于验证，以及一种在代码中分隔正则表达式的方法，可用于搜索目的。但是我仍然想知道匹配所有正则表达式的正则表达式是什么样子的。应该可以写一个。
在python正则表达式中匹配unicode字符

问题内容：我已经阅读了Stackoverflow上的其他问题，但还没有结束。抱歉，如果已经可以回答，但是我没有任何建议在那里工作。一切都很好，然后我尝试使用其中包含挪威字符的内容（或更像unicode的内容）：如何匹配øæå等典型的unicode字符？我希望能够同时在上述标记组和文件名标记组中匹配这些字符。问题答案：您需要指定标志，并使用前缀将您的字符串输入为Unicode字符串：
如何在python中找到所有可能的正则表达式匹配？

我试图用python及其正则表达式找到所有可能的单词/标记对或其他嵌套组合。寻找：我认为正则表达式也可以找到嵌套的括号单词/标记对，但它不返回它们。我该怎么做？
正则表达式不匹配所有数字与分隔符

以下模式需要一个组合正则表达式：其中带数字的分隔符可以是空格（）、减号（-）、句点（.），反斜杠（\），等于（=）。一种情况是，一个以上的分隔符（相同或不同类型）不能与任意两位数字同时出现一次以上。有效号码- 一个有效的输入是，只要没有两个相邻的分隔符，就有16位数字被任意/无分隔符分隔。我们想出了以下正则表达式：它与某些模式不匹配。例如：对于相同的数字，它匹配（如预期的）以下模式：分
查找与正则表达式golang匹配的所有字符串

问题内容：我试图返回一个数组或切片，针对字符串针对特定正则表达式的所有匹配项。字符串是：我想返回一个花括号之间所有字符串都匹配的数组。我尝试使用regexp软件包来完成此操作，但无法弄清楚如何返回我要查找的内容。这是我当前的代码：但是，无论我尝试什么，每次返回的结果都是一片空白。问题答案：首先，您不需要正则表达式定界符。其次，使用原始字符串文字定义一个正则表达式模式是个好主意，您只需要使

相关阅读

如何在python中找到所有可能的正则表达式匹配项？Python正则表达式匹配字符串中的数字如何从正则表达式生成与正则表达式匹配的文本？在python正则表达式中匹配括号找出正则表达式在Python字符串中匹配多少次

相关文章

Scala 正则表达式 Perl 正则表达式 Ruby 正则表达式 MongoDB正则表达式 C#正则表达式

相关问答

如何在Bash中将字符串与正则表达式匹配？与模式匹配的正则表达式打印出与Java中的正则表达式匹配的字符串？Pact：如何匹配键与正则表达式匹配的对象？>>正则表达式匹配

相关工具

正则表达式测试器 WizTools.org正则表达式测试工具中国天气预报与万年历Chrome扩展 Chromium Updater 扩展 Tweetmeme Chrome 扩展

相关文档

正则表达式 Python 正则表达式操作指南正则表达式（regular expression）Java 正则表达式教程 java.util.regex 正则表达式中文教程