问题：

匹配包含所有元音的单词的正则表达式是什么？

章翔宇

2023-03-14

我正在学习python中的正则表达式，但似乎无法掌握它的窍门。我正在尝试过滤掉英语中包含所有元音的所有单词，这是我的正则表达式：

r'\b(\S*[aeiou]){5}\b'

看起来它太模糊了，因为任何元音（即使是重复的）都可以出现在任何地方，任何数字都是时间，所以这是抛出像“可操作的”、“不幸的”这样的单词，这些单词的元音数是5，但不是所有的元音。我环顾互联网，发现了这个正则表达式：

r'[^aeiou]*a[^aeiou]*e[^aeiou]*i[^aeiou]*o[^aeiou]*u[^aeiou]*

但看起来，它只是为了元音的顺序出现，比我试图完成的任务相当有限。有人能在为我的问题制作正则表达式时“大声思考”吗？

共有2个答案

汤弘文

2023-03-14

我想不出一种简单的方法来用一个正则表达式找到“所有元音的单词”，但是通过and运算正则表达式分别匹配a、e、I、o和u可以很容易地做到这一点。例如，类似下面的Python脚本应该确定给定的英语单词是否包含所有元音(以任何顺序，任何多重性):

#! /usr/bin/python3
# all-vowels.py
import sys
import re
if len(sys.argv) != 2: sys.exit()
word=sys.argv[1]
if re.search(r'a', word) and re.search(r'e', word) and re.search(r'i', word) and re.search(r'o', word) and re.search(r'u', word):
   print("Word has all vowels!")
else:
   print("Word does NOT have all vowels.")

仲孙善

2023-03-14

如果您计划将单词作为仅由英文字母组成的文本块进行匹配，您可以使用regex，如

\b(?=\w*?a)(?=\w*?e)(?=\w*?i)(?=\w*?o)(?=\w*?u)[a-zA-Z]+\b

查看正则表达式演示

要支持英语以外的语言，您可以将< code>[a-zA-Z] 替换为[^\W\d_] 。

如果您想要匹配的“单词”是一块非空白字符，您可以使用

(?<!\S)(?=\S*?a)(?=\S*?e)(?=\S*?i)(?=\S*?o)(?=\S*?u)\S+

请参阅此正则表达式演示。

使用原始字符串文字在Python中定义这些模式，例如：

rx_AllVowelWords = r'\b(?=\w*?a)(?=\w*?e)(?=\w*?i)(?=\w*?o)(?=\w*?u)[a-zA-Z]+\b'

详细资料

\b（？=\w*？ a）（？=\w*？ e）（？=\w*？ i）（？=\w*？ o）（？=\w*？ u）[a-zA-Z]\b：
- \b-一个单词边界，这里是一个起始单词边界
- （？=\w*？ a）（？=\w*？ e）（？=\w*？ i）（？=\w*？ o）（？=\w*？ u）-在检测到单词边界位置后立即触发的正查找头序列，并且需要在任何0个单词字符（字母、数字、下划线-您可以将\w*？替换为[^\W\d_]*? 以仅检查字母）
- [a-zA-Z]-1个或多个ASCII字母（替换为[^\W\d_]以匹配所有字母）
- \b-单词边界，这里是尾随单词边界
第二个图案详情：
- （？

匹配包含所有元音的单词的正则表达式是什么？

共有2个答案

相关问答

相关文章

相关阅读

相关工具

相关文档