我正在学习python中的正则表达式,但似乎无法掌握它的窍门。我正在尝试过滤掉英语中包含所有元音的所有单词,这是我的正则表达式:
r'\b(\S*[aeiou]){5}\b'
看起来它太模糊了,因为任何元音(即使是重复的)都可以出现在任何地方,任何数字都是时间,所以这是抛出像“可操作的”、“不幸的”这样的单词,这些单词的元音数是5,但不是所有的元音。我环顾互联网,发现了这个正则表达式:
r'[^aeiou]*a[^aeiou]*e[^aeiou]*i[^aeiou]*o[^aeiou]*u[^aeiou]*
但看起来,它只是为了元音的顺序出现,比我试图完成的任务相当有限。有人能在为我的问题制作正则表达式时“大声思考”吗?
我想不出一种简单的方法来用一个正则表达式找到“所有元音的单词”,但是通过and运算正则表达式分别匹配a、e、I、o和u可以很容易地做到这一点。例如,类似下面的Python脚本应该确定给定的英语单词是否包含所有元音(以任何顺序,任何多重性):
#! /usr/bin/python3
# all-vowels.py
import sys
import re
if len(sys.argv) != 2: sys.exit()
word=sys.argv[1]
if re.search(r'a', word) and re.search(r'e', word) and re.search(r'i', word) and re.search(r'o', word) and re.search(r'u', word):
print("Word has all vowels!")
else:
print("Word does NOT have all vowels.")
如果您计划将单词作为仅由英文字母组成的文本块进行匹配,您可以使用regex,如
\b(?=\w*?a)(?=\w*?e)(?=\w*?i)(?=\w*?o)(?=\w*?u)[a-zA-Z]+\b
查看正则表达式演示
要支持英语以外的语言,您可以将< code>[a-zA-Z] 替换为[^\W\d_]
。
如果您想要匹配的“单词”是一块非空白字符,您可以使用
(?<!\S)(?=\S*?a)(?=\S*?e)(?=\S*?i)(?=\S*?o)(?=\S*?u)\S+
请参阅此正则表达式演示。
使用原始字符串文字在Python中定义这些模式,例如:
rx_AllVowelWords = r'\b(?=\w*?a)(?=\w*?e)(?=\w*?i)(?=\w*?o)(?=\w*?u)[a-zA-Z]+\b'
详细资料
\b(?=\w*? a)(?=\w*? e)(?=\w*? i)(?=\w*? o)(?=\w*? u)[a-zA-Z]\b
:
\b
-一个单词边界,这里是一个起始单词边界(?=\w*? a)(?=\w*? e)(?=\w*? i)(?=\w*? o)(?=\w*? u)
-在检测到单词边界位置后立即触发的正查找头序列,并且需要在任何0个单词字符(字母、数字、下划线-您可以将\w*?
替换为[^\W\d_]*?
以仅检查字母)[a-zA-Z]
-1个或多个ASCII字母(替换为[^\W\d_]
以匹配所有字母)\b
-单词边界,这里是尾随单词边界第二个图案详情:
(?
问题内容: 我知道可以匹配一个单词,然后使用其他工具(例如grep -v)将匹配项反转。但是,是否可以hede使用正则表达式来匹配不包含特定单词的行? 输入: 码: 所需的输出: 问题答案: 正则表达式不支持逆匹配的说法并不完全正确。您可以使用否定环顾模仿此行为: 上面的正则表达式将匹配任何不包含(sub)字符串’hede’的字符串或没有换行符的行。如前所述,这是不是正则表达式是“好”的(或应该做
问题内容: 我正在使用Python,并且想在遇到句号(句号)或空格之前匹配所有单词。 目前,我正在使用: 上面的代码不匹配任何内容。我需要作为我的输出。 问题答案: 如果您只是从字符串中获取子集,我不明白为什么要使用正则表达式。 运作方式相同: 例: 正则表达式速度慢,设计笨拙且难以调试。肯定有occassions使用它,但如果你只是要提取的文本和,然后我不认为是这些场合之一。 参见:https
我想匹配单词的一部分,如果模式中单词的长度小于我匹配的字符串,则可以匹配,例如: 输出为true。但是,如果单词长度较大,则返回false,例如: 那么,我怎样才能只匹配单词的一部分呢?
问题内容: 我在为以下情况找到正确的正则表达式时遇到了麻烦: 可以说: 我想匹配整个单词-例如应该返回,因为这不是一个单词,并且应该返回,因为在左右两侧都没有字母字符。 问题答案: 尝试 从文档: 匹配空字符串,但仅匹配单词的开头或结尾。 请注意,该模块使用的简单定义作为“字母数字或下划线字符的序列”,其中“字母数字”取决于语言环境或选项。 另请注意,如果没有原始字符串前缀,则被视为“退格”,而不
软件-Adobe Professional XI 编程-用正则表达式匹配通配符的JavaScript 背景-我有多个带有标题栏的pdf图纸,使用java脚本,基于单词的位置添加数字签名字段(通过与regex匹配)。 目前正在测试,看看是否有文字出现在绘图标题块的修订版1中。 脚本搜索修订号1,后面是日期、标题(字数不同)和4组缩写。 数字1是静态的(日期、标题和首字母都是通配符,因为每个图形都不同
Perl6正则表达式匹配连接 它为False,因为连词中的“23”与$a中的“23”子字符串匹配,但此子字符串与连词中的“ef”不匹配。这有点违反直觉,因为它更容易解释$a ~~ m/23 如果我有n个正则表达式,我想看看是否所有这些n个正则表达式都匹配相同的整个字符串,而不是匹配整个字符串的相同子字符串部分,那么编写perl6表达式的最佳方法是什么? 在例子中,我真的想做 如果正则表达式的数量很