当前位置: 首页 > 面试题库 >

正则表达式匹配不包含单词的行

东郭勇
2023-03-14
问题内容

我知道可以匹配一个单词,然后使用其他工具(例如grep -v)将匹配项反转。但是,是否可以hede使用正则表达式来匹配不包含特定单词的行?

输入:

hoho
hihi
haha
hede

码:

grep "<Regex for 'doesn't contain hede'>" input

所需的输出:

hoho
hihi
haha

问题答案:

正则表达式不支持逆匹配的说法并不完全正确。您可以使用否定环顾模仿此行为:

^((?!hede).)*$

上面的正则表达式将匹配任何不包含(sub)字符串’hede’的字符串或没有换行符的行。如前所述,这是不是正则表达式是“好”的(或应该做的),但是,它仍然是可能的。

如果还需要匹配换行符,请使用DOT-ALL修饰符(s以下模式的结尾):

/^((?!hede).)*$/s

或内联使用:

/(?s)^((?!hede).)*$/

(其中/…/是regex分隔符,即不属于模式的一部分)

如果DOT-ALL修饰符不可用,则可以使用字符类模仿相同的行为[\s\S]:

/^((?!hede)[\s\S])*$/

说明
字符串只是n字符列表。每个字符之前和之后都有一个空字符串。因此,n字符列表将包含n+1空字符串。考虑字符串”ABhedeCD”:

    ┌──┬───┬──┬───┬──┬───┬──┬───┬──┬───┬──┬───┬──┬───┬──┬───┬──┐
S = │e1│ A │e2│ B │e3│ h │e4│ e │e5│ d │e6│ e │e7│ C │e8│ D │e9│
    └──┴───┴──┴───┴──┴───┴──┴───┴──┴───┴──┴───┴──┴───┴──┴───┴──┘

index    0      1      2      3      4      5      6      7

其中e的是空字符串。正则表达式会(?!hede).向前看,看是否没有子字符串”hede”可以看到,如果是这种情况(可以看到其他情况),则.(点)将匹配除换行符以外的任何字符。环顾四周也称为零宽度断言,因为它们不占用任何字符。他们仅声明/验证某些内容。

因此,在我的示例中,”hede”在.(点)占用字符之前,首先对每个空字符串进行验证,以查看是否没有前面的字符串。正则表达式(?!hede).会做一次,所以它被包裹在一组,重复零次或多次:((?!hede).)*。最后,锚定输入的开始和结束以确保使用了整个输入:^((?!hede).)*$

如您所见,输入"ABhedeCD"将失败,因为on上e3的regex(?!hede)失败了(正 “hede”前方!)。



 类似资料:
  • 软件-Adobe Professional XI 编程-用正则表达式匹配通配符的JavaScript 背景-我有多个带有标题栏的pdf图纸,使用java脚本,基于单词的位置添加数字签名字段(通过与regex匹配)。 目前正在测试,看看是否有文字出现在绘图标题块的修订版1中。 脚本搜索修订号1,后面是日期、标题(字数不同)和4组缩写。 数字1是静态的(日期、标题和首字母都是通配符,因为每个图形都不同

  • 问题内容: 我在为以下情况找到正确的正则表达式时遇到了麻烦: 可以说: 我想匹配整个单词-例如应该返回,因为这不是一个单词,并且应该返回,因为在左右两侧都没有字母字符。 问题答案: 尝试 从文档: 匹配空字符串,但仅匹配单词的开头或结尾。 请注意,该模块使用的简单定义作为“字母数字或下划线字符的序列”,其中“字母数字”取决于语言环境或选项。 另请注意,如果没有原始字符串前缀,则被视为“退格”,而不

  • 我想匹配单词的一部分,如果模式中单词的长度小于我匹配的字符串,则可以匹配,例如: 输出为true。但是,如果单词长度较大,则返回false,例如: 那么,我怎样才能只匹配单词的一部分呢?

  • 我正在学习python中的正则表达式,但似乎无法掌握它的窍门。我正在尝试过滤掉英语中包含所有元音的所有单词,这是我的正则表达式: 看起来它太模糊了,因为任何元音(即使是重复的)都可以出现在任何地方,任何数字都是时间,所以这是抛出像“可操作的”、“不幸的”这样的单词,这些单词的元音数是5,但不是所有的元音。我环顾互联网,发现了这个正则表达式: 但看起来,它只是为了元音的顺序出现,比我试图完成的任务相

  • Perl6正则表达式匹配连接 它为False,因为连词中的“23”与$a中的“23”子字符串匹配,但此子字符串与连词中的“ef”不匹配。这有点违反直觉,因为它更容易解释$a ~~ m/23 如果我有n个正则表达式,我想看看是否所有这些n个正则表达式都匹配相同的整个字符串,而不是匹配整个字符串的相同子字符串部分,那么编写perl6表达式的最佳方法是什么? 在例子中,我真的想做 如果正则表达式的数量很

  • 有没有人试图描述与正则表达式匹配的正则表达式? 由于重复的关键字,这个主题几乎不可能在网上找到。 它可能在实际应用程序中不可用,因为支持正则表达式的语言通常具有解析它们的方法,我们可以将其用于验证,以及一种在代码中分隔正则表达式的方法,可用于搜索目的。 但是我仍然想知道匹配所有正则表达式的正则表达式是什么样子的。应该可以写一个。