当前位置: 首页 > 面试题库 >

使用正则表达式(PCRE)匹配a ^ nb ^ nc ^ n(例如“ aaabbbccc”)

赵钊
2023-03-14
问题内容

众所周知的事实是,现代正则表达式实现(最著名的是PCRE)与正则语法的经典示例{a n b n ; n>
0}(例如aaabbb),使用此正则表达式(demo):

~^(a(?1)?b)$~

我的问题是:你能走多远?是否还可以使用PCRE 来解析上下文相关文法 {a n b n c n ; n> 0}(例如aaabbbccc)?


问题答案:

受NullUserExceptions答案的启发(他已经删除了,因为它在一种情况下失败了),我认为自己已经找到了解决方案:

$regex = '~^
    (?=(a(?-1)?b)c)
     a+(b(?-1)?c)
$~x';

var_dump(preg_match($regex, 'aabbcc'));    // 1
var_dump(preg_match($regex, 'aaabbbccc')); // 1
var_dump(preg_match($regex, 'aaabbbcc'));  // 0
var_dump(preg_match($regex, 'aaaccc'));    // 0
var_dump(preg_match($regex, 'aabcc'));     // 0
var_dump(preg_match($regex, 'abbcc'));     // 0

说明

如果您考虑不使用正向超前断言(该(?=...)部分)的正则表达式,则具有以下内容:

~^a+(b(?-1)?c)$~

这无非是检查是否存在任意数量的as,然后检查bs和cs的数量是否相等。

这还不能满足我们的语法要求,因为as
的数量也必须相同。我们可以通过检查as的数量等于s的数量来确保b。这就是前瞻断言中的表达式所做的:(a(?-1)?b)c。该c所以我们不只是匹配的一部分是必要b秒。

结论

我认为这令人印象深刻,这表明现代正则表达式不仅能够解析非常规语法,而且甚至可以解析非上下文无关的语法。希望这将解决“您不能使用正则表达式来执行X,因为X不规则”的无休止的模仿。



 类似资料:
  • 我们得到了一些这样的内容:

  • 有没有人试图描述与正则表达式匹配的正则表达式? 由于重复的关键字,这个主题几乎不可能在网上找到。 它可能在实际应用程序中不可用,因为支持正则表达式的语言通常具有解析它们的方法,我们可以将其用于验证,以及一种在代码中分隔正则表达式的方法,可用于搜索目的。 但是我仍然想知道匹配所有正则表达式的正则表达式是什么样子的。应该可以写一个。

  • 主要内容:基本模式匹配,字符簇,确定重复出现基本模式匹配 一切从最基本的开始。模式,是正则表达式最基本的元素,它们是一组描述字符串特征的字符。模式可以很简单,由普通的字符串组成,也可以非常复杂,往往用特殊的字符表示一个范围内的字符、重复出现,或表示上下文。例如: 这个模式包含一个特殊的字符 ^,表示该模式只匹配那些以 once 开头的字符串。例如该模式与字符串 "once upon a time" 匹配,与 "There once was

  • 问题内容: 当字符串以数字开头时,我需要匹配,然后是一个点,然后是一个空格和1个或多个大写字符。匹配必须发生在字符串的开头。我有以下字符串。 我尝试过的正则表达式是: 它不匹配。一个有效的正则表达式将对这个问题有什么作用? 问题答案: (对不起,我先前的错误。大脑现在坚定地投入了。嗯,也许。) 这有效: 分解: =字符串开头 =一个或多个数字 (之所以转义,是因为它在字符串中,因此) =文字(或者

  • 问题内容: 我从以下格式的文件中获取输入: 现在,我想在我的Java代码中读取int1,int2,int3和int4。我该如何在Java中使用正则表达式匹配。谢谢。 问题答案: 为了避免空值:

  • NowCoder 题目描述 请实现一个函数用来匹配包括 '.' 和 '*' 的正则表达式。模式中的字符 '.' 表示任意一个字符,而 '*' 表示它前面的字符可以出现任意次(包含 0 次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串 "aaa" 与模式 "a.a" 和 "ab*ac*a" 匹配,但是与 "aa.a" 和 "ab*a" 均不匹配。 解题思路 应该注意到,'.' 是