当前位置: 首页 > 知识库问答 >
问题:

正则表达式-捕获组与字符类的变化

鲜于勇
2023-03-14

我正在研究regexone.com的问题6,我不明白分组是如何与“改变”一起工作的。

这是测试字符串:

                The quick brown fox...

任务是捕捉快速的棕色狐狸没有额外的空白,这可以通过^\s*([\w\s.]*)\s*$完成。

但是^\s*(\w|\s|\.)*\s*$捕获了一组'.'([27-28])为什么?结果,^\s*((\w|\s|\.)*)\s*$捕获了两组-敏捷的棕色狐狸...[6-28]和'.'([27-28])。

分组是如何工作的?除了字符类按字符匹配而更改按单词匹配(我的基本理解)之外,处理更改和字符类还有什么区别?

注:当我甚至不知道这些问题的名称时,我应该如何搜索文档,比如关于这些问题的信息?

共有2个答案

燕嘉熙
2023-03-14

每个捕获组捕获与该组匹配的字符串((\w|\s|\.)*)匹配快速...,因此它正确设置捕获的字符串。但是(\w|\s|\.)匹配多次,每个字符匹配一次;捕获的字符串是最后一个匹配项,即文本末尾的.

薛元忠
2023-03-14

^\s*(\w |\s |\)*\s*$捕获一组“.”([27-28])为什么?

原因是捕获组将匹配的文本存储在一种缓冲区或堆栈中。*量词使正则表达式引擎重复捕获无限次,并在每次重写缓冲区中的值时将每个字母数字、空格或点写入该缓冲区。

^\s*((?:\w |\s |\)*)\s*$有两个捕获组,因此它将整个文本捕获到组1中(与外部(…) ),第二个捕获组存储交替中的字符,这些字符逐个匹配,第二个缓冲区中只剩下最后一个符号。

解决方案是使用非捕获组进行替换,使用捕获组进行所有找到的子匹配:^\s*((?:\w |\s |\)*)\s*$

注意这是非常低效的!尽可能使用字符类(即([\w\s.]*))。

 类似资料:
  • 我只想在空格字符()后面跟一个哈希()时匹配空格字符。 这就是下面的试图做的,这是一个捕获组。(我试图避开括号,否则括号在组集中无法正确识别)。然而,这是行不通的。 下面的正则表达式 符合以下所有条件 而我想分别搭配和 有没有办法在字符集中指定捕获组?

  • 假设我有这个虚拟URL,我需要提取植物及其颜色作为 下面的I have正在按预期捕获我需要的元素,但是当我的URL中的植物少于4株时,它无法捕获任何东西。底部有一个指向regex测试员的链接,其中有示例代码和URL,您可以使用。 如何修改这个正则表达式,使其动态工作,从而在不需要静态URL结构的情况下捕获可用内容。现在,假设我最多只能捕获4株植物(8组) https://regex101.com/

  • 本文向大家介绍PHP正则表达式之捕获组与非捕获组,包括了PHP正则表达式之捕获组与非捕获组的使用技巧和注意事项,需要的朋友参考一下 今天遇到一个正则匹配的问题,忽然翻到有捕获组的概念,手册上也是一略而过,百度时无意翻到C#和Java中有对正则捕获组的特殊用法,搜索关键词有PHP时竟然没有相关内容,自己试了一下,发现在PHP中也是可行的,于是总结一下,分享的同时也希望有大神和细心的学习者找到我理解中

  • 问题内容: 我正在尝试使用Java expr在:之后捕获正确的部分,但是在以下代码中,打印的捕获组是整个字符串,怎么了? 问题答案: 子组的编号从1开始,全文为0。只需循环执行count + 1。

  • 在Python中,如何在非捕获组中捕获组?换句话说,如何重复包含捕获组的非捕获子模式? 例如,捕获导入字符串上的所有包名。例如,字符串: 导入熊猫、操作系统、系统 将返回“pandas”、“os”和“sys”。下面的模式捕获第一个包并到达第二个包: 从这里,我想重复捕获组并匹配以下字符的子模式,即。当我用一个非捕获组包围这个子模式并重复它时: 它不再捕捉里面的群体。

  • 问题内容: 我有以下一行, 我需要拿这个词ABC, 我写了以下代码片段, 所以,如果我说得到,ABC:但是如果我说是ABC,那么我想知道 这是什么和意味着什么呢?如果有人可以用很好的例子向我解释,那会更好。 正则表达式模式中包含一个:,为什么结果忽略了它?组1是否检测到括号内的所有单词? 因此,如果我再加上两个括号,例如:,那么会有两个小组吗?group(1)将退还零件并退还零件? 给出该代码段的