正则表达式-捕获组与字符类的变化

鲜于勇

2023-03-14

我正在研究regexone.com的问题6，我不明白分组是如何与“改变”一起工作的。

这是测试字符串：

                The quick brown fox...

任务是捕捉快速的棕色狐狸没有额外的空白，这可以通过^\s*（[\w\s.]*）\s*$完成。

但是^\s*（\w|\s|\.）*\s*$捕获了一组'.'（[27-28]）为什么？结果，^\s*（（\w|\s|\.)*)\s*$捕获了两组-敏捷的棕色狐狸...[6-28]和'.'（[27-28]）。

分组是如何工作的？除了字符类按字符匹配而更改按单词匹配（我的基本理解）之外，处理更改和字符类还有什么区别？

注：当我甚至不知道这些问题的名称时，我应该如何搜索文档，比如关于这些问题的信息？

共有2个答案

燕嘉熙

2023-03-14

每个捕获组捕获与该组匹配的字符串。（（\w|\s|\.)*)匹配快速...，因此它正确设置捕获的字符串。但是（\w|\s|\.）匹配多次，每个字符匹配一次；捕获的字符串是最后一个匹配项，即文本末尾的.。

薛元忠

2023-03-14

^\s*（\w |\s |\）*\s*$捕获一组“.”（[27-28]）为什么？

原因是捕获组将匹配的文本存储在一种缓冲区或堆栈中。*量词使正则表达式引擎重复捕获无限次，并在每次重写缓冲区中的值时将每个字母数字、空格或点写入该缓冲区。

^\s*（（？：\w |\s |\）*）\s*$有两个捕获组，因此它将整个文本捕获到组1中（与外部（…）），第二个捕获组存储交替中的字符，这些字符逐个匹配，第二个缓冲区中只剩下最后一个符号。

解决方案是使用非捕获组进行替换，使用捕获组进行所有找到的子匹配：^\s*（（？：\w |\s |\）*）\s*$。

注意这是非常低效的！尽可能使用字符类（即（[\w\s.]*））。

类似资料：

字符集[]内的正则表达式捕获组（）

我只想在空格字符（）后面跟一个哈希（）时匹配空格字符。这就是下面的试图做的，这是一个捕获组。（我试图避开括号，否则括号在组集中无法正确识别）。然而，这是行不通的。下面的正则表达式符合以下所有条件而我想分别搭配和有没有办法在字符集中指定捕获组？
正则表达式捕获组

假设我有这个虚拟URL，我需要提取植物及其颜色作为下面的I have正在按预期捕获我需要的元素，但是当我的URL中的植物少于4株时，它无法捕获任何东西。底部有一个指向regex测试员的链接，其中有示例代码和URL，您可以使用。如何修改这个正则表达式，使其动态工作，从而在不需要静态URL结构的情况下捕获可用内容。现在，假设我最多只能捕获4株植物（8组） https://regex101.com/
PHP正则表达式之捕获组与非捕获组

本文向大家介绍PHP正则表达式之捕获组与非捕获组，包括了PHP正则表达式之捕获组与非捕获组的使用技巧和注意事项，需要的朋友参考一下今天遇到一个正则匹配的问题，忽然翻到有捕获组的概念，手册上也是一略而过，百度时无意翻到C#和Java中有对正则捕获组的特殊用法，搜索关键词有PHP时竟然没有相关内容，自己试了一下，发现在PHP中也是可行的，于是总结一下，分享的同时也希望有大神和细心的学习者找到我理解中
Java正则表达式捕获组

问题内容：我正在尝试使用Java expr在：之后捕获正确的部分，但是在以下代码中，打印的捕获组是整个字符串，怎么了？问题答案：子组的编号从1开始，全文为0。只需循环执行count + 1。
非捕获组中的正则表达式捕获组

在Python中，如何在非捕获组中捕获组？换句话说，如何重复包含捕获组的非捕获子模式？例如，捕获导入字符串上的所有包名。例如，字符串：导入熊猫、操作系统、系统将返回“pandas”、“os”和“sys”。下面的模式捕获第一个包并到达第二个包：从这里，我想重复捕获组并匹配以下字符的子模式，即。当我用一个非捕获组包围这个子模式并重复它时：它不再捕捉里面的群体。
Java正则表达式捕获组索引

问题内容：我有以下一行，我需要拿这个词ABC，我写了以下代码片段，所以，如果我说得到，ABC:但是如果我说是ABC，那么我想知道这是什么和意味着什么呢？如果有人可以用很好的例子向我解释，那会更好。正则表达式模式中包含一个:，为什么结果忽略了它？组1是否检测到括号内的所有单词？因此，如果我再加上两个括号，例如：，那么会有两个小组吗？group(1)将退还零件并退还零件？给出该代码段的

正则表达式-捕获组与字符类的变化

共有2个答案

相关问答

相关文章

相关阅读

相关工具

相关文档