当前位置: 首页 > 知识库问答 >
问题:

Posix正则表达式捕获组匹配序列

宦书
2023-03-14

我在一个c程序中有以下文本字符串和regex模式:

char text[] = "        identification     division. "; 
char pattern[] = "^(.*)(identification *division)(.*)$"; 
String:         identification     division. 
Pattern: ^(.*)(identification *division)(.*)$ 
Total number of subexpressions: 3 

OK, pattern has matched  ... 

begin: 0, end: 37,match:         identification     division. 
subexpression 1 begin: 0, end: 8, match: 
subexpression 2 begin: 8, end: 35, match: identification     division 
subexpression 3 begin: 35, end: 37, match: . 

多谢了。

共有1个答案

黄涵畅
2023-03-14

正如您所说的,如果贪心组(.*)消耗了整个字符串,则regex的其余部分将没有任何可匹配的内容,从而无法使regex与字符串匹配。所以,是的,每个捕获组(和其他模式部分)都需要匹配。这正是您在regex中指定的内容。

尝试下面的字符串,并同时运行第一组不情愿和贪婪的代码,您将会看到不同之处。

char text[] = "    identification  division    identification     division. ";
 类似资料:
  • 假设我有这个虚拟URL,我需要提取植物及其颜色作为 下面的I have正在按预期捕获我需要的元素,但是当我的URL中的植物少于4株时,它无法捕获任何东西。底部有一个指向regex测试员的链接,其中有示例代码和URL,您可以使用。 如何修改这个正则表达式,使其动态工作,从而在不需要静态URL结构的情况下捕获可用内容。现在,假设我最多只能捕获4株植物(8组) https://regex101.com/

  • 问题内容: 我正在尝试使用Java expr在:之后捕获正确的部分,但是在以下代码中,打印的捕获组是整个字符串,怎么了? 问题答案: 子组的编号从1开始,全文为0。只需循环执行count + 1。

  • 我一直在研究requirement,需要在以下字符串上创建正则表达式: 该字符串可以有以下多种变体: 在上面的表达式中是一个键名,可以是endDate、updateDate等。这意味着我们不能在表达式中硬编码它。尽管 我使用以下编译模式 模式匹配,但创建的组不是我期望的。我希望下面用括号包围该组: 你能帮我在Java和小组中正确表达吗?

  • 问题内容: 给出以下Java表达式代码: 如果是,则表示正则表达式匹配整个“行”。那我可以得到两组的内容吗?每个是? 问题答案: 要访问组,您需要使用:。 然后,您可以调用或在匹配器上执行匹配器,如果匹配器返回true,则可以通过和访问组。

  • 我定义的正则表达式对所有测试字符串都很好,除了当捕获组顺序被交换时(2016 Fall或16F或18SU),正则表达式中是否有一种方法可以忽略正则表达式的捕获组顺序

  • 在Python中,如何在非捕获组中捕获组?换句话说,如何重复包含捕获组的非捕获子模式? 例如,捕获导入字符串上的所有包名。例如,字符串: 导入熊猫、操作系统、系统 将返回“pandas”、“os”和“sys”。下面的模式捕获第一个包并到达第二个包: 从这里,我想重复捕获组并匹配以下字符的子模式,即。当我用一个非捕获组包围这个子模式并重复它时: 它不再捕捉里面的群体。