当前位置: 首页 > 面试题库 >

Java正则表达式捕获组索引

鞠侯林
2023-03-14
问题内容

我有以下一行,

typeName="ABC:xxxxx;";

我需要拿这个词ABC,

我写了以下代码片段,

Pattern pattern4=Pattern.compile("(.*):");
matcher=pattern4.matcher(typeName);

String nameStr="";
if(matcher.find())
{
    nameStr=matcher.group(1);

}

所以,如果我说group(0)得到,ABC:但是如果我说group(1)是ABC,那么我想知道

  1. 这是什么01意味着什么呢?如果有人可以用很好的例子向我解释,那会更好。
  2. 正则表达式模式中包含一个:,为什么group(1)结果忽略了它?组1是否检测到括号内的所有单词?
  3. 因此,如果我\\s*(\d*)(.*)再加上两个括号,例如:,那么会有两个小组吗?group(1)将退还(\d*)零件并group(2)退还(.*)零件?

给出该代码段的目的是为了消除我的困惑。这不是我要处理的代码。上面给出的代码可以用String.split()一种更简单的方式来完成。


问题答案:

捕获和分组

捕获组将 (pattern)创建一个具有捕获属性的组。

你可能经常看到(和使用)的一个相关的对象是(?:pattern),它创建了一个不捕获属性的组,因此命名为non-captureing group

通常,当你需要重复一系列模式(例如(\.\w+)+)或指定交替应在何处生效(例如^(0*1|1*0)$^,然后0*11*0,然后$)与^0*1|1*0$(^0*1或1*0$))时,通常使用组。

除分组外,捕获组还将记录与捕获组内的模式匹配的文本(pattern)。使用你的榜样,(.*):,.*比赛ABC:比赛:,由于.*是内捕获组(.*),该文本ABC被记录,捕获组1。

组号
整个模式定义为组号0。

模式中的任何捕获组均从1开始索引。索引由捕获组的左括号的顺序定义。例如,以下模式是所有 5个捕获组:

(group)(?:non-capturing-group)(g(?:ro|u)p( (nested)inside)(another)group)(?=assertion)
|     |                       |          | |      |      ||       |     |
1-----1                       |          | 4------4      |5-------5     |
                              |          3---------------3              |
                              2-----------------------------------------2

组号用于\n模式和$n替换字符串中的向后引用。

在其他正则表达式类型(PCRE,Perl)中,它们也可以用于子例程调用中。

你可以使用访问特定组匹配的文本Matcher.group(int group)。可以使用上述规则标识组号。

在某些regex风格(PCRE,Perl)中,有一个分支重置功能,该功能使你可以使用相同的数字来捕获交替不同分支中的组。

组的名字

在Java 7中,你可以定义一个命名的捕获组 (? pattern),并且可以访问与匹配的内容Matcher.group(String name)。正则表达式更长,但是代码更有意义,因为它表明你正在尝试与正则表达式匹配或提取的内容。

组名用于\k<name>模式和${name}替换字符串中的向后引用。

命名的捕获组仍使用相同的编号方案进行编号,因此也可以通过进行访问Matcher.group(int group)

在内部,Java的实现只是从名称映射到组号。因此,不能将相同的名称用于2个不同的捕获组。



 类似资料:
  • 问题内容: 我正在尝试使用Java expr在:之后捕获正确的部分,但是在以下代码中,打印的捕获组是整个字符串,怎么了? 问题答案: 子组的编号从1开始,全文为0。只需循环执行count + 1。

  • 假设我有这个虚拟URL,我需要提取植物及其颜色作为 下面的I have正在按预期捕获我需要的元素,但是当我的URL中的植物少于4株时,它无法捕获任何东西。底部有一个指向regex测试员的链接,其中有示例代码和URL,您可以使用。 如何修改这个正则表达式,使其动态工作,从而在不需要静态URL结构的情况下捕获可用内容。现在,假设我最多只能捕获4株植物(8组) https://regex101.com/

  • 我有一个带有(?:)格式的非捕获组的java正则表达式,我不明白为什么它为非捕获组提供“null”匹配。 如果我将下面的正则表达式缩短为“@te(st)(?:AA)?”使用相同的?:非捕获组,它给出了我认为的预期行为,只匹配1个组和完全匹配。

  • 我有一个带有(?:)格式的非捕获组的java正则表达式,我不明白为什么它为非捕获组提供“null”匹配。 如果我把下面的正则表达式缩短为“@te(st)(?:aa)?”用同样的非捕获组,它给出了我所期望的行为,只匹配1组和完全匹配。 参见下面的正则表达式: 结果: “@te(st)(?:aa)”的结果使用相同的代码: 第一个将非捕获组匹配为null的正则表达式是什么?

  • 在Python中,如何在非捕获组中捕获组?换句话说,如何重复包含捕获组的非捕获子模式? 例如,捕获导入字符串上的所有包名。例如,字符串: 导入熊猫、操作系统、系统 将返回“pandas”、“os”和“sys”。下面的模式捕获第一个包并到达第二个包: 从这里,我想重复捕获组并匹配以下字符的子模式,即。当我用一个非捕获组包围这个子模式并重复它时: 它不再捕捉里面的群体。

  • 问题内容: 有什么方法可以用捕获组的已修改内容替换正则表达式? 例: 我想用$ 1乘以3代替所有出现的情况。 编辑: 看起来好像出了点问题:( 如果我用 引发IllegalStateException:找不到匹配项 但 工作正常,但我不能更改$ 1 :( 问题答案: 要获得第一场比赛,请使用。之后,你可以用来引用此第一个匹配项,并将所有匹配项替换为第一个匹配值乘以3。 如果你想将每个匹配项替换为该