问题：

高效地查找正则表达式的所有重叠匹配

呼延博易

2023-03-14

这是与java正则表达式匹配的所有重叠子字符串的后续。

有没有办法让这段代码更快？

public static void allMatches(String text, String regex)
  {
    for (int i = 0; i < text.length(); ++i) {
      for (int j = i + 1; j <= text.length(); ++j) {
        String positionSpecificPattern = "((?<=^.{"+i+"})("+regex+")(?=.{"+(text.length() - j)+"}$))";
        Matcher m = Pattern.compile(positionSpecificPattern).matcher(text);

        if (m.find()) 
        {   
          System.out.println("Match found: \"" + (m.group()) + "\" at position [" + i + ", " + j + ")");
        }   
      }   
    }   
  }

共有1个答案

段干恺

2023-03-14

在另一个问题中，你提到了Matcher的region（）方法，但你没有充分利用它。使其如此有价值的是，锚定将在区域边界处匹配，就像它们是独立字符串的边界一样。这是假设您已经设置了useAnchoringBounds（）选项，但这是默认设置。

public static void allMatches(String text, String regex)
{
  Matcher m = Pattern.compile(regex).matcher(text);
  int end = text.length();
  for (int i = 0; i < end; ++i)
  {
    for (int j = i + 1; j <= end; ++j) 
    {
      m.region(i, j);

      if (m.find()) 
      {   
        System.out.printf("Match found: \"%s\" at position [%d, %d)%n",
                          m.group(), i, j);
      }   
    }   
  }   
}

给定您的示例字符串和正则表达式：

allMatches("String t = 04/31 412-555-1235;", "^\\d\\d+$");

...我得到这样的输出：

Match found: "04" at position [11, 13)
Match found: "31" at position [14, 16)
Match found: "41" at position [17, 19)
Match found: "412" at position [17, 20)
Match found: "12" at position [18, 20)
Match found: "55" at position [21, 23)
Match found: "555" at position [21, 24)
Match found: "55" at position [22, 24)
Match found: "12" at position [25, 27)
Match found: "123" at position [25, 28)
Match found: "1235" at position [25, 29)
Match found: "23" at position [26, 28)
Match found: "235" at position [26, 29)
Match found: "35" at position [27, 29)

类似资料：

Python正则表达式找到所有重叠的匹配项？

问题内容：我正在尝试在Python 2.6中使用re查找更大系列的数字中的每10位数字系列。我很容易就能抓住不重叠的比赛，但我希望数字系列中的每场比赛。例如。在中我应该得到以下列表：我已经找到了“超前”的引用，但是我所看到的示例仅显示数字对，而不是较大的分组，而且我无法将其转换为两位数以外的数字。问题答案：在前瞻范围内使用捕获组。前瞻捕捉你感兴趣的文本，但是实际匹配在技术上是前瞻之前
重叠正则表达式匹配

问题内容：我试图创建下面的正则表达式：返回之间的字符串和（或或）从下列字符串RNA：，让所有的比赛会被发现，包括重叠的。我尝试了几种正则表达式，最后得到了类似的结果：您能告诉我我的正则表达式模式中的错误吗？问题答案：用一个正则表达式执行此操作实际上是非常困难的，因为大多数用法都不希望重叠匹配。但是，您可以通过一些简单的迭代来做到这一点：虽然，这有一些问题。您希望得到的回报是什么？
所有匹配java正则表达式的重叠子串

有没有API方法可以返回与正则表达式匹配的所有子字符串（可能重叠）？例如，我有一个文本字符串：
Python正则表达式是否找到所有重叠的匹配项？

我试图使用Python2.6中的re在一个更大的数字系列中找到每10位数字系列。我很容易抓住没有重叠的比赛，但我想要的每一个比赛在数字系列。例如。在“123456789123456789” 我应该得到以下列表：我发现了对“前瞻”的引用，但我看到的示例只显示了数字对，而不是更大的分组，并且我无法将它们转换成两位数以外的数字。
Java正则表达式-重叠匹配

问题内容：在下面的代码中：结果是：我希望成为如何实现？问题答案：使匹配器尝试从后者开始下一个扫描。
查找所有正则表达式匹配项的索引？

问题内容：我正在解析的字符串中可能包含任意数量的带引号的字符串（我在解析代码，并尝试避免使用PLY）。我想找出是否有子字符串被引用，并且我有子字符串索引。我最初的想法是使用re查找所有匹配项，然后找出它们代表的索引范围。似乎我应该将re与类似的正则表达式一起使用（目前，我避免使用三引号和此类字符串）。当我使用findall（）时，会得到一个匹配字符串的列表，虽然有些不错，但我需要索引。我的子

高效地查找正则表达式的所有重叠匹配

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档