当前位置: 首页 > 面试题库 >

如何从Java中的字符串中检测重复的单词?

邓光耀
2023-03-14
问题内容

可以通过什么方式检测字符串中的重复单词?

例如,“这是重复测试的测试消息”包含一个重复单词测试。

在此,目标是检测出现在字符串中的所有重复单词。

使用正则表达式是实现目标的首选方法。


问题答案:

以下Java代码解决了从字符串中检测重复项的问题。如果重复的单词由换行符或标点符号分隔,则应该没有任何问题。

    String duplicatePattern = "(?i)\\b(\\w+)\\b[\\w\\W]*\\b\\1\\b";
    Pattern p = Pattern.compile(duplicatePattern);
    String phrase = "this is#$;%@;<>?|\\` p is a is Test\n of duplicate test";
    Matcher m = p.matcher(phrase);
    String val = null;
    while (m.find()) {
        val = m.group();
        System.out.println("Matching segment is \"" + val + "\"");
        System.out.println("Duplicate word: " + m.group(1)+ "\n");
    }

代码的输出将是:

Matching segment is "is#$;%@;<>?|\` p is a is"
Duplicate word: is

Matching segment is "Test
 of duplicate test"
Duplicate word: Test

在这里,m.group(1)语句表示与第一组模式匹配的字符串[这里是(\\ w +)]。



 类似资料:
  • 问题内容: 我有一个简单的问题,但无法提供一个简单的解决方案:) 假设我有一个字符串。我想检测是否有重复。 我想要: 问题是我不知道我要搜索的模式(我没有“ bla”作为输入)。 任何想法? 编辑: 看到这些评论,我想我应该再精确一点: 在字符串中,有重复的模式或没有重复的模式。 重复的图案可以是任何长度。 如果有一个模式,它将一遍又一遍地重复直到结束。但是字符串可以在模式中间结束。 例: 问题答

  • 问题内容: 假设我有一个包含Ü的字符串。我将如何找到所有这些unicode字符?我应该测试他们的代码吗?我该怎么做? 例如,给定字符串“AÜXÜ”,我想将其转换为“ AYXY”。我想对其他unicode字符执行相同的操作,并且我不希望将它们存储在某种翻译图中。 问题答案: “ unicode字符”的定义含糊不清,但是将被视为表示标准ISO 8859字符集 未涵盖的UTF-8 字符。如果您的情况是这

  • 我需要对一个字符串进行预处理,并从中移除一些单词。我要找的东西是这样的:- 我是新的编程,所以请考虑。

  • 问题内容: 我有一个输入String说。许多浏览器/ IDE /应用程序都会检测到字符串的url部分,并自动添加锚点。这样就变成了。 我需要使用Java进行相同的操作。 问题答案: 为此使用java.net.URL! 嘿,为什么不对这个“ java.net.URL”使用Java的核心类,而让它验证URL。 尽管以下代码违反了“仅在特殊情况下使用异常”这一黄金原则,但对Java平台上已经成熟的某些东

  • 我希望写一个小方法来做以下事情:例如,字符串a=“a123”,那么这个方法应该返回fulse;字符串b=“111”,它应该返回true。这意味着只有字符串是int,它应该返回true,所有其他情况都应该返回false。有人能帮我吗?非常感谢。

  • 问题内容: 如果我有一个PHP字符串,如何有效地确定它是否至少包含一个非ASCII字符?所谓非ASCII字符,是指不属于此表的任何字符,http://www.asciitable.com/,其位置为32-126(含)。 因此,它不仅必须是ASCII表的一部分,而且还必须是可打印的。我想检测一个包含至少一个不符合这些规范的字符的字符串(不可打印的ASCII字符或完全不同的字符,例如不属于该表的Uni