当前位置: 首页 > 面试题库 >

使用正则表达式匹配utf-8编码中的任何中文字符

阚正真
2023-03-14
问题内容

例如,我想匹配组成的字符串m来n中国的字符,然后我可以使用:

[single Chinese character regular expression]{m,n}

是否存在单个汉字的某些正则表达式,可能是存在的任何汉字?


问题答案:

与中文(好吧,CJK)字符匹配的正则表达式为

\p{script=Han}

可以简化为

\p{Han}

这假定您的正则表达式编译器满足UTS#18 Unicode正则表达式的RL1.2属性要求。Perl和Java 7都符合该规范,但其他许多不符合。



 类似资料:
  • 本文向大家介绍中文正则表达式匹配问题之正则表达式中文匹配使用方法,包括了中文正则表达式匹配问题之正则表达式中文匹配使用方法的使用技巧和注意事项,需要的朋友参考一下 这篇文章主要讲如何使用正则匹配中文字符,中文正则表达式的匹配规则不像其他正则规则一样容易记住,下面一起看看这个中文正则表达式是怎么样的。 \w匹配的仅仅是中文,数字,字母,对于国人来讲,仅匹配中文时常会用到,见下 匹配中文字符的正则表达

  • 问题内容: 在JavaScript中: 正确地给我: 当我使用utf-8字符时: 在字边界运营商似乎没有工作时: 这个问题有方法解决吗? 问题答案: 仅当一个单词字符之前或之后没有另一个单词字符(因此等于和)时,单词边界声明才匹配。并且定义为。因此与希腊字符不匹配。因此,您不能在这种情况下使用。 相反,您可以使用以下方法:

  • 问题内容: 我需要匹配重复两次的任何字符,例如: 应匹配“ cc”和“ ff”。在任何其他正则表达式语法中,让我们使用Javascript作为快速示例,我可以这样做: 哪个返回 但是Go的regexp似乎不允许这样做。可以在Go中执行此操作吗? 问题答案: 由于re2不支持向后引用,因此您需要: 要么使用另一个正则表达式库(如) 或编写一个无需进行正则表达式分析的循环

  • 问题内容: 我有一个正则表达式字符串数组。其中之一必须与给定java文件中找到的任何字符串匹配。 这是我到目前为止拥有的正则表达式字符串: 但是,即使字符串内的引号被转义,该字符串也会被拒绝。我认为,无论字符串是否转义,当在字符串中找到引号时,我都会立即拒绝它。我需要它接受带转义引号的字符串文字,但它应该拒绝。 问题答案: 在Java中,您可以使用此正则表达式匹配和之间的所有转义引号: 使用的正则

  • 我想匹配任何文本中的某些行,在匹配中,我想尽可能频繁地替换某个字符。示例文本: 任何文本和“更多”文本。不要在此处替换引号 CatchThis(此处没有引号,“任何更多文本”,“等等…”)。。。 现在,我想用哈希符号来替换圆括号中的每个引号。预期结果: 任何文本和“更多”文本。不要在此处替换引号 CatchThis(此处没有引号,#没有更多文本#,#等等…#)。。。 匹配线条很容易。这是我的模式:

  • 有没有人试图描述与正则表达式匹配的正则表达式? 由于重复的关键字,这个主题几乎不可能在网上找到。 它可能在实际应用程序中不可用,因为支持正则表达式的语言通常具有解析它们的方法,我们可以将其用于验证,以及一种在代码中分隔正则表达式的方法,可用于搜索目的。 但是我仍然想知道匹配所有正则表达式的正则表达式是什么样子的。应该可以写一个。