当前位置: 首页 > 编程笔记 >

java实现检测是否字符串中包含中文

伍心水
2023-03-14
本文向大家介绍java实现检测是否字符串中包含中文,包括了java实现检测是否字符串中包含中文的使用技巧和注意事项,需要的朋友参考一下

代码非常实用,这里就不错废话,直接奉上

主要功能是实现判断字符串是否包含汉字 并且替换成ASCLL

private static String regEx = "[\\u4e00-\\u9fa5]";

  /**
   * 判断字符串是否包含汉字 并且替换成ASCLL
   *
   * @param str_para
   * @return str_result
   */
  private static String isChinese_Replace( String str_para )
  {
    Pattern p      = Pattern.compile( regEx );
    String str_result   = str_para;
    String str_0      = "";
    String str_1      = "";
    String str_data[]   = null;
    String str_return_reslut  = "";
    if ( str_result != null && str_result.trim().length() > 0 )
    {
      try {
        str_data = str_result.split( "" );
        for ( int i = 0; i < str_data.length; i++ )
        {
          Matcher m = p.matcher( str_data[i] );
          /* L.d(str_data[i]); */
          int count = 0;
          if ( m.find() )
          {
            count++;
            str_result   = m.group( 0 );
            byte[] b    = str_result.getBytes( "GBK" );
            str_0      = Integer.toHexString( b[0] );
            str_1      = Integer.toHexString( b[1] );
            str_return_reslut  = str_return_reslut + "/" + conver10( str_0 ) + conver10( str_1 ) + "/";
          } else {
            str_return_reslut = str_return_reslut + str_data[i];
          }
        }
      } catch ( NumberFormatException e ) {
        e.printStackTrace();
      } catch ( UnsupportedEncodingException e ) {
        e.printStackTrace();
      }
    } else {
      return(str_return_reslut);
    }
    return(str_return_reslut);
  }
  /* 字符串转换十进制 */
  public static int conver10( String str_0 )
  {
    return(Integer.parseInt( str_0.substring( str_0.length() - 2, str_0.length() ), 16 ) );
  }

我们来看个稍微简单些的代码,一些需求不高的地方可以用到

import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class demo {
static String regEx = "[\u4e00-\u9fa5]";
static Pattern pat = Pattern.compile(regEx);
public static void main(String[] args) {
String input = "Hell world!";
System.out.println(isContainsChinese(input));
input = "hello world";
System.out.println(isContainsChinese(input));
}
  
public static boolean isContainsChinese(String str)
{
Matcher matcher = pat.matcher(str);
boolean flg = false;
if (matcher.find())  {
flg = true;
}
return flg;
}

最后我们附上各种字符的unicode编码的范围:
     * 汉字:[0x4e00,0x9fa5](或十进制[19968,40869])
     * 数字:[0x30,0x39](或十进制[48, 57])
     *小写字母:[0x61,0x7a](或十进制[97, 122])
     * 大写字母:[0x41,0x5a](或十进制[65, 90])

 类似资料:
  • 同 find() 方法类似,index() 方法也可以用于检索是否包含指定的字符串,不同之处在于,当指定的字符串不存在时,index() 方法会抛出异常。 index() 方法的语法格式如下: str.index(sub[,start[,end]]) 此格式中各参数的含义分别是: str:表示原字符串; sub:表示要检索的子字符串; start:表示检索开始的起始位置,如果不指定,默认从头开始检

  • find() 方法用于检索字符串中是否包含目标字符串,如果包含,则返回第一次出现该字符串的索引;反之,则返回 -1。 find() 方法的语法格式如下: str.find(sub[,start[,end]]) 此格式中各参数的含义如下: str:表示原字符串; sub:表示要检索的目标字符串; start:表示开始检索的起始位置。如果不指定,则默认从头开始检索; end:表示结束检索的结束位置。如

  • 问题内容: 我需要检查一个字符串是否包含汉字。搜索之后,我发现我必须在这种模式下查看正则表达式,但是我无法使正则表达式正常工作。 任何人都经历过这种情况?正则表达式正确吗? 问题答案: 作为讨论在这里,在Java 7(即正则表达式编译器符合要求RL1.2属性从UTS#18 Unicode的正则表达式 ),你可以使用下面的正则表达式匹配中国(当然,CJK)字符: 可以简单地理解为

  • 想知道什么在什么不在吗?Puppet 的 in 可以帮你, 如下面的表达式: if "foo" in $bar 如果 foo 是 $bar 的子串,表达式的值为 true。 如果 $bar 是个数组,并且 foo 是这个数组中的一个元素,表达式的值为 true。 如果 $bar 是一个哈希,foo 是 $bar 的一个键值,表达式的值为 true。 操作步骤 在你的配置清单中添加如下代码: if

  • 问题内容: 如何检查字符串是否包含\ n或换行符? 问题答案: 如果字符串是在同一程序中构造的,则建议使用以下命令: 但是,如果您指定使用\ n,则此驱动程序说明了如何做: 导致 回应您的评论: 结果是

  • 问题内容: 我正在编写一个程序,其中用户以以下格式输入字符串: 我需要检查字符串中是否有数字 然后只提取数字。 如果我使用或,则无论输入的内容是什么,程序都无法在字符串中找到数字,但是仅在只有数字的情况下才能使用。 我可以使用什么作为查找和提取的解决方案? 问题答案: 我使用的解决方案如下所示: 我确信这不是一个完美的解决方案,但它满足了我的需求。谢谢大家的帮助。:)