当前位置: 首页 > 编程笔记 >

js处理包含中文的字符串实例

云卓
2023-03-14
本文向大家介绍js处理包含中文的字符串实例,包括了js处理包含中文的字符串实例的使用技巧和注意事项,需要的朋友参考一下

场景:

js中String类型自带的属性length获取的是字符串的字符数目,但是前端经常会需要限制字符串的显示长度,一个中文字符又大概占两个英文小写字符的显示位置,所以中英文混合的情况下用length值来判断显示长度往往并不正确。

常规的解决办法是遍历字符串,中文字符计长度2,非中文字符计长度1,通过新计算出来长度总和来限制字符串的显示长度。看代码↓↓↓

var Tools ={
 //是否包含中文
 hasZh: function(str){
  for(var i = 0;i < str.length; i++)
  {
   if(str.charCodeAt(i) > 255) //如果是汉字,则字符串长度加2
    return true;
   return false;
  }
 },
 //重新计算长度,中文+2,英文+1
 getlen: function(str){
  var strlen = 0;
  for(var i = 0;i < str.length; i++)
  {
   if(str.charCodeAt(i) > 255) //如果是汉字,则字符串长度加2
    strlen += 2;
   else
    strlen++;
  }
  return strlen;
 },
 //限制长度
 limitlen: function(str, len){
  var result = "";
  var strlen = 0;
  for(var i = 0;i < str.length; i++)
  {
   if(str.charCodeAt(i) > 255) //如果是汉字,则字符串长度加2
    strlen += 2;
   else
    strlen++;

   result += str.substr(i,1);

   if(strlen >= len){
    break;
   }
  }
  return result;
 }
}

这种方法的原理是根据中英文的unicode编码范围不同来判断的,中文占2个字节,英文占1个字节,所以中文的unicode编码值肯定大于2^8-1=255。

上述方法可以更严谨一点:就是考虑unicode编码范围,具体的范围可以戳Unicode Table

PS: 汉字的unicode编码范围16进制为4E00-9FA5,10进制则为:19968-40869,即判断中文的准确表达式为:

str.charCodeAt(i)>=19968 && str.charCodeAt(i)<=40869

插一句不太严谨的话,代码不用限制太严谨的范围,毕竟你不知道用户(测试)会输哪些奇怪的东西。

以上这篇js处理包含中文的字符串实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持小牛知识库。

 类似资料:
  • 本文向大家介绍JS判断字符串包含的方法,包括了JS判断字符串包含的方法的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了JS判断字符串包含的方法。分享给大家供大家参考。具体如下: 1.  例子: 2. indexOf用法: JavaScript中indexOf函数方法返回一个整数值,指出 String 对象内子字符串的开始位置。如果没有找到子字符串, 则返回 -1。如果 startindex

  • 问题内容: 有没有更好的方法来编写jUnit 问题答案: 如果添加Hamcrest和JUnit4,则可以执行以下操作: 通过一些静态导入,它看起来要好得多: 所需的静态导入将是:

  • 问题内容: 我需要检查一个字符串是否包含汉字。搜索之后,我发现我必须在这种模式下查看正则表达式,但是我无法使正则表达式正常工作。 任何人都经历过这种情况?正则表达式正确吗? 问题答案: 作为讨论在这里,在Java 7(即正则表达式编译器符合要求RL1.2属性从UTS#18 Unicode的正则表达式 ),你可以使用下面的正则表达式匹配中国(当然,CJK)字符: 可以简单地理解为

  • 本文向大家介绍java实现检测是否字符串中包含中文,包括了java实现检测是否字符串中包含中文的使用技巧和注意事项,需要的朋友参考一下 代码非常实用,这里就不错废话,直接奉上 主要功能是实现判断字符串是否包含汉字 并且替换成ASCLL 我们来看个稍微简单些的代码,一些需求不高的地方可以用到 最后我们附上各种字符的unicode编码的范围:      * 汉字:[0x4e00,0x9fa5](或十进

  • 我希望我能找到一些帮助。我是solr的新手,有机会参加一个关于它的讨论。对于以下情况,即使是主持讲座的顾问也不确定,因此我希望有人也有同样的问题。 我有一个由特定键标识的对象列表。例如:有50万名员工通过id(1-500000)标识。这些人中的每个人都必须在接下来的两年里工作。这些年的每一天都由一个字符标识(员工将工作——“A”,员工将不在工作——“B”)。所以每个员工都有一个最多包含730个字符