Javascript计算字符串长度(中文算两个字符)

在正常情况下(字符编码为UTF-8),JS计算字符串的长度,不管其是中文汉字还是英文字母,每个汉字或每个字母的长度均为1。.例如:

  1. var str = "我me"; 
  2. alert(str.length); 
  3. //结果为 3 

但在某些特殊情况下,需要把汉字当做两个字符来看待(事实上每个汉字在计算机的存储中是占两个字节的),这样就不得不进行特殊处理了。

原理也很简单,就是利用该字符在Unicode字符集中的编码值来进行比较。例如,字符A的编码是65,字符B的编码是66,依此类推。小写字母从97开始编码,即字母a的编码是97,字母b的编码是98,依此类推。数字字符则是从48开始编码,字符0的编码是48,而字符9的编码是57。还有一些特殊符号如+、-等,在此就不举例了。

我们使用charCodeAt(char)来得到变量char所对应的Unicode编码,根据上面所描述的,英文、数字及一些特殊符号的Unicode编码是已知的,而且有一个范围,因此可以认为,不在此范围之内的字符,都可认为它是汉字,按长度为2来计算,因此就有了下面的这个函数:

  1. function getLength(str) { 
  2.     var len = str.length; 
  3.     var reLen = 0; 
  4.     for (var i = 0; i < len; i++) {        
  5.         if (str.charCodeAt(i) < 27 || str.charCodeAt(i) > 126) { 
  6.             // 全角    
  7.             reLen += 2; 
  8.         } else { 
  9.             reLen++; 
  10.         } 
  11.     } 
  12.     return reLen;    

  13. 原网址:http://www.sunchis.com/html/js/jssource/2011/0331/292.html
posted @ 2013-01-05 11:11  A Good Boy  阅读(897)  评论(0)    收藏  举报