JS区分中英文字符的两种方法: 正则和charCodeAt()方法

1.正则
regExpForm.onblur=function(){  
        entryVal=this.value;  
        entryLen=entryVal.length;  
        cnChar=entryVal.match(/[^\x00-\x80]/g);//利用match方法检索出中文字符并返回一个存放中文的数组  
        entryLen =cnChar.length;//算出实际的字符长度  
    }

\xhh,匹配的是一个十六进制字符hh.(注：h取值范围是0-9a-f)
^\x00-\x80(注意有个非) 是全角字符的范围
这个是通过正则来获取value中的全角字符

2.charCodeAt()
entryVal=this.value;  
        entryLen=entryVal.length;  
        for(var i=0;i<entryVal.length;i  ){  
            if(entryVal.charCodeAt(i)>255){//遍历判断字符串中每个字符的Unicode码,大于255则为中文  
                cnArr.push(entryVal[i]);//讲符合条件的值插入到中文字符数组中  
                //注意一个小bug,push是向数组的末尾添加一个或多个元素并返回新的长度,所以未刷新的情况下反复blur会累加字符值  
            }  
        }  
        entryLen =cnArr.length;

unicode编码范围：

汉字：[0x4e00,0x9fa5]（或十进制[19968,40869]）

数字：[0x30,0x39]（或十进制[48, 57]）

小写字母：[0x61,0x7a]（或十进制[97, 122]）

大写字母：[0x41,0x5a]（或十进制[65, 90]）

更多：http://www.cnblogs.com/sosoft/p/3456631.html

posted @ 2017-09-12 02:03 Rainyn 阅读(2001) 评论(0) 收藏举报

刷新页面返回顶部