中文字符和中文标点符号的正则表达式

匹配中文标点符号: [\u3002\uff1b\uff0c\uff1a\u201c\u201d\uff08\uff09\u3001\uff1f\u300a\u300b] 该表达式可以识别出: 。 ; , : “ ”( ) 、 ? 《 》 这些标点符号。

\w匹配的仅仅是中文,数字,字母

匹配中文字符的正则表达式: [\u4e00-\u9fa5]

匹配双字节字符(包括汉字在内):[^\x00-\xff]

注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)

在线统计字符创长度:https://www.sojson.com/convert/zishutongji.html

posted @ 2019-06-27 16:34    阅读(30676)  评论(1编辑  收藏  举报