常用正则表达式
常用正则表达式
-
匹配中文字符:[\u4e00-\u9fa5]
U4300-U9fa5代表了符合汉字GB18030规范的字符集,因为为了兼容,所有字符都以unicode编码实现,汉字也不例外.
注意这里说的是中文字符,不光是汉字
-
匹配空白行:
windows: ^(\s*)\r\n
linux和mac: ^(\s*)\n
解析:
- ^匹配字符串的开头
- \s匹配任何空白字符(相应的,\S就是匹配所有非空白字符,正则表达式的规定就是这样大小写是反着的)
- \n匹配换行符
- \r匹配回车符
总而言之,就是windows是回车换行,而linux直接换行
-
匹配网站URL:
[a-zA-z]+://[^\S]* -
匹配正整数:[1]\d*$
\d匹配一个数字字符。等价于 [0-9],之所以这样写是因为第一位不能有0
-
匹配非负整数(正整数加0):[2]\d*|0$
要是不放心可以加个括号
-
匹配非正整数(负整数加0):^-[1-9]\d*|0$
就是6再加个负号
-
匹配正浮点数:
^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$^[1-9]\d*\.\d*是整数部分不为0的0\.\d*[1-9]\d*是整数部分为0的,小数部分不能全是0,所以中间插了一个[1-9]:双精度 (64-bit) 的规约形式浮点数在指数偏移值的值域为![img]()
(11-bit) 到
![img]()
,在分数部分则是
![img]()
到
![img]()
(52-bit)





浙公网安备 33010602011771号