常用正则表达式

匹配中文字符:[\u4e00-\u9fa5]

U4300-U9fa5代表了符合汉字GB18030规范的字符集,因为为了兼容,所有字符都以unicode编码实现,汉字也不例外.

注意这里说的是中文字符，不光是汉字
匹配空白行:

windows: ^(\s*)\r\n

linux和mac: ^(\s*)\n

解析:
- ^匹配字符串的开头
- \s匹配任何空白字符（相应的，\S就是匹配所有非空白字符，正则表达式的规定就是这样大小写是反着的）
- \n匹配换行符
- \r匹配回车符
总而言之，就是windows是回车换行，而linux直接换行
匹配网站URL：[a-zA-z]+://[^\S]*
匹配正整数:^[1]\d*$

\d匹配一个数字字符。等价于 [0-9],之所以这样写是因为第一位不能有0
匹配非负整数（正整数加0）：^[2]\d*|0$

要是不放心可以加个括号
匹配非正整数（负整数加0）：^-[1-9]\d*|0$

就是6再加个负号
匹配正浮点数:^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$

^[1-9]\d*\.\d*是整数部分不为0的

0\.\d*[1-9]\d*是整数部分为0的，小数部分不能全是0，所以中间插了一个[1-9]:双精度 (64-bit) 的规约形式浮点数在指数偏移值的值域为

(11-bit) 到

，在分数部分则是

到

(52-bit)