常用正则表达式

常用正则表达式

  1. 匹配中文字符:[\u4e00-\u9fa5]

    U4300-U9fa5代表了符合汉字GB18030规范的字符集,因为为了兼容,所有字符都以unicode编码实现,汉字也不例外.

    注意这里说的是中文字符,不光是汉字

  2. 匹配空白行:

    windows: ^(\s*)\r\n

    linux和mac: ^(\s*)\n

    解析:

    • ^匹配字符串的开头
    • \s匹配任何空白字符(相应的,\S就是匹配所有非空白字符,正则表达式的规定就是这样大小写是反着的)
    • \n匹配换行符
    • \r匹配回车符

    总而言之,就是windows是回车换行,而linux直接换行

  3. 匹配网站URL:[a-zA-z]+://[^\S]*

  4. 匹配正整数:[1]\d*$

    \d匹配一个数字字符。等价于 [0-9],之所以这样写是因为第一位不能有0

  5. 匹配非负整数(正整数加0):[2]\d*|0$

    要是不放心可以加个括号

  6. 匹配非正整数(负整数加0):^-[1-9]\d*|0$

    就是6再加个负号

  7. 匹配正浮点数:^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$

    ^[1-9]\d*\.\d*是整数部分不为0的

    0\.\d*[1-9]\d*是整数部分为0的,小数部分不能全是0,所以中间插了一个[1-9]:双精度 (64-bit) 的规约形式浮点数在指数偏移值的值域为

    img

    (11-bit) 到

    img

    ,在分数部分则是

    img

    img

    (52-bit)


  1. 1-9 ↩︎

  2. 1-9 ↩︎

posted @ 2020-03-03 21:29  别再闹了  阅读(178)  评论(0)    收藏  举报