一般字符:. 匹配任意单个字符(不包括换行符)

     \ 转义字符(把有特殊含义的字符转换成字面意思)

     [...] 字符集(对应字符集中的任意字符)  [a-z]所有字母、[0-9]所有数字、[\u4e00-\u9fa5]所有中文

 

预定义字符集:\d 匹配一个数字字符,等价于[0-9]

       \D 匹配一个非数字字符,等价于[^0-9]

       \s 匹配任何空白字符,包括换行符、制表符、换页符等,等价于[\f\n\r\t\v]

       \S 匹配任何非空白字符,等价于[^\f\n\r\t\v]

       \w 匹配包括下划线的任何单词字符,等价于[A-Za-z0-9_]

       \W 匹配任何非单词字符,等价于[^A-Za-z0-9_]

 

数量词:* 匹配前一个字符0次或无限次

    + 匹配前一个字符1次或无限次

    ? 匹配前一个字符0次或1次

    {m} 匹配前一个字符m次

    {m,n} 匹配前一个字符m至n次

 

边界匹配:^ 匹配字符串开头

     & 匹配字符串结尾

     \A 仅匹配字符串开头

     \Z 仅匹配字符串结尾

 

re模块3种函数方法:search(匹配的正则表达式,匹配范围,flags匹配方式) 匹配并提取第一个符合规律的内容

           findall() 匹配所有符合规律的内容,并以列表形式返回结果

           sub()用于替换字符串中的匹配项

 

re模块修饰符:re.I 使匹配对大小写不敏感

       re.L 做本地化识别(locale-aware)匹配

       re.M 多行匹配,影响^和$

       re.S 使匹配包括换行在内的所有字符

       re.U 根据Unicode字符集解析字符,影响\w,\W,\b,\B

       re.X 该标志通过给与更灵活的格式以便正则表达式更易于理解