一般字符:. 匹配任意单个字符(不包括换行符)
\ 转义字符(把有特殊含义的字符转换成字面意思)
[...] 字符集(对应字符集中的任意字符) [a-z]所有字母、[0-9]所有数字、[\u4e00-\u9fa5]所有中文
预定义字符集:\d 匹配一个数字字符,等价于[0-9]
\D 匹配一个非数字字符,等价于[^0-9]
\s 匹配任何空白字符,包括换行符、制表符、换页符等,等价于[\f\n\r\t\v]
\S 匹配任何非空白字符,等价于[^\f\n\r\t\v]
\w 匹配包括下划线的任何单词字符,等价于[A-Za-z0-9_]
\W 匹配任何非单词字符,等价于[^A-Za-z0-9_]
数量词:* 匹配前一个字符0次或无限次
+ 匹配前一个字符1次或无限次
? 匹配前一个字符0次或1次
{m} 匹配前一个字符m次
{m,n} 匹配前一个字符m至n次
边界匹配:^ 匹配字符串开头
& 匹配字符串结尾
\A 仅匹配字符串开头
\Z 仅匹配字符串结尾
re模块3种函数方法:search(匹配的正则表达式,匹配范围,flags匹配方式) 匹配并提取第一个符合规律的内容
findall() 匹配所有符合规律的内容,并以列表形式返回结果
sub()用于替换字符串中的匹配项
re模块修饰符:re.I 使匹配对大小写不敏感
re.L 做本地化识别(locale-aware)匹配
re.M 多行匹配,影响^和$
re.S 使匹配包括换行在内的所有字符
re.U 根据Unicode字符集解析字符,影响\w,\W,\b,\B
re.X 该标志通过给与更灵活的格式以便正则表达式更易于理解
浙公网安备 33010602011771号