正则表达式

一般字符：. 匹配任意单个字符（不包括换行符）

　　　　　\ 转义字符（把有特殊含义的字符转换成字面意思）

　　　　　[...] 字符集（对应字符集中的任意字符）　　[a-z]所有字母、[0-9]所有数字、[\u4e00-\u9fa5]所有中文

预定义字符集：\d 匹配一个数字字符，等价于[0-9]

　　　　　　　\D 匹配一个非数字字符，等价于[^0-9]

　　　　　　　\s 匹配任何空白字符，包括换行符、制表符、换页符等，等价于[\f\n\r\t\v]

　　　　　　　\S 匹配任何非空白字符，等价于[^\f\n\r\t\v]

　　　　　　　\w 匹配包括下划线的任何单词字符，等价于[A-Za-z0-9_]

　　　　　　　\W 匹配任何非单词字符，等价于[^A-Za-z0-9_]

数量词：* 匹配前一个字符0次或无限次

　　　　+ 匹配前一个字符1次或无限次

　　　　？匹配前一个字符0次或1次

　　　　{m} 匹配前一个字符m次

　　　　{m,n} 匹配前一个字符m至n次

边界匹配：^ 匹配字符串开头

　　　　　& 匹配字符串结尾

　　　　　\A 仅匹配字符串开头

　　　　　\Z 仅匹配字符串结尾

re模块3种函数方法：search(匹配的正则表达式，匹配范围，flags匹配方式) 匹配并提取第一个符合规律的内容

　　　　　　　　　 findall() 匹配所有符合规律的内容，并以列表形式返回结果

　　　　　　　　　 sub()用于替换字符串中的匹配项

re模块修饰符：re.I 使匹配对大小写不敏感

　　　　　　　re.L 做本地化识别（locale-aware）匹配

　　　　　　　re.M 多行匹配，影响^和$

　　　　　　　re.S 使匹配包括换行在内的所有字符

　　　　　　　re.U 根据Unicode字符集解析字符，影响\w,\W,\b,\B

　　　　　　　re.X 该标志通过给与更灵活的格式以便正则表达式更易于理解

posted on 2019-09-02 17:35 数分小白小姐姐阅读(137) 评论(0) 收藏举报

刷新页面返回顶部

导航