正则表达式

正则表达式匹配单个字符

代码功能

. 匹配任意1个字符（除了\n）

[ ] 匹配[ ]中列举的字符

\d 匹配数字，即0-9

\D 匹配非数字，即不是数字

\s 匹配空白，即空格，tab键

\S 匹配非空白

\w 匹配非特殊字符，即a-z、A-Z、0-9、_、汉字

\W 匹配特殊字符，即非字母、非数字、非汉字

--------------------------------------------------------------------------------------

正则表达式匹配多个字符

代码功能

* 匹配前一个字符出现0次或者无限次，即可有可无

+ 匹配前一个字符出现1次或者无限次，即至少有1次

? 匹配前一个字符出现1次或者0次，即要么有1次，要么没有

{m} 匹配前一个字符出现m次

{m,n} 匹配前一个字符出现从m到n次

--------------------------------------------------------------------------------------

正则表达式匹配开头和结尾的正则表达式

代码功能

^ 匹配字符串开头

$ 匹配字符串结尾

--------------------------------------------------------------------------------------

正则表达式匹配分组相关正则表达式

代码功能

| 匹配左右任意一个表达式

(ab) 将括号中字符作为一个分组

\num 引用分组num匹配到的字符串

(?P<name>) 分组起别名

(?P=name) 引用别名为name分组匹配到的字符串

--------------------------------------------------------------------------------------

re模块的高级用法

1.search匹配出表达式

匹配水果个数:match_obj = re.search("\d+", "水果20个,苹果10个")

2.知道使用findall查找多个字符

split 根据匹配进行切割字符串，并返回一个列表

match_obj = re.split(",|:", "张三,李四:王五:赵柳", maxsplit=2)

['赵三', '李四', '王五:赵柳']

3.知道使用sub替换数据

4.知道使用split根据多个标识符进行分割数据

--------------------------------------------------------------------------------------

python贪婪和非贪婪

Python里数量词默认是贪婪的，总是尝试匹配尽可能多的字符；

非贪婪则相反，总是尝试匹配尽可能少的字符。

在"*","?","+","{m,n}"后面加上？，使贪婪变成非贪婪。

--------------------------------------------------------------------------------------

r的作用

r 表示原生字符串，数据里面的反斜杠不需要进行转义，针对的只是反斜杠

--------------------------------------------------------------------------------------

posted @ 2020-01-08 14:29 小小小光子阅读(138) 评论(0) 收藏举报

刷新页面返回顶部

小小小光子

正则表达式

公告