Python之正则表达式
正则表达式是一个特殊的字符序列,判断一个字符串是否与某种模式匹配
在python中,re模块拥有全部的正则表达式功能
正则表达式模式字符
在正则表达式中,特定的元素代表特定的含义,这里举例一些常用的元素
| ^ | 匹配字符串的开头 |
| $ | 匹配字符串的结尾 |
| * | 匹配0个或多个字符 |
| + | 匹配1个或多个字符 |
| ? | 匹配0个或1个字符 |
| {n,m} | 匹配n次到m次的字符 |
| a|b |
匹配a或b |
| \w | 匹配数字 字母 和下划线 |
| \W | 匹配非数字 字母 和下划线 |
| \s | 匹配任意空白字符 |
| \d | 匹配任意数字,等价于[0-9] |
| \A | 匹配字符串开始 |
| \Z | 匹配字符串结束,如果有换行,只匹配到换行前的结束字符串 |
| \z | 匹配字符串结束 |
正则表达式常用函数
compile函数适用与一系列正则表达式匹配和替换,参数为匹配规则,也就是正则表达式
re.match函数
re.match函数从字符串开始位置匹配,如果开始位置不符合规则,直接返回None
可以使用group(num)或groups来分段截取返回值
函数语法: re.match(pattern,string,flags=0)
pattern:正则表达式规则
string:要进行匹配的字符串
flags:标志位,用于控制正则表达式的匹配方式,可以不写
具体如下:
import re
pattern=re.compile('(\d+)(\w+)') # 参数中每一个()就是一个group组
string=112233python
result=re.match(pattern,content)
if result:
print(result)
print(result.group(0))
print(result.group(1))
print(result.group(2))
else:
print('no')
<_sre.SRE_Match object; span=(0, 12), match='112233python'>
112233python
112233
python
re.search函数
re.search 扫描整个字符串,并返回第一个匹配值
函数语法:
re.search(pattern,string,flags=0(可以不写这个参数))
pattern=re.compile(r'http')
result=pattern.search('www.jd.com,http://taobao.com')
print(result.group(0))
输出结果 : http
re.sub函数
re.sub函数用于替换字符串中的匹配项
函数语法:
re.sub(pattern,replace,string)
string='今天星期三,1234567'
pattern=re.compile(r'\d.*')
result=re.sub(pattern,'7654321',string)
print(result)
输出结果:今天星期三,7654321
这三个函数是正则表达式中最常用,最基本的函数,所以要熟练掌握这三个函数
浙公网安备 33010602011771号