Python之正则表达式

正则表达式是一个特殊的字符序列,判断一个字符串是否与某种模式匹配

在python中,re模块拥有全部的正则表达式功能

正则表达式模式字符

在正则表达式中,特定的元素代表特定的含义,这里举例一些常用的元素

^	匹配字符串的开头
$	匹配字符串的结尾
*	匹配0个或多个字符
+	匹配1个或多个字符
?	匹配0个或1个字符
{n,m}	匹配n次到m次的字符
a\|b	匹配a或b
\w	匹配数字字母和下划线
\W	匹配非数字字母和下划线
\s	匹配任意空白字符
\d	匹配任意数字,等价于[0-9]
\A	匹配字符串开始
\Z	匹配字符串结束,如果有换行,只匹配到换行前的结束字符串
\z	匹配字符串结束

正则表达式常用函数

compile函数适用与一系列正则表达式匹配和替换,参数为匹配规则,也就是正则表达式

re.match函数

re.match函数从字符串开始位置匹配,如果开始位置不符合规则,直接返回None

可以使用group(num)或groups来分段截取返回值

函数语法: re.match(pattern,string,flags=0)

pattern:正则表达式规则

string:要进行匹配的字符串

flags:标志位,用于控制正则表达式的匹配方式,可以不写

具体如下:

import re
pattern=re.compile('(\d+)(\w+)')    # 参数中每一个()就是一个group组
string=112233python
result=re.match(pattern,content)
if result:
    print(result)
    print(result.group(0))
    print(result.group(1))
    print(result.group(2))
else:
    print('no')

<_sre.SRE_Match object; span=(0, 12), match='112233python'>
112233python
112233
python

re.search函数

re.search 扫描整个字符串,并返回第一个匹配值

函数语法:

re.search(pattern,string,flags=0(可以不写这个参数))

pattern=re.compile(r'http')
result=pattern.search('www.jd.com,http://taobao.com')
print(result.group(0))

输出结果 : http

re.sub函数

re.sub函数用于替换字符串中的匹配项

函数语法:

re.sub(pattern,replace,string)

string='今天星期三,1234567'
pattern=re.compile(r'\d.*')
result=re.sub(pattern,'7654321',string)
print(result)

输出结果:今天星期三,7654321

这三个函数是正则表达式中最常用,最基本的函数,所以要熟练掌握这三个函数

posted @ 2018-07-18 21:41 小火火火阅读(93) 评论(0) 收藏举报

刷新页面返回顶部