Python之正则表达式

正则表达式是一个特殊的字符序列,判断一个字符串是否与某种模式匹配

在python中,re模块拥有全部的正则表达式功能

正则表达式模式字符

在正则表达式中,特定的元素代表特定的含义,这里举例一些常用的元素

^ 匹配字符串的开头
$ 匹配字符串的结尾
*  匹配0个或多个字符
匹配1个或多个字符
匹配0个或1个字符
{n,m} 匹配n次到m次的字符
a|b

匹配a或b

\w 匹配数字 字母 和下划线
\W 匹配非数字 字母 和下划线
\s 匹配任意空白字符
\d 匹配任意数字,等价于[0-9]
\A 匹配字符串开始
\Z 匹配字符串结束,如果有换行,只匹配到换行前的结束字符串
\z 匹配字符串结束

正则表达式常用函数

compile函数适用与一系列正则表达式匹配和替换,参数为匹配规则,也就是正则表达式

re.match函数

re.match函数从字符串开始位置匹配,如果开始位置不符合规则,直接返回None

可以使用group(num)或groups来分段截取返回值

函数语法: re.match(pattern,string,flags=0)

pattern:正则表达式规则

string:要进行匹配的字符串

flags:标志位,用于控制正则表达式的匹配方式,可以不写

具体如下:

import re
pattern=re.compile('(\d+)(\w+)')    # 参数中每一个()就是一个group组
string=112233python
result=re.match(pattern,content)
if result:
    print(result)
    print(result.group(0))
    print(result.group(1))
    print(result.group(2))
else:
    print('no')
<_sre.SRE_Match object; span=(0, 12), match='112233python'>
112233python
112233
python

re.search函数

re.search  扫描整个字符串,并返回第一个匹配值

函数语法:

re.search(pattern,string,flags=0(可以不写这个参数))

pattern=re.compile(r'http')
result=pattern.search('www.jd.com,http://taobao.com')
print(result.group(0))

输出结果 :    http

re.sub函数

re.sub函数用于替换字符串中的匹配项

函数语法:

re.sub(pattern,replace,string)

string='今天星期三,1234567'
pattern=re.compile(r'\d.*')
result=re.sub(pattern,'7654321',string)
print(result)

输出结果:今天星期三,7654321

这三个函数是正则表达式中最常用,最基本的函数,所以要熟练掌握这三个函数

posted @ 2018-07-18 21:41  小火火火  阅读(89)  评论(0)    收藏  举报