正则表达式

Python 正则表达式

正则表达式是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配。

Python 自1.5版本起增加了re 模块，它提供 Perl 风格的正则表达式模式。

re 模块使 Python 语言拥有全部的正则表达式功能。

compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。

re 模块也提供了与这些方法功能完全一致的函数，这些函数使用一个模式字符串做为它们的第一个参数。

元字符

模式

　　I IGNORECASE，忽略大小写的匹配模式

s = 'hello World!'

regex = re.compile("hello world!", re.I)
print regex.match(s).group()
#output> 'Hello World!'

　　M MULTILINE，多行模式, 改变 ^ 和 $ 的行为

regex_start_m = re.compile("^\w+", re.M)
print regex_start_m.findall(s)

函数

　　一般常用的函数有compile、search、 match、 split、 findall、 sub、 escape

　　match( 尝试从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match()就返回none。)

　　split(将字符串按照正则匹配原则，分割成数组)

　　re.search (扫描整个字符串并返回第一个成功的匹配。)

　　compile (用于编译正则表达式，生成一个正则表达式（ Pattern ）对象，供 match() 和 search() 这两个函数使用。)

print(re.search('\dcom','www.4comaaaab.5com').group())
执行结果如下：
4com

p = re.compile(r'\d+')
print(p.findall('o1n2m3k4'))
执行结果如下：
['1', '2', '3', '4']

print(re.split('\d+','one1two2three3four4five5'))
执行结果如下：
['one', 'two', 'three', 'four', 'five', '']

s = '''first line
second line
third line'''

m = regex.match(s)

print m.group()
# output> first

posted @ 2019-11-03 20:49 Crush999 阅读(189) 评论(0) 收藏举报

刷新页面返回顶部