re模块的常用的符号

re模块

正则表达式常用符号

"""
\w:匹配字母、数字、下划线
\W:匹配非数字字母下划线
\s:匹配任意空白字符
\S:匹配任意非空白字符
\d:匹配任意数字,等价于[0-9]
\D:匹配任意非数字
\A:匹配任意非字符串
\Z:匹配任意字符串结束,如果是存在换行,只匹配到换行结束字符串
\z:匹配任意字符串结束
\G:匹配最后匹配完成的位置
\n:匹配一个换行符
\t:匹配一个制表符
^:匹配任意字符串的开头
$:匹配任意字符串末尾
. :匹配任意字符,除了换行符
[^...]:匹配不在[]中的字符,[^abc] 匹配除了abc之外的字符
*:匹配0个或者多个表达式
+:匹配一个或者多个表达式
?:匹配0个或者1个有前面的正则表达式定义的片段,非贪婪模式
{n}:景区让匹配n个前面表达式
{n,m}:匹配n到m次有前面的正则表达式定义的片段 贪婪方式
a|b:匹配a或者b
():匹配括号内的表达式 也表示一个组
"""

^:指定匹配必须出现在字符串开头或者行的开头

\A:匹配必须出现在字符串的开头

$:匹配必须出现在一下位置:字符串结尾、字符串结尾的\n之前或者行的结尾
   
\z:匹配必须出现在字符串的结尾或者字符串的\n之前

re模块提供的方法

import re

re.findall() # 匹配所有的满足条件的结果,放在列表中
re.search()  # 只找到第一个匹配到的结果,然后返回一个包含结果信息的对象,该对象可以调用group(),通过调用方法获得匹配到的字符串如果没有匹配到字符串,则返回None
re.match() # None 同search,不过在字符串开始进行匹配,完全可以用search+^ 代替match
re.split()  # 分割
posted @ 2021-07-16 17:27  倔强¥  阅读(347)  评论(0)    收藏  举报