day24 模块03_re

休养生息 --模块03

1.正则表达式

2.在python中使用正则.re

一,正则表达式 (匹配字符串,主要是给字符串使用的)

1)元字符

.  除换行符之外

\w 数字,字母,下划线组成   \W 非数字,字母,下划线组成

\d 数字    \D 非数字

\s 空白符    \S  非空白符

\n Enter ,换行符

\t Tab

\b 以xxx结尾

[] 字符组

[^xxx] 非xxx

^x 以x开头

x$ 以x结尾

a|b  a或者b 

2) 量词

* [0,无穷)

+ [1,无穷)

?[0,1]

{n} 出现n次

{n,} 最少出现n次

{n,m} 出现[n,m]次

3)贪婪和惰性匹配

贪婪匹配:

  .*x尽可能多的从[0,无穷]取值,但结尾必须是x

  .+x尽可能多的从[1,无穷]取值,但结尾必须是x

惰性匹配

  .*?x 尽可能少的取到x,但是末尾必须是x

转义 : \\n --> \n  (正则前面要加r)

分组 :()

二 .在Python中使用正则.re

import re

1).re.findall('','内容')从内容中查找所有的符合要求的东西

2).re.finditer('','内容') 从内容中返回迭代器

3).re.match('','内容')从内容中找到结果返回,必须是从头开始匹配

4).re.seatch('','内容')从内容中找到结果返回,找到一个结果后就返回

5).compile() 编译

6).group() 获取数据内容

7).re.S 去掉.中的换行符,(.变成了可以匹配所有的数据)

posted @ 2019-01-03 19:47  想扣篮的小矮子  阅读(86)  评论(0)    收藏  举报