前言:
一、re模块是什么?
是python1.5版本独有的、基于正则表达式实现的、用来匹配字符串的模块。so,使用re模块时必须得掌握正则表达式基础。
二、正则表达式是什么?
- 描述了一种字符串匹配的模式(pattern)
- 功能一:用来检查一个字符串串是否含有某种子字符串
- 功能二:将匹配的子串(满足规则的字符串)进行替换
- 功能三:从某个字符串中取出符合某个条件的子
- ......
三、正则表达式中的元字符
元字符 | 匹配内容说明 |
---|---|
. | 匹配除换行符以外的任意字符 |
\w | 匹配字母或数字或下划线 |
\s | 匹配任意的空白符 |
\d | 匹配数字 |
\n | 匹配一个换行符 |
\t | 匹配一个制表符 |
\b | 匹配一个单词的结尾 |
^ | 匹配字符串的开始 |
$ | 匹配字符串的结束 |
\W | 匹配非字母或数字或下划线 |
\D | 匹配非数字 |
\S | 匹配非空白符 |
a|b | 匹配字符a或字符b |
() | 匹配括号内的表达式,也表示一个组 |
[] | 匹配字符组中的字符 |
[^] | 匹配除了字符组中字符的所有字符 |
三、正则表达式中的量词
量词 | 用法说明 |
---|---|
* | 重复零次或更多次 |
+ | 重复一次或更多次 |
? | 重复零次或一次 |
{n} | 重复n次 |
{n,} | 重复n次或更多次 |
{n,m} | 重复n到m次 |