正则表达式
什么是正则表达式?
正则表达式是一种匹配字符串的规则
正则表达式能做什么?
1,可以定制一个规则,来确认某一个字符串是否符合规则
2,从大段字符串中找到符合规则的内容
测试工具: http://tool.chinaz.com/regex/
元字符
\ 转义符,如果你想要得到元字符本身的话需要使用'\' 来取消这些元字符的特殊意义
. 表示任意一个字符,匹配出换行符意外的任意字符 例: \d*\.\d
+ 表示重复前面字符多次或一次
* 重复前面字符零次或多次
? 重复前面字符零次或一次
| 选择符号,表示'或者'关系 ,例: A|B 就是匹配A或者B
{} 定义量词
[] 定义字符类,字符组
() 定义分组
^ 匹配一行的开始 例: ^ab
$ 匹配一行的结束 例: ab$
- 连字符 例: 1-9
字符类
\\ 匹配反斜杠\字符
\n 匹配换行符
\f 匹配一个换页符
\t 匹配一个水平制表符
\v 匹配一个垂直制表符
\s 匹配一个空格符
\d 匹配一个数字字符 例: [0-9]
\D 匹配一个非数字字符
\w 匹配数字字母下划线 例: \w==[0-9a-zA-Z]
\W 匹配任意一个不是字母下划线或汉子的字符数字
\b 匹配字符串的边界 例: hello 边界为h和o \bh and o\b
量词
? 出现零次或一次
* 出现零次或多次
+ 出现一次或多次
{n} 出现零次或n次
{n,m} 至少出现n次但不超过m次
{n,} 出现至少n次
例: (\d{1,3}){3}\d{3}
这个正则表达式的意思是,\d是要匹配数字字符{1,3}一位到三位 ,{3}重复三次就是九位,\d{3}后面再加三位
总结
元字符
元字符量词 默认贪婪匹配
元字符量词? 表示惰性匹配

浙公网安备 33010602011771号