正则表达式
基本匹配
cat => The cat sat on the mat.
正则表达式cat会匹配字符串"cat"。通过将正则表达式中的每个字符逐个与要匹配的字符串中的每个字符比较,来完成正则匹配。正则表达式通常区分大小写,因此正则表达式Cat与字符串"cat"不匹配。
元字符
具有固定含义的特殊符号
| 符号 | 描述 |
|---|---|
| . | 匹配除换行符以外的任意字符 |
| \w | 匹配字母或数字或下划线 |
| \s | 匹配任意的空白符 |
| \d | 匹配数字 |
| \n | 匹配一个换行符 |
| \t | 匹配一个制表符 |
| \W | 匹配非字母或数字或下划线 |
| \D | 匹配非数字 |
| \S | 匹配非空白符 |
| a|b | 匹配字符a或字符b |
| () | 匹配括号内的表达式, 也表示一个组 |
| [...] | 匹配字符组中的字符 |
| [^...] | 匹配除了字符组中字符的所有字符 |
量词
控制元字符出现的次数
| 符号 | 描述 |
|---|---|
| * | 重复零次或更多次 |
| + | 重复一次或更多次 |
| ? | 重复零次或一次 |
| 重复n次 | |
| 重复n次或更多次 | |
| 重复n到m次 |
常用组合
| 符号 | 描述 |
|---|---|
| .* | 贪婪匹配(尽量多的匹配字符) |
| .*? | 惰性匹配(尽量少的匹配字符) |
定位符
用于确定匹配的位置
| 符号 | 描述 |
|---|---|
| ^ | 匹配字符串的开始 |
| $ | 匹配字符串的结尾 |
断言
后行断言和先行断言被称为断言,是特殊类型的非捕获组(用于匹配模式,但不包括在匹配列表中),一般在特定模式之前或之后有其他不需要捕获特定模式时使用。
| 符号 | 描述 |
|---|---|
| ?= | 正向先行断言 |
| ?! | 负向先行断言 |
| ?<= | 正向后行断言 |
| ?<! | 负向后行断言 |
标记
也被称作修饰符
| 标记 | 描述 |
|---|---|
| i | 匹配时不区分大小写 |
| g | 全局搜索 |
| m | 多行匹配 |
本文来自博客园,作者:ling-yuan,转载请注明原文链接:https://www.cnblogs.com/ling-yuan/p/19047979

浙公网安备 33010602011771号