正则表达式基本

元字符
^ $ . * + ? = ! : \ / () [] {}
 
元字符描述
. 查找单个字符,除了换行和行结束符。
\w 查找单词字符。
\W 查找非单词字符。
\d 查找数字。
\D 查找非数字字符。
\s 查找空白字符。
\S 查找非空白字符。
\b 匹配单词边界。
\B 匹配非单词边界。
\0 查找 NUL 字符。
\n 查找换行符。
\f 查找换页符。
\r 查找回车符。
\t 查找制表符。
\v 查找垂直制表符。
\xxx 查找以八进制数 xxx 规定的字符。
\xdd 查找以十六进制数 dd 规定的字符。
\uxxxx 查找以十六进制数 xxxx 规定的 Unicode 字符。

正则表达式 - 运算符优先级

正则表达式从左到右进行计算,并遵循优先级顺序,这与算术表达式非常类似。

相同优先级的从左到右进行运算,不同优先级的运算先高后低。下表从最高到最低说明了各种正则表达式运算符的优先级顺序:

运算符描述
\ 转义符, 匹配转义字符后面的任意字符   
(), (?:), (?=), [] 圆括号和方括号
*, +, ?, {n}, {n,}, {n,m} 限定符
^, $, \任何元字符、任何字符 定位点和序列(即:位置和顺序)
| 替换,"或"操作
字符具有高于替换运算符的优先级,使得"m|food"匹配"m"或"food"。若要匹配"mood"或"food",请使用括号创建子表达式,从而产生"(m|f)ood"。
 
 
表4.常用分组语法
分类代码/语法说明
捕获 (exp) 匹配exp,并捕获文本到自动命名的组里
(?<name>exp) 匹配exp,并捕获文本到名称为name的组里,也可以写成(?'name'exp)
(?:exp) 匹配exp,不捕获匹配的文本,也不给此分组分配组号
零宽断言 (?=exp) 匹配exp前面的位置
(?<=exp)  匹配exp后面的位置
(?!exp) 匹配不是exp的前面的位置
(?<!exp) 匹配前面不是exp的位置
注释 (?#comment) 这种类型的分组不对正则表达式的处理产生任何影响,用于提供注释让人阅读
 
 
 
(?=)正向预查零宽断言  匹配的是字符间的位置    不影响lastIndex(即下一次匹配开始的位置)           
     所谓 零宽 理解为字符间的缝隙    预查的零宽即是指字符后面的缝隙  正向理解为 能匹配到
(?! )负向预查零宽断言 
(?: )非捕获匹配 (被动子表达式)   匹配的是字符的内容  匹配内容,不捕获匹配的文本,也不给此分组分配组号     在正则表达式中   影响lastIndex 
posted @ 2016-09-03 16:43  阿巴阿巴55996  阅读(83)  评论(0)    收藏  举报