正则表达式
1、?
前面的字符可有可无
xxp?
xx xxp
2、*
前面的字符可出现 0 ~ N 次
xx*p
xp xxp xxxp
3、+
前面的字符可出现 1 ~ N 次
xx+p
xxp xxxp
4、{}
前面的字符可出现 x ~ y 次
xx{2,6}p
xxxp xxxxp
其中里面的数字可以只为一个,或者去掉一个数字(保留逗号)
注意:使用 () 可以匹配多个字符
x(xp)+
xxp xxpxp
5、|
或运算符
a (cat | dog)
a cat
a dog
6、[]
匹配的内容只能取自方括号中的字符
[abc]+
abc adore abbc
[a-z]+ // 所有小写英文字符 [A-Z]+ // 所有大写英文字符 [0-9]+ // 所有数字 [a-zA-Z0-9]+ // 所有英文字符和数字 [^…]+ // 除了 ^ 以外的所有字符
元字符
// 以下均代表单个字符
\d 数字字符
\D 非数字字符
\w 单词字符(英文、数字、下划线)
\W 非单词字符
\s 空白符(Tab、换行符)
\S 非空白符
. 任意字符(不包含换行符)
^ 匹配行首
$ 匹配行尾
贪婪匹配和懒惰匹配
?
<.*?> <span> </span>
如果使用 <.*> ,会尽可能匹配多的字符