正则表达式

正则表达式是一种匹配字符串的规则，不属于任何语音。它主要包含字符组、元字符、量词三大模块

字符组是一组字符的集合，用[]括起来
匹配单一字符时，可以不用[]
示例：

匹配多种字符时，可以用中括号,中括号中可以加'-',表示范围

在[]中使用"^", 即[^],表示非字符组，只要不在[]中的字符都可以匹配
示例:

正则表达式	匹配文本	匹配结果
[^a]	abc	b, c

元字符是一种代表特殊字符范围的字符，通常前面会带有''表示转义

另外，"|"表示或运算，()表示分组

?号放在元字符后面时，表示?号是一个量词，匹配0次或者1次
?号放在量词后面时，表示非贪婪匹配
正则表达式默认是贪婪匹配模式，也就是尽量匹配多的字符
示例：

正则表达式	匹配文本	匹配结果
<.+>	<html>hello</html>	<html>hello</html>

解释：贪婪匹配会尽可能多的匹配，从第一个<开始，匹配到最后一个>,所以结果是<html>hello</html>，而不是<html>

在量词的后面加一个?,可以使正则表达式变为非贪婪匹配，在非贪婪匹配中，会尽可能少的进行匹配
示例：

正则表达式	匹配文本	匹配结果
<.+?>	<html>hello</html>	<html>, </html>

解释：+号是量词，在+号后面加上一个?号，正则表达式就变成了非贪婪匹配，会尽可能少的匹配，从第一个<开始，匹配到第一次个>,得到了是<html>，后面又匹配到了</html>，所以匹配结果有两个，即<html>和</html>

posted @ 2022-12-02 23:22 saiya6 阅读(61) 评论(0) 收藏举报

刷新页面返回顶部