正则表达式

一、定义

普通字符包含大小写字母、数字。在匹配普通字符时直接写就好。比如"abc"匹配的就是”abc”

用[ ]括起来，在[ ]中出现的内容会被匹配。例如：[abc]匹配a或b或c

量词中的*，+，{}都属于贪婪匹配，就是尽可能多的匹配到结果

str：hello world
reg: h.*
此时匹配的结果：hello world

str：<div>hello</div>
reg：<.*>
此时匹配的结果：<div>hello</div>

在使用.*后面如果加了"?"则是尽可能的少匹配

str：hello world
reg：h.*?
此时匹配的结果：h

str：<div>hello</div>
reg：<.*?>
此时匹配的结果：
<div>
</div>

在正则中使用()进行分组。

例如要匹配一个相对复杂的身份证号。身份证号分成两种。老的身份证号有15位，而新的身份证号有18位。并且新身份证号结尾可能是x

正则为：
^([1-9]\d{16}[0-9x]|[1-9]\d{14})$

在正则表达式中，有很多有特殊意义的元字符，比如\n和\s等。如果要在正则中匹配正常的"\n"而不是换行就需要对"\"进行转义。

同理，在python中，对于\n,\s等也是有特殊意义的，如果要得到"\n"也需要对"\"进行转义，所以，如果需要匹配字符\n，在正则表达及python表达中需要写成如下表格形式。

目标	正则	python
\n	\\n	\\\\n

表1 "\n"转义

此时可以利用r"\n"不转义，即上表中python中正则表达可写为：r"\\n"

posted @ 2018-11-16 21:49 Ethan_Y 阅读(274) 评论(0) 收藏举报

刷新页面返回顶部