关于正则表达式的使用
背景
工作这么多年,你要说正则,我知道。
但是你要我写一个,对不起,不会。
为什么?记不住。
正则表达式写出来看着像脏话
!@#¥%¥#@!¥#&&*%#%
速记
其实不管使用什么技术,你经常用到的功能,也就那么有限的几个。再复杂的,往往可能就得现学了。
正则表达式也是。
你只需要记住字符和量词,日常使用就足以。

举例子
这里推荐 https://regex101.com/ ,我写正则先在此处实时验证一下。
比如有以下内容,我们要提取href中的链接
<li>
<a href="https://www.cnblogs.com/cmt/p/17774595.html" target="_blank" title="评论76, 推荐58, 阅读4180"></a>
<a href="/aggsite/topdigged24h" title="查看24小时推荐排行" class="right_more">»</a>
</li>
第一步,写到这个程度应该会吧

第二步,查下上表
.代表任意单个字符

第三步
我希望一直往后匹配,匹配多个
查表,*代表0个或者多个,+代表1个或者多个
此处我们用+

第四步,可以看出来,直接匹配到最后了,这叫贪心
那查表发现,加个?就能抑制贪心

速查表


浙公网安备 33010602011771号