Mysticbinary

只有通过概念的劳作才能获得真实的思想

学习正则匹配的一些经验

正则在爬虫领域使用很广泛,用来把网页中有价值的文本提取出来。这个提取技术就是用正则匹配。
我感觉正则匹配就是类型匹配,当你能认识清楚字符里面所有包含的类型和结构,那么你写出正则也就不难了。如何认识清楚文本中会有什么类型,看如下链接
https://www.zhihu.com/question/48219401/answer/742444326
在这篇文章中,我建议你认识好 这些基本的:

  • 1.元字符
  • 2.限定符
  • 3.分组
  • 4.条件或

认识完这些基础类型之后,写正则还是有点难,
建议跟着如下链接,把里面的练习都做一下,我包你会有新的感悟
https://juejin.im/post/6844903648309297166
把练习都做完后,一些正常难度的(初、中级)的正则你都能写了。

高级或进阶,自行学习吧。
https://deerchao.cn/tutorials/regex/regex.htm#regexoptions


工具

拥有一个好的调试工具,会让你能方便快捷的调试你的正则语句,这种及时的反馈感很重要,特别是新手的你。

bbedit下载地址
https://apps.apple.com/cn/story/跟-bbedit-学正则表达式/id1485320067

使用截图:


这篇文章对你有帮助吗?作为一名程序工程师,在评论区留下你的困惑或你的见解,大家一起来交流吧!
微信公众号: Mysticbinary
Github:https://github.com/Mysticbinary
本文版权归作者所有,欢迎转载,但未经作者同意请保留此段声明,请在文章页面明显位置给出原文链接
声明:本文章仅限于讨论网络安全技术,请勿用作任何非法用途,否则后果自负,本人和博客园不承担任何责任!

posted on 2020-07-31 17:55  Mysticbinary  阅读(186)  评论(0编辑  收藏  举报

导航