学习正则匹配的一些经验
正则在爬虫领域、自动化办公脚本等使用很广泛,可以用来把网页中有价值的文本提取出来,可以写脚本操作特定的字符,这类技术就是用正则匹配。
我感觉正则匹配就是类型匹配,当你能认识清楚的认识字符串里面所有包含的类型和结构,那么你写出正则也就不难了。 如何认识清楚文本中会有什么类型,看如下链接:
https://www.zhihu.com/question/48219401/answer/742444326
https://mp.weixin.qq.com/s/wkCHL_QzAJwWEg9JZaZnCQ
需要知道自己匹配的字符串,里面包含的
0-9、a-z、A-Z、中文、空格、换行、括号、花括号等字符符号怎么对应到正则的表达式。
了解一下下面这些符号的作用:
- 1.元字符
- 2.限定符
- 3.分组
- 4.条件或
日常有正则任务,自己思考一下怎么写,然后用写一下正则表达式测试一下,能不能匹配出来。
高级或进阶:
https://deerchao.cn/tutorials/regex/regex.htm#regexoptions
AI时代写正则方式
https://regex.ai/
直接用这个AI工具自动生成正则语法吧!
调试工具
在线正则调试工具
https://www.bejson.com/othertools/regex/
https://rubular.com/
AI写正则
https://regex.ai/
posted on 2020-07-31 17:55 Mysticbinary 阅读(271) 评论(0) 编辑 收藏 举报