随笔分类 - 正则表达1000方钢
平时的一些正则表达式练习
摘要:前言 关于处理一些html的东西。 正文 假设有一段html文本: <?xml version="1.0" encoding="UTF-8"?> <!PUBLIC "-//OASIS//DTD DITA Topic//EN" "topic.dtd"> <topic id="lorem"> <titl
阅读全文
摘要:前言 环视是一种非捕获分组,它根据某个模式之前或之后的内容匹配其他模式。环视也称为零宽度断言。 环视包括: 1.正前瞻 2.正后瞻 3.正后顾 4.反后顾 正前瞻 匹配 文本内容 就是说我要匹配good,但是后面要是one。 反后瞻 就是将=换成! 和正后瞻相反,后面不能是one。 正后顾 也就是说
阅读全文
摘要:贪心 我们知道我们的量词是贪心的。 我写下来: /d{1,5} 那么它匹配了5个。 那么量词的匹配规则是啥呢? 量词首先匹配整个字符串,如果失败然后回退一个字符,然后再次进行匹配。这就是回溯。 它会每次回退一个字符,然后找到为止。然后呢,它还有记录所以行为,想想是不是消耗有点大。 没错这一章,就是用
阅读全文
摘要:前言 字符组呈正则一脉中的乾坤脉,也就是基本上字符组占正则六分之一,现在简称方括号分组。 这个很常见,比如我们[0 9],就像这种,看起来平平无奇,实则暗藏玄机。(好吧,最近过于清贫,已经开始研究阴阳八卦了) 字符组 我们常见的这种[]内的东西就叫字符组了,比如我写一个[ab],那么匹配的就是a或者
阅读全文
摘要:前言 直接用例子作为演示。 四没有,因为我看了一下,第四节当时理解错了,还在改。 正文 选择操作 部分区分大小写 我们在做匹配的时候希望,不区分大小写。 当然我们在python使用库中,可以选择显示不区分大小写。 但是python库在我们写入中,有个有一个需求一部分是不区分大小写的。 比如说我们希望
阅读全文
摘要:给文本加标签 实现: 要求捕获第一行,然后变成这样: 也就是文本加入标签。 这是实现原理是:(^T. $) 匹配到了第一行。并且这个括号的意思是捕获分组,因为是第一个括号,所以$1表示的就是分组的内容。 下面的$1就很好理解了。
阅读全文
摘要:前言 该节介绍,注意事项。 正文 第一个注意事项是: ^ 不仅表示开头项,还表示非的意思。 比如说我们\D,表示是非数字。 我们可以这样写: [^0 9] 或者 [^\d]表示非的意思。 第二个是,注意区分\w和\D,\D表示的是非数字,它有很多东西可以匹配。 \w表示的是字母,数字和下划线。 也就
阅读全文
摘要:前言 我整理的1000则,正则表达式,方便一起交流。 正文 假如我们要匹配一窜电话号码,比如说: 707 827 7019 我们该如何匹配它? 首先,我们确定,我们输入:707 827 7019 那么肯定是可以匹配的。 接下来:我们发现只有数字和 字符。 那么[0 9]{3} [0 9]{3} [0
阅读全文
浙公网安备 33010602011771号