正则表达式中的零宽断言

零宽断言
 
地球人,是不是觉得这些术语名称太复杂,太难记了?我也和你一样。知道有这么一种东西就行了,它叫什么,随它去吧!“无名,万物之始 ... ”
 
接下来的四个用于查找在某些内容 ( 但并不包括这些内容 ) 之前或之后的东西,也就是说它们像 \b,^,$ 那样用于指定一个位置,这个位置应该满足一定的条件 ( 即断言 ) ,因此它们也被称为零宽断言。最好还是拿例子来说明吧:
 
断言用来声明一个应该为真的事实。正则表达式中只有当断言为真时才会继续进行匹配。
 
(?=exp) 也叫零宽度正预测先行断言,它断言自身出现的位置的后面能匹配表达式 exp 。比如 \b\w+(?=ing\b) ,匹配以 ing 结尾的单词的前面部分 ( 除了 ing 以外的部分 ) ,如查找 I'm singing while you're dancing. 时,它会匹配 sing 和 danc 。
 
(?<=exp) 也叫零宽度正回顾后发断言,它断言自身出现的位置的前面能匹配表达式 exp 。比如 (?<=\bre)\w+\b 会匹配以 re 开头的单词的后半部分 ( 除了 re 以外的部分 ) ,例如在查找 reading a book 时,它匹配 ading 。
 
假如你想要给一个很长的数字中每三位间加一个逗号 ( 当然是从右边加起了 ) ,你可以这样查找需要在前面和里面添加逗号的部分: ((?<=\d)\d{3})*\b ,用它对 1234567890 进行查找时结果是 234567890 。
 
下面这个例子同时使用了这两种断言: (?<=\s)\d+(?=\s) 匹配以空白符间隔的数字 ( 再次强调,不包括这些空白符 ) 。

posted @ 2010-01-17 00:19  dzqabc  阅读(402)  评论(0编辑  收藏  举报