学习使用正则表达式——编程中转义字符的处理

最近自己写了个爬取小说网站小说内容的 java 爬虫,头一次正儿八经的学习和使用正则表达式。在 java 中使用正则表达式有一个问题:正则表达式做为字符串编写在代码中,本身就有许多特殊字符,而不少特殊字符在 java 中也要特殊处理,经过转义才能表示,一旦有未经转意的字符或者转意错误的字符,那最终正则表达式可能就错了。

我最初直接在 java 代码中打上双引号就直接在字符串里写正则表达式,结果怎么尝试运行都不对,但是表达式的意思明明没有错啊!到后来想明白了,java 中的转意符号可能漏了。但是我面对表达式中那么多特殊符号,让我一个个看哪个要转意,而且有时候还有斜杠给自身的转意,实在是让人头大。手动转意麻烦还容易出错,于是想起来 eclipse  中直接粘贴字符串中的内容,不带引号则可以自动加转义符号,这么尝试之后还真的就方便、正确。

另外,我还寻找了正则表达式的小工具,其中 Qre 的链接已经无法访问,被从 google code 上删除了,我现在用的是 regester (https://deerchao.net/tools/regester/index.htm),功能比较完备,适用于 Windows 平台,作者还配备了正则表达式的简要教程和常用形式的正则表达式,我觉得满意了。目前编程中使用正则表达式都是现在 regester 中编写并测试好之后粘贴到代码中,挺方便,不容易出错。

 

posted @ 2019-04-10 11:19  sebastia  阅读(926)  评论(0编辑  收藏  举报