正則表達式匹配换行符

一開始没有发现html文档中有非常多\n,结果用模式

<table[^>]>.*</table>
得到的table间的数据不对,依据百度百科,能够看到解决方式是

\s
匹配不论什么空白字符,包含空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。
\S
匹配不论什么非空白字符。等价于[^ \f\n\r\t\v]。

因此改动成模式:

<table[^>]+>[\\s\\S]*?</table>


?是非贪婪模式,提醒正则匹配到第一个</table>就停止。




posted on 2015-05-10 13:31  gcczhongduan  阅读(205)  评论(0)    收藏  举报