不积跬步,无以至千里

博客园 首页 新随笔 联系 订阅 管理

HtmlParser是一个纯的Java写的html解析的库,它不依赖于其它的Java库文件,主要用于改造或提取html,现在htmlparser最新版本为2.0。毫不夸张地说,htmlparser就是目前最好的html解析和分析的工具。
常用的jar是: htmllexer.jar或者htmlparser.jar
感兴趣的同学可以研究一下源码实现,可以从下面的链接找到源码:
htmllexer.jar源码:http://pan.baidu.com/s/1bn8sEaN
htmlparser.jar源码:http://pan.baidu.com/s/1sjFrHO5

posted on 2016-03-14 13:16  Zeroassetsor  阅读(631)  评论(0)    收藏  举报