摘要: Java 程序在解析 HTML 文档时,相信大家都接触过 htmlparser 这个开源项目,我曾经在 IBM DW 上发表过两篇关于 htmlparser 的文章,分别是:从HTML中攫取你所需的信息 和扩展 HTMLParser 对自定义标签的处理能力。但现在我已经不再使用 htmlparser... 阅读全文
posted @ 2014-12-27 21:45 zhangj95 阅读(212) 评论(0) 推荐(0) 编辑
摘要: 这篇文章介绍了 HtmlParser 开源包和 HttpClient 开源包的使用,在此基础上实现了一个简易的网络爬虫 (Crawler),来说明如何使用 HtmlParser 根据需要处理 Internet 上的网页,以及如何使用 HttpClient 来简化 Get 和 Post 请求操作,构建... 阅读全文
posted @ 2014-12-27 20:58 zhangj95 阅读(315) 评论(0) 推荐(0) 编辑