摘要: 以下是搜集的一些网络爬虫框架资料: 1、Nutch(http://nutch.apache.org/) 这是一个开源Java 实现的搜索引擎,提供了我们运行自己的搜索引擎所需的全部工具,包括全文搜索和Web爬虫。Nutch目前最新的版本为version v2.3。 2、Crawler4j Crawl 阅读全文
posted @ 2017-04-19 23:22 代表月亮消灭bug 阅读(2401) 评论(0) 推荐(0) 编辑