随笔分类 -  Nutch

摘要:1、Nutch简介 Nutch是一个由Java实 现的,开放源代码(open-source)的web搜索引擎。主要用于收集网页数据,然后对其进行分析,建立索引,以提供相应的接口来对其网页数据进行 查询的一套工具。其底层使用了Hadoop来做分布式计算与存储,索引使用了Solr分布式索引框架来做,S... 阅读全文
posted @ 2015-11-05 10:18 老瞿 阅读(293) 评论(0) 推荐(0)