随笔分类 - 5 搜索引擎
摘要:From http://alartin.iteye.com/blog/42867and http://www.iteye.com/blogs/tag/luceneLucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包, 即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。 Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎Solr是一个基于Lucene java库的企
阅读全文
摘要:Lucene 简介 Lucene 是一个基于 Java 的全文信息检索工具包, 它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能。现有的基于Lucene的搜索功能: 比如 Eclipse 的帮助系统的搜索功能 许多电商网站中的产品分类信息查询Lucene 能够为文本类型的数据建立索引, 所以你只要能把你要索引的数据格式转化的文本的,Lucene 就能对你的文档进行索引和搜索。 不指定要索引的文档的格式也使 Lucene 能够几乎适用于所有的搜索应用程序。索引和搜索 Lucene 软件包分析 Package: org.apache.lucene.docum...
阅读全文
摘要:http://baike.baidu.com/view/46642.htmNutch和Lucene Nutch是基于Lucene的。Lucene为Nutch提供了文本索引和搜索的API。 一个常见的问题是:我应该使用Lucene还是Nutch? 最简单的回答是:如果你不需要抓取数据的话,应该使用Lucene。 常见的应用场合是:你有数据源,需要为这些数据提供一个搜索页面。在这种情况下,最好的方式是直接从数据库中取出数据并用Lucene API 建立索引。 在你没有本地数据源,或者数据源非常分散的情况下,应该使用Nutch。Solr使用入门指南http://blog.csdn.net/...
阅读全文
浙公网安备 33010602011771号