代码改变世界

文章分类 -  全文检索

Lucene学习笔记

2013-12-02 10:03 by hduhans, 546 阅读, 收藏,
摘要: Lucene是一套用于全文检索和搜寻的开源程式库,由Apache软件基金会支持和提供。Lucene提供了一个简单却强大的应用程式接口,能够做全文索引和搜寻。它是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎。 lucene-3.5.0.zip下载:http://pan.baidu.com/s/11lKHu 索引和查看必备工具lukeall-3.5.0.jar下载:http://pan.baidu.com/s/1vgjso一、Lucene的基本使用1、选项说明 1) 存储域选项Field.Store.YES... 阅读全文

Sphinx与Coreseek中文全文检索

2013-11-19 17:57 by hduhans, 356 阅读, 收藏,
摘要: Sphinx是一个基于SQL的全文检索引擎,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索。 shinx优点:1) 高速索引。建立索引速度可达10M/s; 2) 高速搜索。2-4G的文本量平均查询速度不到0.1秒; 3) 高可用性。单CPU最大支持100GB文本,100M文档;一、sphinx配置及使用1、下载 1) 官方:http://sphinxsearch.com/downloads/release/ 2) 网盘:sphinx-2.1.3-release-win32.... 阅读全文