Java EE search lucene xapian
s
| 名称 | Lucene |
|---|---|
| 介绍 | Lucene是一个开源的全文搜索引擎工具包,用于将文本内容进行索引搜索。它是一个高性能、可扩展的搜索技术解决方案。 |
| 开发语言 | Java |
| 版本历史 |
Lucene于1999年发布第一个版本,目前最新的稳定版本是8.10.1 - [Lucene 官方网站](https://lucene.apache.org/) |
| 功能特点 |
1. 高效的全文搜索和匹配算法; 2. 支持多种索引数据结构,如倒排索引; 3. 提供滤器和分析器来处理文本数据; 4. 支持多种查询类型,如布尔查询、短语查询等; 5. 可扩展性强,可以自插件和定制功能; 6. 支持分布式搜索 |
| 核心组件 |
- Analyzer:文本分析器,用于将文本数据拆分为单词。 |
| 应用领域 | Lucene被广泛应用于各种领域,如企业搜索、电子商务网站、网站搜索、日志分析等,能够为用户提供高效的搜索和索功能。 |
| 相关项目 | Lucene有几个相关项目,如Solr(基于Lucene的企业级搜索平台)、Elasticsearch(分布式实时搜索和分析引擎)等,它们在Lucene的基础上提供了丰富的功能和更易用的接口。 |
目录
搜索引擎开发工具、框架
http://open-open.com/open24332.htm
http://lucene.apache.org/java/docs/index.pdf
http://jakarta.apache.org/lucene/docs/index.html
http://lucene.apache.org/images/lucene_green_300.gif
http://lucene.apache.org/java/2_4_1/api/index.html
Lucene 2.4.1 API
x
![]()
Apache Lucene是一个基于Java全文搜索引擎,利用它可以轻易地为Java软件加入全文搜寻功能。Lucene的最主要工作是替文件的每一个字作索引,索 引让搜寻的效率比传统的逐字比较大大提高,Lucen提供一组解读,过滤,分析文件,编排和使用索引的API,它的强大之处除了高效和简单外,是最重要的 是使使用者可以随时应自已需要自订其功能。












Ms Word,Ms Excel,Ms PowerPoint,RTF,PDF,XML,HTML,TXT,Open Office序列和JavaBeans。针对JavaBeans的索引特别有用当我们要对数据库进行索引或刚好用户使用持久层ORM技术 如:Hibernate,JDO,Torque,TopLink进行开发时。

Plain text HTML, XHTML XML PDF (Portable Document Format) RTF (Rich Text Format) Microsoft Office: Word, Excel, Powerpoint, Visio, Publisher Microsoft Works OpenOffice 1.x: Writer, Calc, Impress, Draw StarOffice 6.x - 7.x+: Writer, Calc, Impress, Draw OpenDocument (OpenOffice 2.x, StarOffice 8.x) Corel WordPerfect, Quattro, Presentations Emails (.eml files)






IKAnalyzer3.0特性: 采用了特有的“正向迭代最细粒度切分算法“,具有50万字/秒的高速处理能力。 采用了多子处理器分析模式,支持:英文字母(IP地址、Email、URL)、数字(日期,常用中文数量词,罗马数字,科学计数法),中文词汇(姓名、地名处理)等分词处理。 优化的词典存储,更小的内存占用。支持用户词典扩展定义 针对Lucene全文检索优化的查询分析器IKQueryParser(作者吐血推荐);采用歧义分析算法优化查询关键字的搜索排列组合,能极大的提高Lucene检索的命中率。
Welcome to the Xapian project website.
Xapian is an Open Source Search Engine Library, released under the GPL . It's written in C++ , with bindings to allow use from Perl , Python , PHP , Java , Tcl , C# and Ruby (so far!)
Xapian is a highly adaptable toolkit which allows developers to easily add advanced indexing and search facilities to their own applications. It supports the Probabilistic Information Retrieval model and also supports a rich set of boolean query operators.
If you're after a packaged search engine for your website, you should take a look at Omega : an application we supply built upon Xapian. Unlike most other website search solutions, Xapian's versatility allows you to extend Omega to meet your needs as they grow.
The latest stable version is 1.0.15 , released on 2009-08-26.
The latest development version is 1.1.2 , released on 2009-07-23.
features
history
mailing lists
docs
current users
commercial support
download
bleeding edge
bugs
contact us
search this website
end

网页管理中心标准
浙公网安备 33010602011771号