随笔分类 -  lucene

lucene分词器与搜索
摘要:一、分词器 lucene针对不同的语言和虚伪提供了许多分词器,我们可以针对应用的不同的需求使用不同的分词器进行分词。我们需要注意的是在创建索引时使用的分词器与搜索时使用的分词器要保持一致。否则搜索的结果就不是我们期望的结果。lucene提供的常规分词器如下:•StandardAnalyzer 标准... 阅读全文

posted @ 2015-08-03 10:36 烟火_ 阅读(975) 评论(0) 推荐(0)

lucene索引
摘要:一、lucene索引1、文档层次结构索引(Index):一个索引放在一个文件夹中;段(Segment):一个索引中可以有很多段,段与段之间是独立的,添加新的文档可能产生新段,不同的段可以合并成一个新段;文档(Document):文档是创建索引的基本单位,不同的文档保存在不同的段中,一个段可以包含多个... 阅读全文

posted @ 2015-08-03 09:59 烟火_ 阅读(781) 评论(0) 推荐(0)

lucene入门
摘要:一、lucene简介 Lucene是apache下的一个靠性能的、功能全面的用纯java开发的一个全文搜索引擎库。它几乎适合任何需要全文搜索应用程序,尤其是跨平台。lucene是开源的免费的工程。lucene使用简单但是提供的功能非常强大。相关特点如下:在硬件上的速度超过150GB/小时更小的内存... 阅读全文

posted @ 2015-07-31 15:32 烟火_ 阅读(1355) 评论(0) 推荐(2)

导航