随笔 - 18  文章 - 0 评论 - 43 trackbacks - 1

09 2010 档案
lucene的排序过滤和分页
摘要: 三、排序过滤和分页 仅仅把东西搜出来是不够的,好的检索工具还应当能够对检索的结果进行排序,优先将最相关的内容送出 或是按照某种规则,将检索结果送出。 1.文档得分规则 文档得分主要是由4部分内容来决定,即tf(词条频率)、idf(反转文档频率)、boost(Field的激励因子) 和lengthNorm(长度因子) tf:某个关键字在某文档中出现次数的平方根 idf:Math.log...阅读全文
posted @ 2010-09-01 13:49 雪山飞狐12345 阅读(443) | 评论 (0) 编辑
Lucene的查询语法
摘要: Lucene所支持的查询语法可见http://lucene.apache.org/java/3_0_1/queryparsersyntax.html (1) 语法关键字 + - && || ! ( ) { } [ ] ^ " ~ * ? : \ 如果所要查询的查询词中本身包含关键字,则需要用\进行转义 (2) 查询词(Term) Lucene支持两种查询词,一种是单一查询词,如"h...阅读全文
posted @ 2010-09-01 12:13 雪山飞狐12345 阅读(498) | 评论 (0) 编辑
Lucene 学习笔记 Query篇
摘要: IndexSearcher 构造函数 IndexSearcher继承于Searcher类,有四种构造函数,但最终以IndexReader作为实际的索引目录读取器 Searcher searcher=new IndexSearcher(String indexDir); Searcher searcher=new IndexSearcher(Directory directory) Searche...阅读全文
posted @ 2010-09-01 12:03 雪山飞狐12345 阅读(71) | 评论 (0) 编辑
Lucene并行查询多目录
摘要: 1、多字段搜索就是同时要一个以上的字段中的内容进行比较搜索,类似概念在SQL中就是select * from Table where a like '%query%' or b like '%query%'。Lucene.net中的单个字段查询大家都比较熟悉,这里对字段content进行搜索Query query = QueryParser.Parse(querystr,"content",new...阅读全文
posted @ 2010-09-01 10:25 雪山飞狐12345 阅读(63) | 评论 (0) 编辑