唐朝程序员

我来自唐朝

2007年1月9日

Lucene.net系列六 -- search 下

摘要: 本文主要结合测试案例介绍了Lucene下的各种查询语句以及它们的简化方法.通过本文你将了解Lucene的基本查询语句,并通过学习相关的测试代码以加强了解.源代码下载具体的查询语句在了解了SQL后, 你是否想了解一下查询语法树?在这里简要介绍一些能被Lucene直接使用的查询语句.1. TermQuery查询某个特定的词,在文章开始的例子中已有介绍.常用于查询关键字. ... 阅读全文

posted @ 2007-01-09 01:22 唐朝程序员 阅读(302) 评论(0) 推荐(0)

Lucene.net 系列五 --- search 上

摘要: 在前面的系列我们一直在介绍有关索引建立的问题,现在是该利用这些索引来进行搜索的时候了,Lucene良好的架构使得我们只需要很少的几行代码就可以为我们的应用加上搜索的功能,首先让我们来认识一下搜索时最常用的几个类.查询特定的某个概念当我们搜索完成的时候会返回一个按Sorce排序的结果集Hits. 这里的Score就是接近度的意思,象Google那样每个页面都会有一个分值,搜索结果按分值排列. 如同你... 阅读全文

posted @ 2007-01-09 01:22 唐朝程序员 阅读(201) 评论(0) 推荐(0)

Lucene.net 系列四 --- index 下

摘要: 本文将介绍有关索引并发控制的问题,以结束对Lucene.net建立索引问题的讨论.1. 允许任意多的读操作并发.即可以有任意多的用户在同一时间对同一份索引做查询工作.2. 允许任意多的读操作在索引被正在被修改的时候进行.即哪怕索引正在被优化,添加删除文档,这时也是允许用户对索引进行查询工作. (it’s so cool.)3. 同一时间只允许一个对索引修改的操作.即同一时间只允许IndexWrit... 阅读全文

posted @ 2007-01-09 01:21 唐朝程序员 阅读(265) 评论(0) 推荐(0)

Lucene.net 系列三 --- index 中

摘要: 本文将进一步讨论有关Lucene.net建立索引的问题:主要包含以下主题:1.索引的权重2.利用IndexWriter 属性对建立索引进行高级管理3.利用RAMDirectory充分发挥内存的优势4.利用RAMDirectory并行建立索引5.控制索引内容的长度6.Optimize 优化的是什么?源代码下载本文将进一步讨论有关Lucene.net建立索引的问题:索引的权重根据文档的重要性的不同,显... 阅读全文

posted @ 2007-01-09 01:20 唐朝程序员 阅读(268) 评论(0) 推荐(0)

Lucene.net 系列二 --- index (上)

摘要: Lucene建立Index的过程: 1. 抽取文本. 比如将PDF以及Word中的内容以纯文本的形式提取出来.Lucene所支持的类型主要为String,为了方便同时也支持Date 以及Reader.其实如果使用这两个类型lucene会自动进行类型转换. 2. 文本分析. Lucene将针对所给的文本进行一些最基本的分析,并从中去除一些不必要的信息,比如一些常用... 阅读全文

posted @ 2007-01-09 01:18 唐朝程序员 阅读(321) 评论(0) 推荐(0)

导航