随笔分类 - dotLucene
sth about Lucene
摘要:Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下: 0)设有两篇文章1和2 文章1的内容为:Tom lives in Guangzhou,I live in Guangzhou too. 文章2的内容为:He once lived in S...
阅读全文
摘要:DotLucene是什么?搜索引擎的种类, 以及常见搜索算法,DotLucene是基于什么算法实现的 索引的基础概念和实现搜索的基础概念和实现Lucene的高级技巧 DotLucene的分析器中文分词 ==================================搜索引擎一般来讲,可...
阅读全文
摘要:NLucene是将 Lucene 从 Java 移植到 .NET 的一个 SourceForge 项目,它从 Lucene 1.2 版本转化而来。 Lucene.Net因为 NLucene 项目到2002年就没有再推出新的版本,可Lucene 却一直在发展,于是有人把Lucene 1.3版移植到.N...
阅读全文
摘要:DotLucene的发展历史 Lucene-〉NLucene-〉Lucene.Net-〉DotLucene Lucene 是一个基于 Java 的全文索引工具包,Lucene的贡献者 Doug Cutting 是一位资深全文索引/检索专家,曾经是 V-Twin 搜索引擎(Apple 的 Coplan...
阅读全文
摘要:1 、问题的来源 增加分词以后结果的准确度提高了,但是用户反映返回结果的速度很慢。原因是, Lucene 做每一篇文档的相关关键词的高亮显示时,在运行时执行了很多遍的分词操作。这样降低了性能。 2 、解决方法 在 Lucene1.4.3 版本中的一个新功能可以解决这个问题。 Term Vect...
阅读全文
摘要:1 联合两个索引查询,已解决: IndexSearcher[] searchers = new IndexSearcher[2]; searchers[0] = new IndexSearcher(m_indexpath); searchers[1] = new IndexSearcher(m_o...
阅读全文
摘要:本系列笔记将以DotLucene的命名空间组织行文,阅读的DotLucene版本是1.9.RC1,并且以更好的使用而非研究为目的阅读。也就是说要避难就易拉。 0), DotLucene主要命名空间概览: 命名空间 功能说明 ...
阅读全文