摘要: 这个写的比较抱歉,因为已经开始阅读Index部分了,Documents这个部分很早之前写了,但觉得没什么价值没发表,荒芜了一段时间,现在又开始了.这篇仅仅为了系列的完整.也发表了吧,大家随便仍鸡蛋吧 :).这个命名空间的类相对较少,也相对较简单,一共才四个类,主要的类是Document,Field,在DotLucene中,可以这样认为,Document就是一种类似于数据库中的数据列的数据结构,Fi...阅读全文
posted @ 2006-10-24 01:22 kwklover 阅读(3574) 评论(1) 编辑
摘要: 原理部分,可以参考DotLucene源码浅读笔记(1) : Lucene.Net.Analysis ,本篇是依据上篇文章的分析,编写出的简单中文分词器(ChineseAnalyzer).从DotLucene源码浅读笔记(1) : Lucene.Net.Analysis可以知道,与分词有关的主要是两个基类:词法分析器(Analyzer) :词法过滤和分析的类,实际上是对分词器, 过滤器的综合包装类。...阅读全文
posted @ 2006-10-24 01:09 kwklover 阅读(7096) 评论(5) 编辑