摘要: 写term索引文件: 介绍完Lucene中term的概念,现在我们开始重新回到正体,建立索引数据库的term信息。 在介绍DocumentWriter类的时候,已经是用分词器将term提取了出来,并进行了排序,最后写了term的两个文件,frq(term频数)和prx(term位置)。接着,DocumentWriter类就要是用别的类来继续索引的建立了。 TermInfosWriter: Te... 阅读全文
posted @ 2008-07-17 21:47 wanghoney 阅读(1237) 评论(0) 推荐(0)
摘要: Term索引信息: DocumentWriter类写Field信息和Term信息。Field索引信息是调用FieldInfos和FieldWriter两个类完成的,这在上一节已经描述。Term索引信息则由DocumentWriter类和其他类共同完成。DoucmentWriter类完成了term的频数和位置信息。现在接着DocumentWriter写term信息这条线,继续索引信息的建立。 1... 阅读全文
posted @ 2008-07-14 22:42 wanghoney 阅读(762) 评论(0) 推荐(0)
摘要: Field信息: 在DocumentWriter类中曾经描述,DocumentWriter类的一个功能是调用与 Field相关的类,写Field信息。写Field信息有两个类FieldInfos类和FieldWriter类,前者是用于写Field name信息,后者写Field value信息。 1.Field name信息: Field name信息是用FieldInfo结构体表示,即Fie... 阅读全文
posted @ 2008-07-12 22:57 wanghoney 阅读(403) 评论(0) 推荐(0)
摘要: 在随笔“Lucene:(一)建立索引文件:2。建立索引文件(一)”中提到,写索引文件从IndexWriter类开始;而IndexWriter类写索引可以看成两个方面,其中之一为IndexWriter使用SegmentInfos类写segment文件(上文介绍),另一个就是调用DocumentWriter完成写索引文件的余下工作。 DocumentWriter类也不是一次将剩下的所有索引文件写完,它... 阅读全文
posted @ 2008-07-09 22:24 wanghoney 阅读(472) 评论(0) 推荐(0)
摘要: Segment文件: 在随笔“Lucene:(一)建立索引文件:2。建立索引文件(一)”中提到,写索引文件从IndexWriter类开始;而IndexWriter类写索引可以看成两个方面,其中之一为IndexWriter使用SegmentInfos类写segment文件。 Segment文件实际可以看成索引的概述文件,包括了所有用于建立索引的文件的概述信息。Segment类,即Segment文件中... 阅读全文
posted @ 2008-07-07 21:32 wanghoney 阅读(977) 评论(2) 推荐(0)
摘要: 写索引文件: 索引文件在未合并前是有多个文件组成的,这些文件综合在一起,才为一个实质上的索引文件;这些文件拥有相同的名字,不同的是后缀名;下面,依次介绍这些文件,介绍方式为:从建立索引的类开始,一步步追踪,最后总结。 IndexWriter类 写索引文件从IndexWriter类开始。IndexWriter需要三个参数:分别是字典(Lucene自定义的,存放索引... 阅读全文
posted @ 2008-07-02 00:26 wanghoney 阅读(722) 评论(0) 推荐(0)
摘要: Lucene索引复合文件 Lucene的索引文件有多个文件组成,包括记载域信息的文件、segment信息的文件、term信息的文件;Lucene将这些文件复合起来存储; 这里将阐述以下概念: = 1 \* GB3 ①Directory:索引字典,Lucene自定义概念,如同现实中的字典存放词语一样,该字典存放文件;字典的操作包括向字典中添加文件,删除文件等... 阅读全文
posted @ 2008-06-30 01:17 wanghoney 阅读(956) 评论(3) 推荐(0)