IndexWriter

 

1) 利用这个类可以对索引库进行增、删、改操作。

2) 利用构造方法IndexWriter indexWriter = newIndexWriter(directory,LuceneConfig.analyzer,MaxFieldLength.LIMITED)可以构造一个IndexWriter的对象。

3) addDocument 向索引库中添加一个Document

4) updateDocument 更新一个Document

5) deleteDocuments 删除一个Document

5.1.2 Directory

 

指向索引库的位置,有两种Directory

5.1.2.1FSDirectory

1) 通过FSDirectory.open(new File("./indexDir"))建立一个indexDir的文件夹,而这个文件夹就是索引库存放的位置。

2) 通过这种方法建立索引库时如果indexDire文件夹不存在,程序将自动创建一个,如果存在就用原来的这个。

3) 通过这个类可以知道所建立的索引库在磁盘上,能永久性的保存数据。这是优点

4) 缺点为因为程序要访问磁盘上的数据,这个操作可能引发大量的IO操作,会降低性能。

5.1.2.2RAMDirectory

1) 通过构造函数的形式Directory ramdirectory = new RAMDirectory(fsdirectory)可以建立RAMDirectory。

2) 这种方法建立的索引库会在内存中开辟一定的空间,通过构造函数的形式把fsdirectory移动到内存中。

3) 这种方法索引库中的数据是暂时的,只要内存的数据消失,这个索引库就跟着消失了。

4) 因为程序是在内存中跟索引库交互,所以利用这种方法创建的索引的好处就在效率比较高,访问速度比较快。

5.1.3 Document

 

1) 通过无参的构造函数可以创建一个Document对象。Document doc = new Document();

2) 一个Directory是由很多Document组成的。用户从客户端输入的要搜索的关键内容被服务器端包装成JavaBean,然后再转化为Document。这个转化过程的代码如下:

 

5.1.4 Field

 

 

1) Field相当于JavaBean的属性。

2) Field的用法为:

new Field("title",article.getTitle(),Store.YES,Index.ANALYZED)

a) 第一个参数为属性

b) 第二个参数为属性值

c) 第三个参数为是否往索引库里存储

d) 第四个参数为是否更新引索

1) NO 不进行引索

2) ANALYZED 进行分词引索

3) NOT_ANALYZED 进行引索,把整个输入作为一个词对待。

5.1.5 MaxFieldLength

 

a) 能存储的最大长度

b) 在IndexWriter的构造方法里使用

c) 值为:

1) LIMITED 限制的最大长度 值为10000

2) UNLIMITED 没有限制的最大长度(一般不使用)

posted on 2016-10-24 13:46  Sharpest  阅读(321)  评论(0)    收藏  举报