10.lucene入门-常用API

1) 利用这个类可以对索引库进行增、删、改操作。

2) 利用构造方法IndexWriter indexWriter = newIndexWriter(directory,LuceneConfig.analyzer,MaxFieldLength.LIMITED)可以构造一个IndexWriter的对象。

3) addDocument 向索引库中添加一个Document

4) updateDocument 更新一个Document

5) deleteDocuments 删除一个Document

指向索引库的位置，有两种Directory

1) 通过FSDirectory.open(new File("./indexDir"))建立一个indexDir的文件夹，而这个文件夹就是索引库存放的位置。

2) 通过这种方法建立索引库时如果indexDire文件夹不存在，程序将自动创建一个，如果存在就用原来的这个。

3) 通过这个类可以知道所建立的索引库在磁盘上，能永久性的保存数据。这是优点

4) 缺点为因为程序要访问磁盘上的数据，这个操作可能引发大量的IO操作，会降低性能。

1) 通过构造函数的形式Directory ramdirectory = new RAMDirectory(fsdirectory)可以建立RAMDirectory。

2) 这种方法建立的索引库会在内存中开辟一定的空间，通过构造函数的形式把fsdirectory移动到内存中。

3) 这种方法索引库中的数据是暂时的，只要内存的数据消失，这个索引库就跟着消失了。

4) 因为程序是在内存中跟索引库交互，所以利用这种方法创建的索引的好处就在效率比较高，访问速度比较快。

1) 通过无参的构造函数可以创建一个Document对象。Document doc = new Document();

2) 一个Directory是由很多Document组成的。用户从客户端输入的要搜索的关键内容被服务器端包装成JavaBean，然后再转化为Document。这个转化过程的代码如下：

1) Field相当于JavaBean的属性。

2) Field的用法为：

new Field("title",article.getTitle(),Store.YES,Index.ANALYZED)

a) 第一个参数为属性

b) 第二个参数为属性值

c) 第三个参数为是否往索引库里存储

d) 第四个参数为是否更新引索

1) NO 不进行引索

2) ANALYZED 进行分词引索

3) NOT_ANALYZED 进行引索，把整个输入作为一个词对待。

a) 能存储的最大长度

b) 在IndexWriter的构造方法里使用

c) 值为：

1) LIMITED 限制的最大长度值为10000

2) UNLIMITED 没有限制的最大长度(一般不使用)

posted on 2016-10-24 13:46 Sharpest 阅读(328) 评论(0) 收藏举报