随笔分类 - Lucene
摘要:前面总结了Lucene的基本使用,但大多数情况下,在多线程环境中总会出现多个线程同时访问索引的情况,这样不可免地会出现同步访问的问题。那么我们需要确定Lucene的线程安全性。我们先来看Lucene官网(http://wiki.apache.org/lucene-java/LuceneFAQ)上对几个问题的解答:Why am I getting an IOException that says "Too many open files"?The number of files that can be opened simultaneously is a system-wid
阅读全文
摘要:Lucene基本概念:Lucene中最基础的概念是索引(index)、段(Segement)、文档(document)、字段(field)、词条(term)和Tocken。 索引(Index)包含了一个文档的序列。 段(Segment):可以理解为一个子索引,添加索引时并不是每个document都马上添加到同一个索引文件,它们首先被写入到不同的小文件,然后再合并成一个大索引文件,这里每个小文件都是一个segment 文档(Document)是一些域(Field)的序列,用来描述文档(文档可以是一个 HTML 页面,一封电子邮件、一个文本文件、字符串或者数据库表的一条记录等)。一个 Docume
阅读全文

浙公网安备 33010602011771号