Lucene学习第一天
1.Lucene 的贡献者Doug Cutting是一位资深全文索引/检索专家,曾经是V-Twin搜索引擎(Apple的Copland操作系统的成就之一)的主要开发者,后在Excite担任高级系统架构设计师,目前从事于一些INTERNET底层架构的研究。他贡献出的Lucene的目标是为各种中小型应用程序加入全文检索功能。2001年年底成为APACHE基金会jakarta的一个子项目。
}Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能 。Lucene 目前是 Apache Jakarta 家族中的一个开源项目。也是目前最为流行的基于 Java 开源全文检索工具包。
2.Lucene的优势:
高效-信息检索 (Information Retrieval)
成熟-经过多个项目检验
免费-开源(open-source project in Java)
3.示例简单的标准分词的使用
import java.io.IOException;
import java.io.StringReader;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.Token;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
public class TestLucene {
/**
* @param args
* @throws IOException
*/
public static void main(String[] args) throws IOException {
Analyzer analyzer = new StandardAnalyzer();//创建一个标准的分词器
TokenStream tokenStream = analyzer.tokenStream("",new StringReader("this is a student good boy"));
Token token = new Token();
while(tokenStream.next(token)!= null){
System.out.println(token);
}
}
}
浙公网安备 33010602011771号