摘要: openjweb基于Apache Lucene3.0的全文索引技术实现方案qq:29803446一、为什么要使用全文索引技术? 在网站应用中,我们经常需要用到站内搜索的功能来查找指定的关键字。在网站的后台存储中,信息可能存储的地方主要有:数据库表、HTML静态页面文件、word、pdf、excel、ppt、txt等文本文件中。基于文件的全文检索当然是使用分词技术来实现。在Java开源产品中,Lucene是一个使用最广泛的全文搜索引擎,我们可以使用Lucene的API将文本的内容进行分词处理。经分词处理后,Lucene会将解析的分词增加到文件索引库中,然后我们可以通过分词查询技术,将与查询内容相 阅读全文
posted @ 2010-08-15 15:47 ajuanabc 阅读(161) 评论(0) 推荐(0)