03 2012 档案

Lucene3.5自学4--建索引相关知识总结
摘要:Lucene简单介绍(该部分摘自网络)Lucene是一个高效的,基于Java的全文检索库。所以在了解Lucene之前要费一番工夫了解一下全文检索。那么什么叫做全文检索呢?这要从我们生活中的数据说起。我们生活中的数据总体分为两种:结构化数据和非结构化数据。结构化数据:指具有固定格式或有限长度的数据,如数据库,元数据等。非结构化数据:指不定长或无固定格式的数据,如邮件,word文档等。当然有的地方还会提到第三种,半结构化数据,如XML,HTML等,当根据需要可按结构化数据来处理,也可抽取出纯文本按非结构化数据来处理。非结构化数据又一种叫法叫全文数据。按照数据的分类,搜索也分为两种:对结构化数据的搜 阅读全文

posted @ 2012-03-04 19:58 情非得已swust 阅读(786) 评论(0) 推荐(0)

Lucene3.5自学系列3-索引的操作-IndexReader
摘要:在Lucene3.5中,对索引操作主要是IndexReader类控制,现在写个实例(基本操作都包括了),但是有些东西在3.5中已经过时了,具体现在不详说---------这几天我发布都是带代码的实例,明白会写个总结,包括3.5中部分的概念,以及过时的方法的替换都将详述等东西。//目前这几篇文章不适合初学者入门看,需要有点概要基础的能看懂,写在这儿只是给自己一个存档,没有专门为大家而写,请原谅,有时间会写个总结性东西,大家参考着并结合API,应该能理解的/好了下面是今天的学习的 1 package cn.swust.lucene; 2 import java.io.File; 3 impo... 阅读全文

posted @ 2012-03-03 20:41 情非得已swust 阅读(1360) 评论(1) 推荐(0)

Lucene3.5自学系列2-查询的建立--IndexSearch
摘要:暂时现写个实例,等有时间在慢慢详写 1 package cn.swust.lucene; 2 3 import java.io.File; 4 import java.io.IOException; 5 6 import org.apache.lucene.analysis.Analyzer; 7 import org.apache.lucene.analysis.standard.StandardAnalyzer; 8 import org.apache.lucene.document.Document; 9 import org.apache.lucene.index.CorruptI.. 阅读全文

posted @ 2012-03-01 20:33 情非得已swust 阅读(846) 评论(0) 推荐(0)