X-man

导航

随笔分类 -  文本搜索--lucene

Lucene搜索方法总结
摘要:转自:summerbellhttp://www.iteye.com/topic/5693581.多字段搜索使用 multifieldqueryparser 可以指定多个搜索字段。query query = multifieldqueryparser.parse(”name*”, new string... 阅读全文

posted @ 2015-04-19 16:26 雨钝风轻 阅读(357) 评论(0) 推荐(0)

lucene索引日期和数字
摘要:1.用途。 索引数字的场景主要有两种:一是把它们当作字符串一样处理,比如“要是搁以前,术士能暴击10000多,有木有!”中的"10000",它和其它的词没什么区别,你可以把它仅仅想成一个字符串;另一种场景则是某个域只索引数字,且可以搜索数字的范围等,比如设计了某个Field存储邮件的大小,现在要搜... 阅读全文

posted @ 2015-04-18 21:40 雨钝风轻 阅读(2897) 评论(0) 推荐(0)

lucene 3.0.2 + 多文件夹微博数据(时间,微博)构建索引
摘要:package lia.meetlucene;import java.io.File;import java.io.IOException;import java.util.LinkedList;import javax.xml.parsers.DocumentBuilder;import java... 阅读全文

posted @ 2015-04-18 15:54 雨钝风轻 阅读(315) 评论(0) 推荐(0)

lucene 使用注意
摘要:1.建立索引时,忘记writer.close();结果:正常结果: 阅读全文

posted @ 2015-04-18 14:49 雨钝风轻 阅读(151) 评论(0) 推荐(0)

lucene 建立索引的不同方式
摘要:1.创建一个简单的索引:package lia.meetlucene;import java.io.File;import org.apache.lucene.document.Document;import org.apache.lucene.document.Field;import org.a... 阅读全文

posted @ 2015-04-16 20:44 雨钝风轻 阅读(262) 评论(0) 推荐(0)

lucene 建立索引的过程
摘要:时间 2014-06-30 17:56:52  CSDN博客 原文 http://blog.csdn.net/caohaicheng/article/details/35992149 看lucene主页(http://lucene.apache.org/)上目前lucene已经到4.9.0... 阅读全文

posted @ 2015-04-16 20:04 雨钝风轻 阅读(482) 评论(0) 推荐(0)

lucene 3.0.2 search 各种各样的Query类型
摘要:http://blog.sina.com.cn/s/blog_61d2047c010195mo.htmllucene的这种各种各样的查询类型1、TermQuery 最简单的Query类型,某一个field是否含有一个term的value2、TermRangeQuery 由于term在index中... 阅读全文

posted @ 2015-03-24 17:59 雨钝风轻 阅读(497) 评论(0) 推荐(0)

lucene 3.0.2 中文分词
摘要:package lia.meetlucene;import java.io.IOException;import java.io.Reader;import java.io.StringReader;import org.apache.lucene.analysis.Analyzer;import ... 阅读全文

posted @ 2015-03-22 21:56 雨钝风轻 阅读(196) 评论(0) 推荐(0)

java 从args[]中赋值和程序直接赋值不一样?
摘要:System.out.println("对应的中文: " + decodeUnicode(args[0]));赋值args[0] = “\u7b80\u4ecb”System.out.println("对应的中文: " + decodeUnicode(“\\u7b80\\u4ecb”));两者才会相... 阅读全文

posted @ 2015-03-20 17:12 雨钝风轻 阅读(659) 评论(0) 推荐(0)

java 中文转换成Unicode编码和Unicode编码转换成中文
摘要:转自:一叶飘舟http://blog.csdn.net/jdsjlzx/article/details/7058823package lia.meetlucene;import java.io.IOException;import org.apache.lucene.index.CorruptInd... 阅读全文

posted @ 2015-03-20 15:44 雨钝风轻 阅读(866) 评论(0) 推荐(0)

lucene 3.0.2 操作进阶
摘要:转自:Banningshttp://blog.csdn.net/zhangao0086/article/details/6292950Analyzer(分词器)分词器能以某种规则对关键字进行分词,将分好的词放到目录中,以作为检索到的条件,在创建索引时会使用到分词器,在搜索时也将用到分词器,这两个地方... 阅读全文

posted @ 2015-03-17 20:54 雨钝风轻 阅读(337) 评论(0) 推荐(0)

Lucene实战(第2版)》
摘要:《Lucene实战(第2版)》基于Apache的Lucene 3.0,从Lucene核心、Lucene应用、案例分析3个方面详细系统地介绍了Lucene,包括认识Lucene、建立索引、为应用程序添加搜索功能、高级搜索技术、扩展搜索、使用Tika提取文本、Lucene的高级扩展、使用其他编程语言访问... 阅读全文

posted @ 2015-03-17 16:33 雨钝风轻 阅读(284) 评论(0) 推荐(0)

lucene 3.0.2 搜索
摘要:1.lucene词频转载:http://mxdxm.iteye.com/blog/989031lucene in action作为action系列,确实坚持了其实用性的特色。全书花了很大的篇幅来讲解查询的解析,结果的优化和lucene应用上。很适合要做全文检索的人学习使用。但是lucen的功能决不仅... 阅读全文

posted @ 2015-03-14 15:51 雨钝风轻 阅读(230) 评论(0) 推荐(0)

lucene 3.0.2 基本操作入门
摘要:转自:Banningshttp://blog.csdn.net/zhangao0086/article/details/6292950我们为什么需要Lucene?任何的的查询功能都类似,都是对文本内容的搜索,说白了,就是找出含有指定字符串的的资源,只是查找的范围不同而已.目前的主流搜索都是全文搜索,... 阅读全文

posted @ 2015-03-14 11:01 雨钝风轻 阅读(199) 评论(0) 推荐(0)

java语法
摘要:1.try catch() finally{()甚至最后面还可以 catch()捕获异常的,如果程序出现异常,会抛出异常,catch中会进行响应捕获处理,而finally是程序中必须要执行的一部分,不论是不是发生异常通常在finally语句中是进行资源的清除工作。如关闭打开的文件和通讯句柄,或... 阅读全文

posted @ 2015-03-10 11:57 雨钝风轻 阅读(118) 评论(0) 推荐(0)

《Lucene实战(第2版)》 配书代码在IDEA下的编译方法
摘要:参考: hankcshttp://www.hankcs.com/program/java/lucene-combat-2nd-edition-book-with-code-compiled-under-the-idea.html最基础的Ant编译:点击右边的加号载入lia2e下的build.xml脚... 阅读全文

posted @ 2015-03-09 15:12 雨钝风轻 阅读(542) 评论(0) 推荐(0)

lucene学习
摘要:信息检索就是从信息集合中找出与用户需求相关的信息。 被检索的信息除了文本外,还有图像、音频、视频等多媒体信息,这里我们主要来说说文本信息的检索。全文检索:把用户的查询请求和全文中的每一词进行比较,不考虑查询请求与文本语义上的匹配, 在信息检索工具中,全文检索是最具通用性和实用性的。(通俗的讲就是匹配... 阅读全文

posted @ 2015-03-07 20:18 雨钝风轻 阅读(329) 评论(0) 推荐(0)

Eclipse下初用lucene
摘要:lucene是apache的一个开源项目,一个开放源代码的全文检索引擎工具包。1. 首先下载lucene,下载地址来自《lucene实战》第2版(页面加载比较忙,等~)http://www.manning.com/hatcher3/2. 解压下载的包,打开eclipse,新建工程(命名为lucene... 阅读全文

posted @ 2015-01-24 15:38 雨钝风轻 阅读(593) 评论(0) 推荐(0)