2013年1月10日

lucene solr小知识点

摘要: 转帖自http://yinyayun.blog.51cto.com/3095228/983619终于认真一次了,写一下最近学习solr和lucene遇到的一些小知识点: 首先说一下lucene,solr的奠基石,都说solr是对lucene的封装,在这我们也就这么想吧,但是并不是简单的封装,说深了,我也不理解,也是个小菜鸟一个。我现在用lucene主要是为大数据建立起索引,然后查询。 当然,在建立索引的过程中也有好多需要我们这些小菜鸟关注的,也许一开始的时候大家都不是很关心这些细节。 1、field是否存储。Documentdoc=newDocument();doc.add(newFiel.. 阅读全文

posted @ 2013-01-10 10:38 元来元去 阅读(249) 评论(0) 推荐(0)

Solr,Lucene 优化

摘要: 1. 从schema入手:1> 你的数据是都需要store的么, 比如一些字段只需要提供结果搜索而不作为结果返回, 那么需要将store设置为false从而减少数据量。2> 你的所有字段都需要highlight么, 如果不需要highlight则可以将term vector关掉。3> 确认你在schema没保存太多无用的信息(即不用来搜索也不用来返回)。4> 你的分词算法是否合理, 如果你使用的是ngram的分词方法, 可以通过设置最大和最小分词长度来限制分词数据。5> 你的业务上是否有明显的条目信息, 比如你索引的东西是一本书, 很多其他的信息在mysql或者其 阅读全文

posted @ 2013-01-10 10:35 元来元去 阅读(360) 评论(0) 推荐(0)

solr与lucene

摘要: Solr最显著的特点就是其分布式,不然的话跟Lucene也就没多大区别了,那么什么时候我们会用到分布式搜索呢?那就是当索引过多的时候,多到了在一台服务器上存放时会因此而影响到搜索速度,这个时候就可以考虑将索引划分成多个分片,搜索时在多个分片上进行搜索,最后将多个搜索结果进行合并。接下来,我们将在一台服务器上使用solr-3.6.0为例来体验一下Solr的分布式搜索特性。在一台服务器上,我们将创建两个端口不一样的Solr服务,以此来模拟其分布式搜索功能。将apache-solr-3.6.0解压到/usr/local目录下,步骤为:1、做一个拷贝cd apache-solr-3.6.0cp -r 阅读全文

posted @ 2013-01-10 10:33 元来元去 阅读(220) 评论(0) 推荐(0)

很好的SOLR、LUCENE学习资料

摘要: 很好的SOLR、LUCENE学习资料(LUCENE)转自Lucene/Solr开发经验[原]作者 张驰有道注意:该文章所属Blog中的日记遵循Creative Commons(创作共用)授权,您可以任意转载,转载时请务必以超链接形式标明文章原始出处和作者1 lucene简介1.1 什么是luceneLucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com 或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。1.2 lucene能做什么要回答这个问题,先要了解lucene的本质。实际上lucene的功能很单一,说到底,就是你给它若 阅读全文

posted @ 2013-01-10 10:28 元来元去 阅读(241) 评论(0) 推荐(0)

Lucene/Solr开发经验[转载]

摘要: Lucene/Solr开发经验[转载]转载:张驰有道http://www.jinsehupan.com/blog/?p=25多谢他的介绍。1、开篇语2、概述3、渊源4、初识Solr5、Solr的安装6、Solr分词顺序7、Solr中文应用的一个实例8、Solr的检索运算符[开篇语]按照惯例应该写一篇技术文章了,这次结合Lucene/Solr来分享一下开发经验。Lucene是一个使用Java语言写的全文检索开发包(API),利用它可以实现强大的检索功能,它的详细介绍大家可以去Google上搜索一下,本文重点放在Solr相关的讨论上。[概述]目前国内研究Solr的人不多,而且大多是因为项目开发需要 阅读全文

posted @ 2013-01-10 10:01 元来元去 阅读(247) 评论(0) 推荐(0)

导航