随笔分类 -  Solr

摘要:schema.xml是用来定义索引数据中的域的,包括域名称,域类型,域是否索引,是否分词,是否存储,是否标准化即Norms,是否存储项向量等等。 schema.xml配置文件的根元素就是schema,有个name属性,name属性值可以随便配,根元素没什么好说的,schema元素下主要有两个标签元素 阅读全文
posted @ 2017-05-04 14:45 atzuge 阅读(217) 评论(0) 推荐(0)
摘要:1.维护索引库 添加:添加一个json格式的文件就可以。 修改:在solr中没有update,只需要添加一个新的文档,要求文档id和被修改文档的id一致。原理是先删除后添加。 删除:使用xml格式。 删除两种方法: 1、根据id删除: <delete> <id>test001</id> </dele 阅读全文
posted @ 2016-10-27 11:27 atzuge 阅读(335) 评论(0) 推荐(0)
摘要:第一步:使用IK-Analyzer。把分析器的文件夹上传到服务器。 第二步:需要把分析器的jar包添加到solr工程中。 [root@bogon IK Analyzer 2012FF_hf1]# cp IKAnalyzer2012FF_u1.jar /usr/local/solr/tomcat/we 阅读全文
posted @ 2016-10-26 18:55 atzuge 阅读(346) 评论(0) 推荐(0)
摘要:1.什么是SolrCloud SolrCloud(solr 云)是Solr提供的分布式搜索方案,当你需要大规模,容错,分布式索引和检索能力时使用 SolrCloud。当一个系统的索引数据量少的时候是不需要使用SolrCloud的,当索引量很大,搜索请求并发很高,这时需要使用SolrCloud来满足这 阅读全文
posted @ 2016-08-10 16:37 atzuge 阅读(582) 评论(0) 推荐(0)
摘要:1.zookeeper是个什么玩意? 顾名思义zookeeper就是动物园管理员,他是用来管hadoop(大象)、Hive(蜜蜂)、pig(小猪)的管理员, Apache Hbase和 Apache Solr 的分布式集群都用到了zookeeper;Zookeeper:是一个分布式的、开源的程序协调 阅读全文
posted @ 2016-08-10 11:44 atzuge 阅读(391) 评论(0) 推荐(0)
摘要:Solr是什么? Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器。Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索引、搜索性能进行了优化。 Solr是一个全文检索服务器,只需要进行配置就可以实现全文检索服务。 bi 阅读全文
posted @ 2016-08-09 17:13 atzuge 阅读(1303) 评论(0) 推荐(1)
摘要:Solr中的group与facet的区别 如果是简单的使用的话,那么Facet与group都可以用来进行数据的聚合查询,但是他们还是有很大的区别的。 首先上facet跟group的操作: Facet的例子: public voidFacetFieldQuery() throws Exception 阅读全文
posted @ 2016-02-03 16:54 atzuge 阅读(302) 评论(0) 推荐(0)
摘要:项目(评论)中使用solr查询的时候,有个场景需求: 1、获取某个商品下评论的级别数量统计(比如该商品下一到五颗星的评论数量各有多少); 最终经过讨论,使用了solr中的group和facet完成 先说下solr中保存的文档数据结构,如下: <!--只截取文档数据中的一部分字段--> <doc> < 阅读全文
posted @ 2016-02-03 16:43 atzuge 阅读(448) 评论(0) 推荐(0)
摘要:转载:http://www.cnblogs.com/hoojo/archive/2011/10/21/2220431.html Solr 是一种可供企业使用的、基于 Lucene 的搜索服务器,它支持层面搜索、命中醒目显示和多种输出格式。在这篇文章中,将介绍 Solr 并展示如何轻松地将其表现优异的 阅读全文
posted @ 2016-01-28 19:59 atzuge 阅读(268) 评论(0) 推荐(0)