随笔分类 -  Solr

只有注册用户登录后才能阅读该文。
posted @ 2013-08-27 16:16 coolbing 阅读(16) 评论(0) 推荐(0)
只有注册用户登录后才能阅读该文。
posted @ 2013-08-27 16:15 coolbing 阅读(21) 评论(0) 推荐(0)
只有注册用户登录后才能阅读该文。
posted @ 2013-08-27 16:13 coolbing 阅读(11) 评论(0) 推荐(0)
摘要:大家知道在解压开solr的web程序(apache-solr-3.2.0.war)时,在其WEB-INF/lib目录下有slf4j- api-1.5.5.jar,slf4j-jdk14-1.5.5.jar这两个jar包,故可知其默认使用的是jdk的日志数据,其日志都是输入到 tomcat的logs中;再看其是结合slf4j进行jdk的日志数据;slf4j并不是一种具体的日志系统,而是一个用户日志系统的facade,允许在部署最终应用时方便的变更其日志系统。故solr使用log4j也是ok的,即采用log4j替换jdk的日志输入;做法如下: 1. 将solr/WINF-WEB/lib中的slf4 阅读全文
posted @ 2013-01-30 13:27 coolbing 阅读(1440) 评论(0) 推荐(0)
摘要:首先介绍一下solr:Apache Solr (读音: SOLer) 是一个开源、高性能、采用Java开发、基于Lucene的全文搜索服务器,文档通过Http利用XML加到一个搜索集合中,查询该集合也是通过 http收到一个XML/JSON响应来实现。Solr 中存储的资源是以 Document 为对象进行存储的。每个文档由一系列的 Field 构成,每个 Field 表示资源的一个属性。Solr 中的每个 Document 需要有能唯一标识其自身的属性,默认情况下这个属性的名字是 id,在 Schema 配置文件(schema.xml)中使用:<uniqueKey>id</ 阅读全文
posted @ 2013-01-30 13:22 coolbing 阅读(599) 评论(0) 推荐(0)
摘要:这个例子使用两种方式来演示如何生成全量索引: 一个是从db中通过sql生成全量索引 一个是通过tika解析文件生成全量索引 1 package SolrJExample; 2 3 import org.apache.solr.client.solrj.SolrServerException; 4 import org.apache.solr.client.solrj.impl.StreamingUpdateSolrServer; 5 import org.apache.solr.client.solrj.impl.XMLResponseParser; 6 import org.a... 阅读全文
posted @ 2013-01-30 13:17 coolbing 阅读(500) 评论(0) 推荐(0)
摘要:本文将介绍Solr查询中涉及到的Cache使用及相关的实现。Solr查询的核心类就是SolrIndexSearcher,每个core通常在 同一时刻只由当前的SolrIndexSearcher供上层的handler使用(当切换SolrIndexSearcher时可能会有两个同时提供服务),而Solr的各种Cache是依附于SolrIndexSearcher的,SolrIndexSearcher在则Cache 生,SolrIndexSearcher亡则Cache被清空close掉。Solr中的应用Cache有filterCache、 queryResultCache、documentCache等 阅读全文
posted @ 2013-01-30 13:10 coolbing 阅读(432) 评论(0) 推荐(0)
摘要:indexed fieldsindexed fields 的数量将会影响以下的一些性能:索引时的时候的内存使用量索引段的合并时间优化时间索引的大小我们可以通过 将 omitNorms=“true” 来减少indexed fields数量增加所带来的影响。stored fieldsRetrieving the stored fields 确实是一种开销。这个开销,受每个文档所存储的字节影响很大。每个文档的所占用的空间越大,文档就显的更稀疏,这样从硬盘中读取数据,就需要更多的i/o操作(通常,我们在存储比较大的域的时候,就会考虑这样的事情,比如存储一篇文章的文档。)可以考虑将比较大的域放到solr 阅读全文
posted @ 2013-01-30 13:04 coolbing 阅读(261) 评论(0) 推荐(0)
摘要:每一个搜索请求都会持有一个searcher的引用,而不是创建一个新的searcher,处理完后会释放掉这个引用。Solr在初始化化时,通过SolrCore核心类要做很多的初始化工作,包过读取solrconfig.xml配置文件里的内容,代码如下: 1 booleanQueryMaxClauseCount(); 2 //设置布尔查询最多个数。 3 initListeners(); 4 //读取配置文件的search实例的监听器。 5 6 initDeletionPolicy(); 7 initIndex(); 8 9 initWriters();10 initQParsers();11 ... 阅读全文
posted @ 2013-01-30 11:28 coolbing 阅读(976) 评论(1) 推荐(0)
摘要:1 <?xml version="1.0" encoding="UTF-8" ?> 2 <config> 3 4 <luceneMatchVersion>LUCENE_40</luceneMatchVersion> 5 6 <jmx /> 7 8 <lib dir="http://www.cnblogs.com/http://www.cnblogs.com/dist/" regex="apache-solr-dataimporthandler-.*\.jar& 阅读全文
posted @ 2013-01-30 11:16 coolbing 阅读(1163) 评论(0) 推荐(0)
摘要:schema.xml位于solr/conf/目录下,类似于数据表配置文件,定义了加入索引的数据的数据类型,主要包括type、fields和其他的一些缺省设置。1、先来看下type节点,这里面定义FieldType子节点,包括name,class,positionIncrementGap等一些参数。name:就是这个FieldType的名称。class:指向org.apache.solr.analysis包里面对应的class名称,用来定义这个类型的行为。 1 < schema name = "example" version = "1.2" > 阅读全文
posted @ 2013-01-30 11:13 coolbing 阅读(1043) 评论(0) 推荐(0)