随笔分类 -  solr

摘要:在搜索过程中,如果我们每次请求中都传入很多固定的参数,会很繁琐,这里再solrconfig.xml中初始化定义一些不经常改动的搜索参数: explicit edismax text^0.5 features^1.0 na... 阅读全文
posted @ 2014-10-15 15:19 勿妄 阅读(3237) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2014-10-15 14:54 勿妄 阅读(593) 评论(0) 推荐(0)
摘要:1.配置文件data-config.xml定义了数据库的基本配置,以及导出数据的映射规则,即导出数据库表中对应哪些字段的值,以及对特定字段的值做如何处理 '${dih.last_index_time}'" transformer="RegexT... 阅读全文
posted @ 2014-10-13 16:00 勿妄 阅读(2168) 评论(0) 推荐(0)
摘要:转载地址:http://blog.sina.com.cn/s/blog_5ddc071f0101muos.html在solr中有两种方式实现MoreLikeThis:MoreLikeThisHandler和在SearchHandler中的MoreLikeThisComponent。两种方式大同小异:... 阅读全文
posted @ 2014-10-10 16:13 勿妄 阅读(512) 评论(0) 推荐(0)
摘要:参考文档:MoreLikeThisMoreLikeThisHandler在solr中有两种方式实现MoreLikeThis:第一种:SearchHandler中的MoreLikeThisComponent,MoreLikeThis以组件的身份出现,适于简单应用。第二种:MoreLikeThisHan... 阅读全文
posted @ 2014-10-10 15:42 勿妄 阅读(2518) 评论(0) 推荐(0)
摘要:查询参数常用:q - 查询字符串,必须的。fl - 指定返回那些字段内容,用逗号或空格分隔多个。start - 返回第一条记录在完整找到结果中的偏移位置,0开始,一般分页用。rows - 指定返回结果最多有多少条记录,配合start来实现分页。sort - 排序,格式:sort=+[,+]。示例:(... 阅读全文
posted @ 2014-10-10 10:53 勿妄 阅读(339) 评论(0) 推荐(0)
摘要:solr索引查询接口:http://localhost:8080/solr/query首先了解一下查询参数的含义。qSolr 中用来搜索的查询。可以通过追加一个分号和已索引且未进行断词的字段(下面会进行解释)的名称来包含排序信息。默认的排序是 score desc,指按记分降序排序。q=myFiel... 阅读全文
posted @ 2014-10-10 10:46 勿妄 阅读(1071) 评论(0) 推荐(0)
摘要:数据样例:2010-03-19 10:18:06130010543234203guqun09-12月-12liuyin18-6月 -14天翼分享是基于中国电信CDMA网络,为天翼客户提供视频、音频等多媒体信息分享服务的移动互联网产品。多媒体信息可以是客户自己录制的视频、拍摄的照片、制作的动漫或MTV... 阅读全文
posted @ 2014-09-28 16:19 勿妄 阅读(709) 评论(0) 推荐(0)
摘要:函数查询 可以利用 numeric字段的值 或者 与字段相关的的某个特定的值的函数,来对文档进行评分。1. 使用函数查询的方法这里主要有三种方法可以使用函数查询,这三种s方法都是通过solr http接口的。1) 使用FunctionQParserPlugin。ie: q={!func}log(fo... 阅读全文
posted @ 2014-09-09 17:32 勿妄 阅读(1598) 评论(0) 推荐(0)
摘要:转载:http://quweiprotoss.wap.blog.163.com/Push data to Solr or have Solr pull it尽管一个应用通过HTTP方式与Solr通信,并不意味着它需要将文档通过HTTP发送给Solr。Solr支持一种它称为remote streami... 阅读全文
posted @ 2014-08-28 18:02 勿妄 阅读(496) 评论(0) 推荐(0)
摘要:转载:http://quweiprotoss.wap.blog.163.com/ Solr Cell是一个针对Tika的简单适配器,它由一个SAX ContentHandler组成,ContentHandler处理SAX事件,并通过指定要抽取的域产生文档。在索引二制进文件的时候,有些事要注意:l你... 阅读全文
posted @ 2014-08-28 18:01 勿妄 阅读(347) 评论(0) 推荐(0)
摘要:转载:http://quweiprotoss.wap.blog.163.com/w2/DIH需要在solrconfig.xml中注册,如下:mb-dih-artists-jdbc.xml被引用的md-dih-artist-jdbc.xml位于/conf,它指定了数据导入过程的细节。我们会稍涉及一下这... 阅读全文
posted @ 2014-08-28 17:59 勿妄 阅读(482) 评论(0) 推荐(0)
摘要:1. 2. ... 阅读全文
posted @ 2014-08-28 17:32 勿妄 阅读(839) 评论(0) 推荐(0)
摘要:在理想的情况下,搜索引擎只返回与用户查询相关的文档。而在现实的查询中,编辑(没发现更合适的表达)通常需要指定特定文档在搜索结果中的特定位置。这样做有很多原因。或许 “置顶” 的文档就是最好的查询结果。也可能是公司想让客户从相似的选择中找到利润率较高的产品。还可能是由第三方付费,提高某些查询词语的排名... 阅读全文
posted @ 2014-08-28 16:36 勿妄 阅读(724) 评论(0) 推荐(0)
摘要:转载:http://mxsfengg.iteye.com/blog/308335通常,lucene只返回与用户查询相关的文档,搜索的结果,跟lucene对文档评分有关。而在现实的查询中,我们有些时候需要为某些特定的文档指定它们在搜索结果中的位置。solr1.3 新推的组件QueryElevation... 阅读全文
posted @ 2014-08-28 15:16 勿妄 阅读(891) 评论(0) 推荐(0)
摘要:DIH内存溢出: 在使用DIH时,容易报内存溢出错误。可以通过设置jvm大小来解决。设置方法如下: 在tomcat\bin\startup.bat加入SETJAVA_OPTS=-Xms128m-Xmx1024m配置这里设置的是1024M,根据情况可以适量增大datasourceentity:na... 阅读全文
posted @ 2014-08-27 17:35 勿妄 阅读(623) 评论(0) 推荐(0)
摘要:原文出处:http://blog.chenlb.com/2010/03/solr-delete-data.html有时候需要删除 Solr 中的数据(特别是不重做索引的系统中,在重做索引期间)。删除一些 Solr 无效数据(或不合格数据)。删除 solr 中的数据有几种方式:1、先来看 curl 方... 阅读全文
posted @ 2014-08-20 17:34 勿妄 阅读(2471) 评论(0) 推荐(0)
摘要:solrj中配置:两种高亮开启设置// solrParams.setHighlight(true);solrParams.setParam("hl","true");//highlighting设置高亮字段: //高亮参数设置 那些字段高亮显示,可以用空格或者逗号分隔 solrParams.addH... 阅读全文
posted @ 2014-08-05 11:50 勿妄 阅读(1118) 评论(0) 推荐(0)
摘要:高亮显示在搜索中使用的比较多,比较常用的有三种使用方式,如果要对某field做高亮显示,必须对该field设置stored=true 第一种是普通的高亮显示Highlighter,根据查询的docIdSet,获取Documents,并获取当前document的需要高亮的field的value,根据q... 阅读全文
posted @ 2014-08-05 11:05 勿妄 阅读(678) 评论(0) 推荐(0)
摘要:做站内搜索时,如果输入的参数中包含英文冒号、双引号或其他具有特殊含义的字符时,可能需要做转义来避免查不到数据的问题。测试于:Solr 4.5.1, Jdk 1.6.0_45, Tomcat 6.0.37 | CentOS 5.7异常信息:如本站内有一篇文章标题为:java.lang.NumberFo... 阅读全文
posted @ 2014-08-04 18:19 勿妄 阅读(1222) 评论(0) 推荐(0)