随笔分类 -  java solr

摘要:dismaxq.altqf (Query Fields)mm (Minimum 'Should' Match)pf (Phrase Fields)ps (Phrase Slop)qs (Query Phrase Slop)tie (Tie breaker)bq (Boost Query)bf (Bo... 阅读全文
posted @ 2014-11-10 16:17 飞扬的薰衣草 阅读(700) 评论(0) 推荐(0)
摘要:Solr 支持多种查询解析,给搜索引擎开发人员提供灵活的查询解析。Solr 中主要包含这几个查询解析器:标准查询解析器、DisMax 查询解析器,扩展 DisMax 查询解析器(eDisMax)DismaxDismax handler比standard handler多如下功能:以不同的权值来搜索多... 阅读全文
posted @ 2014-11-08 20:10 飞扬的薰衣草 阅读(598) 评论(0) 推荐(0)
摘要:edismax支持boost函数与score相乘作为,而dismax只能使用bf作用效果是相加,所以在处理多个维度排序时,score其实也应该是其中一个维度 ,用相加的方式处理调整麻烦。而dismax的实现代码逻辑比较简单,看起来比较易理解,edismax是它的加强版,其实是改变了不少。。比如在以下... 阅读全文
posted @ 2014-11-08 19:00 飞扬的薰衣草 阅读(667) 评论(0) 推荐(0)
摘要:本文目的让未使用过版本控制器软件或者未使用过subversion软件的人员尽快上手。subversion的使用技巧很多,这里只总结了最小使用集,即主要的基本功能,能够用来应付日常工作。因此不涉及subversion服务器端的搭建和配置。为什么要使用版本控制当多人共同开发同一个软件时,会涉及源代码的共... 阅读全文
posted @ 2014-10-17 18:17 飞扬的薰衣草 阅读(750) 评论(0) 推荐(0)
摘要:Solr4.6的管理界面上,如果不配置数据导入的功能,将看不到清除数据的按钮。我表示很遗憾,正好我们线上没有配置数据导入的功能。 网上搜到的各种清理solr数据的HTTP请求,拿到我的solr4.6上测试,报service not found。看了这些请求都是在solr4之前的版本上运行的。找到了... 阅读全文
posted @ 2014-09-28 10:56 飞扬的薰衣草 阅读(208) 评论(0) 推荐(0)
摘要:solr4.3的入门配置 目前阿帕奇官方仅推荐2个比较稳定的版本一个是4.3的版本,一个3.6的版本 3.6的版本没有用过,所以在此无涉及,下面就来说说solr4.3的入门配置 solr4.3与solr4.2最大的区别就在与solr4.3的日志模块与核心模块分离出来了 所以在进行安装配置时需要另行... 阅读全文
posted @ 2014-08-27 17:26 飞扬的薰衣草 阅读(180) 评论(0) 推荐(0)
摘要:原文出自:http://www.coin163.com/java/docs/201310/d_3010029802.html一.Facet简介Facet是solr的高级搜索功能之一,可以给用户提供更友好的搜索体验.在搜索关键字的同时,能够按照Facet的字段进行分组并统计.二.Facet字段1.适宜... 阅读全文
posted @ 2014-08-14 18:25 飞扬的薰衣草 阅读(2053) 评论(0) 推荐(0)
摘要:Group分组划分结果,返回的是分组结果;Facet分组统计,侧重统计,返回的是分组后的数量;一、Group用法://组查询基础配置params.set(GroupParams.GROUP, "true");params.set(GroupParams.GROUP_FIELD, "dkeys");根... 阅读全文
posted @ 2014-08-12 11:33 飞扬的薰衣草 阅读(5537) 评论(0) 推荐(0)
摘要:compressed=true|false,是否使用gzip压缩(只有TextField和StrField可以压缩)compressThreshold=压缩阀值multiValued=true|false 是否包含多个值,即一个名字可以被多个document所用。omitNorms=true|fal... 阅读全文
posted @ 2014-08-05 16:41 飞扬的薰衣草 阅读(340) 评论(0) 推荐(0)
摘要:以下是httpClient实例化方式,需要tomcat运行Solr服务1、ConcurrentUpdateSolrServer实例化SolrServer,该类实例化多用于更新删除索引操作ConcurrentUpdateSolrServer(String solrServerUrl,intqueueS... 阅读全文
posted @ 2014-08-04 10:46 飞扬的薰衣草 阅读(198) 评论(0) 推荐(0)
摘要:原文出自:http://forfuture1978.iteye.com/blog/591804点击打开链接在索引阶段设置Document Boost和Field Boost,存储在(.nrm)文件中。如果希望某些文档和某些域比其他的域更重要,如果此文档和此域包含所要查询的词则应该得分较高,则可以在索... 阅读全文
posted @ 2014-07-28 11:49 飞扬的薰衣草 阅读(181) 评论(0) 推荐(0)
摘要:原文出自:http://blog.csdn.net/flyingpig4/article/details/6305488SearchHandler.handleRequestBody():solr搜索主流程1.调用:RequestHandlerBase|--handleRequest(req, rs... 阅读全文
posted @ 2014-07-25 18:43 飞扬的薰衣草 阅读(379) 评论(0) 推荐(0)
摘要:转自:http://rdc.taobao.com/team/jm/archives/1753共整理三部分,第一部分Solr常规处理,第二部分针对性性处理,前者比较通用,后者有局限性。务必根据具体应用特性,具体调节参数,对比性能。第三部分solr查询相关的具体应用需要全面去把控,各个因素一起起作用。第... 阅读全文
posted @ 2014-07-17 14:19 飞扬的薰衣草 阅读(262) 评论(0) 推荐(0)
摘要:搜索总体有:term 查询, phrase查询, boolean 查询1. SOLR搜索覆盖度和准确度保证的三个搜索方式:保证准确率: AND: Search for two different terms, new and house, requiring both to match 。完全相同逻... 阅读全文
posted @ 2014-07-15 14:33 飞扬的薰衣草 阅读(376) 评论(0) 推荐(0)
摘要:虽然本书中假设你要建索引的内容都是有着良好结构的,比如数据库表,XML文件,CSV,但在现实中我们要保存很混乱的数据,或是二进制文件,如PDF,Microsoft Office,甚至是图片和音乐文件。 我(Eric Pugh)在首次使用Solr时,就需要处理客户在几年间产生的大量PDF和Micr... 阅读全文
posted @ 2014-07-15 10:05 飞扬的薰衣草 阅读(522) 评论(0) 推荐(0)