陋室铭
永远也不要停下学习的脚步(大道至简至易)

随笔分类 -  搜索引擎

上一页 1 2 3 4 5 6 7 8 下一页
Solr --- Group查询与Facet区别
摘要:简介 facet的查询结果主要是分组信息:有什么分组,每个分组包括多少记录;但是分组中有哪些数据是不可知道的,只有进一步搜索。 group则类似于关系数据库的group by,可以用于一个或者几个字段去重、显示一个group的前几条记录等。 来自solr ref guide的解释: Result G 阅读全文
posted @ 2018-07-31 14:04 宏宇 阅读(720) 评论(0) 推荐(0)
Solr中的group与facet的区别
摘要:Solr中的group与facet的区别 如果是简单的使用的话,那么Facet与group都可以用来进行数据的聚合查询,但是他们还是有很大的区别的。 首先上facet跟group的操作: Facet的例子: public voidFacetFieldQuery() throws Exception 阅读全文
posted @ 2018-07-31 14:03 宏宇 阅读(189) 评论(0) 推荐(0)
solr之模糊搜索(Fuzzy matching)
摘要:solr的模糊搜索主要有通配符,范围查询,近距离搜索等几类。下面分别探讨一下用法。 1. 通配符查询 通配符只是对单个term有效,对短语不起作用,ps:短语就是在查询条件上加双引号,比如 title:”xxx yyy”。 其实也就跟一般的通配符的匹配方式差不多了,比如我要查询title里有eval 阅读全文
posted @ 2018-07-30 18:08 宏宇 阅读(1896) 评论(0) 推荐(0)
solr查询语法
摘要:还以为网上的solr最基础的东西应该很多,结果发现je这边都是一些部署的资料。到没用人给最基本的查询语法。在做查询时十分吃力,自己整理了几个例子来分享下,希望别人不要再走弯路。 首先说下,查询都是基于solrj。如果不清楚solrj。可以当做是对solr查询语句的一个api封装。 solr的查询其实 阅读全文
posted @ 2018-07-30 17:01 宏宇 阅读(5569) 评论(0) 推荐(0)
搜索引擎solr系列---solr分词配置
摘要:分词我理解的是,输入的一句话,按照它自己定义的规则分为常用词语。 首先,Solr有自己基本的类型,string、int、date、long等等。 对于string类型,比如在你的core/conf/manage-schema文件中,配置一个字段类型为string类型,如果查询符合“我是中国人”的数据 阅读全文
posted @ 2018-07-30 13:22 宏宇 阅读(475) 评论(1) 推荐(0)
solr入门之搜索建议的几种实现方式和最终选取实现思路
摘要:上篇博客中我简单的讲了下solr自身的suggest模块来实现搜索建议.但是今天研究了下在solr自身的suggest中添加进去拼音来智能推荐时不时很方便.在次从网上搜集和整理思考了下该问题的解决. http://www.cnblogs.com/huangfox/p/4146970.html htt 阅读全文
posted @ 2018-07-30 13:18 宏宇 阅读(2007) 评论(0) 推荐(0)
Solr初始化源码分析-Solr初始化与启动
摘要:用solr做项目已经有一年有余,但都是使用层面,只是利用solr现有机制,修改参数,然后监控调优,从没有对solr进行源码级别的研究。但是,最近手头的一个项目,让我感觉必须把solrn内部原理和扩展机制弄熟,才能把这个项目做好。今天分享的就是:Solr是如何启动并且初始化的。大家知道,部署solr时 阅读全文
posted @ 2018-07-24 10:17 宏宇 阅读(309) 评论(0) 推荐(0)
Centos7下单机部署Solr7.3
摘要:本章重点介绍CentOS7 下部署Solr7 ,添加核心Core配置,Dataimport导入,中文分词的相关操作。 一、准备工作 演示环境是在虚拟机下安装的CentOS7、java JDK8、apache-tomcat-8.5.29。 在CentOS7 下安装jdk8以及tomcat8.5 的安装 阅读全文
posted @ 2018-07-23 09:27 宏宇 阅读(524) 评论(0) 推荐(0)
Solr分页与高亮(使用SolrNet实现)
摘要:Solr分页与高亮(使用SolrNet实现) 本节我们使用Asp.net MVC实现Solr客户端查询,建议使用SolrNet这个客户端,开源地址在:https://github.com/mausch/SolrNet 推荐的理由主要有: 1. 高效的反序列化操作; 2. 社区活跃,用户众多,有问题可 阅读全文
posted @ 2018-07-20 23:59 宏宇 阅读(504) 评论(0) 推荐(0)
solr搜索分词优化
摘要:solr服务器配置好在搜索时经常会搜出无关内容,把不该分的词给分了,导致客户找不到自己需要的内容,那么我们就从配置词典入手解决这个问题。 首先需要知道自带的词典含义: 停止词:停止词是无功能意义的词,比如is 、a 、are 、”的”,“得”,“我” 等,这些词会在句子中多次出现却无意义,所以在分词 阅读全文
posted @ 2018-07-20 23:58 宏宇 阅读(592) 评论(0) 推荐(0)
solr .Net端(SolrNet)
摘要:首先 引用SolrNet.dll Microsoft.Practices.ServiceLocation HttpWebAdapters 也可以用.net IDe 中的 nuget下载 solrnet包 //清除上次请求(不清除会导致重复请求报错) SolrNet.Startup.Container.Clear(); SolrNet.Startup.InitContain... 阅读全文
posted @ 2018-07-20 23:57 宏宇 阅读(324) 评论(0) 推荐(0)
Solr聚合查询
摘要:1 分组查询 概述:Solr常用的分组查询有两种,Facet分组和Group分组,分别以下列出这两种查询: 1.1 Facet分组 solr种以导航为目的的查询结果成为facet,在用户查询的结果上根据分类增加了count信息,然后用户根据count信息做进一步搜索, Facet是solr的高级搜索 阅读全文
posted @ 2018-07-19 18:15 宏宇 阅读(2952) 评论(1) 推荐(0)
Solr进行Distinct 获取Count
摘要:今天碰到一个问题,数据之前入solr的时候并没有计算条数,现在需要计算出某几个表中去重后的总数。 由于solr的ISearch并没有相关的Distinct功能.想到一个解决方案是用Solr的Facet分组进行GrupBy,但是因为Facet只能返回100条,而数据肯定大于100个分组.所有该方案PA 阅读全文
posted @ 2018-07-19 18:10 宏宇 阅读(706) 评论(0) 推荐(0)
Solr中Facet用法和Group用法
摘要:Group分组划分结果,返回的是分组结果; Facet分组统计,侧重统计,返回的是分组后的数量; 一、Group用法: //组查询基础配置params.set(GroupParams.GROUP, "true"); params.set(GroupParams.GROUP_FIELD, "dkeys 阅读全文
posted @ 2018-07-19 18:09 宏宇 阅读(631) 评论(0) 推荐(0)
solr统计只返回10或者100个数据的解决办法
摘要:因为我所在的公司为政府做的项目【风险管理系统】,其中涉及大量的统计展示,多数以整个市的区划,行业部门等方式返回,在昨天,我发现听过填报单位的方式返回时,始终只有100个数据。通过对比发现,在前辈的代码中统计的存在一个巧合,就是全市的区划、行业部门钻取的方式都没有超过100,刚好我写的这个接口的填报单 阅读全文
posted @ 2018-07-19 18:06 宏宇 阅读(291) 评论(0) 推荐(0)
solr学习之六--------Analyzer(分析器)、Tokenizer(分词器)
摘要:首先,不知道大家在前面的例子中没有试着搜索文本串,就是在第二节,我们添加了很多文档。如果字段值是一个文本。你如果只搜索这个字段的某个单词,是不是发现搜不到? 这就是因为我们没有配置Analyzer,因此在搜索的时候会“全匹配”。可以从直观感觉上理解为SQL的 like和= 的区别。 通过前面这段引文 阅读全文
posted @ 2018-07-19 14:52 宏宇 阅读(437) 评论(0) 推荐(0)
solr精确查询,查询关键字分词后,指定满足匹配所有
摘要:一、solr查询,查询配置了查询分词器的字段,默认会对查询关键字做分词处理 1、如查询关键字F1501ZY000011,使用solr7自带的中文分词器,默认会分词为:f,1501,zy,000011 2、不使用defType=edismax参数的查询结果 二、使用参数defType=edismax& 阅读全文
posted @ 2018-07-19 14:16 宏宇 阅读(4899) 评论(0) 推荐(0)
Solr学习总结(八)IK 中文分词的配置和使用
摘要:最近,很多朋友问我solr 中文分词配置的问题,都不知道怎么配置,怎么使用,原以为很简单,没想到这么多朋友都有问题,所以今天就总结总结中文分词的配置吧。 有的时候,用户搜索的关键字,可能是一句话,不是很规范。所以在 Solr 中查询出的时候,就需要将用户输入的关键字进行分词。 目前有很多优秀的中文分 阅读全文
posted @ 2018-07-19 14:12 宏宇 阅读(660) 评论(0) 推荐(0)
solr搜索之搜索精度问题我已经尽力了!!!
摘要:solr7可能是把默认搜索方式去掉了,如下: 在solr7里找了半天以及各种查资料也没发现这个默认搜索方式,后来想,可能是被edismax里的mm取代了吧,都是控制搜索精度的,如下: 这个mm还是挺解决问题的,但是对于我们公司来说就差那么一点,就一点。就这一点我没有解决。正常情况下这个参数能满足大部 阅读全文
posted @ 2018-07-19 14:09 宏宇 阅读(232) 评论(0) 推荐(0)
solr多词匹配搜索问题及解决
摘要:使用solr进行某较长词搜索时出现了一些问题,及解决方案。 1、问题:solr默认使用OR方式搜索,当搜索一个很长的次,比如“XX集团股份有限公司”,分词器分词后,使用OR方式匹配,会匹配到很多结果。 解决:然后我使用了AND方式搜索(managed-schema中设置<solrQueryParse 阅读全文
posted @ 2018-07-19 14:08 宏宇 阅读(377) 评论(0) 推荐(1)

上一页 1 2 3 4 5 6 7 8 下一页