2018 年 7月 19 日随笔档案 - 宏宇

2018年7月19日

摘要： 1 分组查询概述：Solr常用的分组查询有两种，Facet分组和Group分组，分别以下列出这两种查询： 1.1 Facet分组 solr种以导航为目的的查询结果成为facet，在用户查询的结果上根据分类增加了count信息，然后用户根据count信息做进一步搜索, Facet是solr的高级搜索阅读全文

posted @ 2018-07-19 18:15 宏宇阅读(2828) 评论(1) 推荐(0) 编辑

Solr进行Distinct 获取Count

摘要：今天碰到一个问题,数据之前入solr的时候并没有计算条数,现在需要计算出某几个表中去重后的总数。由于solr的ISearch并没有相关的Distinct功能.想到一个解决方案是用Solr的Facet分组进行GrupBy,但是因为Facet只能返回100条,而数据肯定大于100个分组.所有该方案PA 阅读全文

posted @ 2018-07-19 18:10 宏宇阅读(659) 评论(0) 推荐(0) 编辑

Solr中Facet用法和Group用法

摘要： Group分组划分结果，返回的是分组结果； Facet分组统计，侧重统计，返回的是分组后的数量；一、Group用法： //组查询基础配置params.set(GroupParams.GROUP, "true"); params.set(GroupParams.GROUP_FIELD, "dkeys 阅读全文

posted @ 2018-07-19 18:09 宏宇阅读(586) 评论(0) 推荐(0) 编辑

solr统计只返回10或者100个数据的解决办法

摘要：因为我所在的公司为政府做的项目【风险管理系统】，其中涉及大量的统计展示，多数以整个市的区划，行业部门等方式返回，在昨天，我发现听过填报单位的方式返回时，始终只有100个数据。通过对比发现，在前辈的代码中统计的存在一个巧合，就是全市的区划、行业部门钻取的方式都没有超过100，刚好我写的这个接口的填报单阅读全文

posted @ 2018-07-19 18:06 宏宇阅读(269) 评论(0) 推荐(0) 编辑

solr学习之六--------Analyzer（分析器）、Tokenizer（分词器）

摘要：首先，不知道大家在前面的例子中没有试着搜索文本串，就是在第二节，我们添加了很多文档。如果字段值是一个文本。你如果只搜索这个字段的某个单词，是不是发现搜不到？这就是因为我们没有配置Analyzer，因此在搜索的时候会“全匹配”。可以从直观感觉上理解为SQL的 like和= 的区别。通过前面这段引文阅读全文

posted @ 2018-07-19 14:52 宏宇阅读(392) 评论(0) 推荐(0) 编辑

solr精确查询，查询关键字分词后，指定满足匹配所有

摘要：一、solr查询，查询配置了查询分词器的字段，默认会对查询关键字做分词处理 1、如查询关键字F1501ZY000011，使用solr7自带的中文分词器，默认会分词为：f，1501，zy，000011 2、不使用defType=edismax参数的查询结果二、使用参数defType=edismax& 阅读全文

posted @ 2018-07-19 14:16 宏宇阅读(4779) 评论(0) 推荐(0) 编辑

Solr学习总结（八）IK 中文分词的配置和使用

摘要：最近，很多朋友问我solr 中文分词配置的问题，都不知道怎么配置，怎么使用，原以为很简单，没想到这么多朋友都有问题，所以今天就总结总结中文分词的配置吧。有的时候，用户搜索的关键字，可能是一句话，不是很规范。所以在 Solr 中查询出的时候，就需要将用户输入的关键字进行分词。目前有很多优秀的中文分阅读全文

posted @ 2018-07-19 14:12 宏宇阅读(628) 评论(0) 推荐(0) 编辑

文档索引普遍原理

摘要：搜索引擎普遍采用全文检索技术，而其处理的大规模文档本身都是非结构或半结构化信息，文档索引技术是信息全文检索和快速查询的基础。一、索引概述索引是一种数据存储的组织结构。索引器用来完成信息索引的建立，维护和管理索引的功能。倒排索引是一种高效率的索引组织方式，采用字或词作为索引项，能够很好的支持多种阅读全文

posted @ 2018-07-19 14:10 宏宇阅读(346) 评论(0) 推荐(0) 编辑

solr搜索之搜索精度问题我已经尽力了！！！

摘要： solr7可能是把默认搜索方式去掉了，如下：在solr7里找了半天以及各种查资料也没发现这个默认搜索方式，后来想，可能是被edismax里的mm取代了吧，都是控制搜索精度的，如下：这个mm还是挺解决问题的，但是对于我们公司来说就差那么一点，就一点。就这一点我没有解决。正常情况下这个参数能满足大部阅读全文

posted @ 2018-07-19 14:09 宏宇阅读(213) 评论(0) 推荐(0) 编辑

solr多词匹配搜索问题及解决

摘要：使用solr进行某较长词搜索时出现了一些问题，及解决方案。 1、问题：solr默认使用OR方式搜索，当搜索一个很长的次，比如“XX集团股份有限公司”，分词器分词后，使用OR方式匹配，会匹配到很多结果。解决：然后我使用了AND方式搜索（managed-schema中设置<solrQueryParse 阅读全文

posted @ 2018-07-19 14:08 宏宇阅读(341) 评论(0) 推荐(1) 编辑

MongoDB 3.0 用户创建

摘要：摘要： MongoDB 3.0 安全权限访问控制，在添加用户上面3.0版本和之前的版本有很大的区别，这里就说明下3.0的添加用户的方法。环境、测试：在安装MongoDB之后，先关闭auth认证，进入查看数据库，只有一个local库，admin库是不存在的：现在需要创建一个帐号，该账号需要有gr 阅读全文

posted @ 2018-07-19 14:03 宏宇阅读(132) 评论(0) 推荐(0) 编辑

MongoDB 生态 – 可视化管理工具

摘要：工欲善其事，必先利其器，我们在使用数据库时，通常需要各种工具的支持来提高效率；很多新用户在刚接触 MongoDB 时，遇到的问题是『不知道有哪些现成的工具可以使用』，本系列文章将主要介绍 MongoDB 生态在工具、driver、可视化管理等方面的支持情况。本文主要介绍 MongoDB 的一些可视阅读全文

posted @ 2018-07-19 14:02 宏宇阅读(317) 评论(0) 推荐(0) 编辑

SOLR对多个（关联）表创建索引

摘要：又两天没写博客，关于SOLR的东西，写了一周了还没写完我也是醉了，毕竟会的东西真不多，周四晚上加班没写，周五晚上公司同事聚会也没写，今天在家，还是把最后的一点写完吧，我会的剩下的也就是一个对多个表创建索引了，表可以是关联的，也可以是不关联的，下面开始。一、无关联多表创建索引 1.1数据库准备首先阅读全文

posted @ 2018-07-19 13:24 宏宇阅读(733) 评论(0) 推荐(0) 编辑

solr多core的处理

摘要：有2中配置方式，一是从Solr Admin进行multi core的配置。在Solr Admin控制台里面选择：Core Admin 选择Add Core 然后把你准备好的路径写到里面去。 name： xxx 配置core的名称 instanceDir：xxx 配置指向你的Solr core的路径阅读全文

posted @ 2018-07-19 13:17 宏宇阅读(277) 评论(0) 推荐(0) 编辑

如何在Solr中实现多core查询

摘要：基于solr或者elasticsearch提供的多核，多索引，多shard等查询能力，一般都是由lucene提供的多索引查询的功能演化而来的，这个功能在单机版的lucene里面确实没有发挥多大的威力，但是确是solrclourd，elasticsearch分布式集群查询数据的基础，正是因为lucen 阅读全文

posted @ 2018-07-19 13:16 宏宇阅读(3156) 评论(0) 推荐(0) 编辑

solr之高级查询--联表 join查询

摘要：例如有两个业务表：文章表，评论表。场景：一个文章可以由多个人评论。创建两个core，一个core叫article，一个叫comment。article实例的schema.xml文件中定义几个简单的属性：id、title、content、createtime,relationId <field 阅读全文

posted @ 2018-07-19 13:15 宏宇阅读(875) 评论(0) 推荐(0) 编辑

solr跨core查询

摘要：参考文档：这里的跨core不使用solrcloud http://wiki.apache.org/solr/CoreAdmin 注意：跨core查询功能相比单core查询，是有限制的参考文档：这里的跨core不使用solrcloud http://wiki.apache.org/solr/Core 阅读全文

posted @ 2018-07-19 13:14 宏宇阅读(375) 评论(0) 推荐(0) 编辑

mongodb聚合 group

摘要： MongoDB中聚合(aggregate)主要用于处理数据(诸如统计平均值,求和等)，并返回计算后的数据结果。有点类似sql语句中的 count(*)。基本语法为：db.collection.aggregate( [ <stage1>, <stage2>, ... ] ) 现在在mycol集合中有阅读全文

posted @ 2018-07-19 13:12 宏宇阅读(227) 评论(0) 推荐(0) 编辑

solr删除全部索引数据

摘要： SOLR 删除全部索引数据： <delete><query>*:*</query></delete><commit/> 阅读全文

posted @ 2018-07-19 11:47 宏宇阅读(383) 评论(0) 推荐(0) 编辑