search,solr,elasticsearch
全文检索引擎Solr系列—–全文检索基本原理
摘要:索引 Solr/Lucene采用的是一种反向索引,所谓反向索引:就是从关键字到文档的映射过程,保存这种映射这种信息的索引称为反向索引 左边保存的是字符串序列 右边是字符串的文档(Document)编号链表,称为倒排表(Posting List) 字段串列表和文档编号链表两者构成了一个字典。现在想搜索
阅读全文
posted @
2016-01-11 19:03
duanxz
阅读(526)
推荐(1)
ES之一:Elasticsearch6.4 windows安装 head插件ik分词插件安装
摘要:准备安装目标:1.Elasticsearch6.42.head插件3.ik分词插件 第一步:安装Elasticsearch6.4 下载方式:1.官网下载 https://www.elastic.co/downloads/elasticsearch2.百度网盘下载:https://pan.baidu.
阅读全文
posted @
2016-01-11 19:00
duanxz
阅读(1590)
推荐(0)
ES之四:Elasticsearch Mapping类型映射概述及高版本中删除mapping
摘要:一、ES mapping作用 ES的mapping非常类似于java中的数据类型,可以用来设置字段中存储的数据的类型。但ES中的mapping的作用比数据类型广泛一些: 定义索引这里面的字段和名称 定义字段的数据类型,字符串、布尔、数字...... 字段,倒排索引相关的配置,是否分词 日期值的格式。
阅读全文
posted @
2015-12-27 23:23
duanxz
阅读(8118)
推荐(1)
ES之五:关于Elasticsearch查找相关的问题汇总(match、match_phrase、query_string和term)
摘要:由上图看出, QueryBuilder 是整个查询操作的核心,决定了查询什么样的数据和期望得到什么结果这些核心的问题。 QueryBuilder 只是一个接口,需要具体的实体类才可以。那么如何创建 QueryBuilder 的实例呢?有两种方式 通过 QueryBuilder 实现类的构造函数 使用
阅读全文
posted @
2014-01-07 10:30
duanxz
阅读(8132)
推荐(0)
ES之六、Elasticsearch DSL
摘要:REST API用途 elasticsearch支持多种通讯,其中包括http请求响应服务,因此通过curl命令,可以发送http请求,并得到json返回内容。 ES提供了很多全面的API,常用的REST请求大致可以分成如下几种: 1 检查集群、节点、索引的健康情况 2 管理集群、节点,索引数据、元
阅读全文
posted @
2014-01-05 22:34
duanxz
阅读(4212)
推荐(1)
ES之七:elasticsearch之Index Aliases
摘要:别名解决了哪些问题? 在开发中,随着业务需求的迭代,较老的业务逻辑就要面临更新甚至是重构,而对于es来说,为了适应新的业务逻辑,可能就要对原有的索引做一些修改,比如对某些字段做调整,甚至是重建索引。而做这些操作的时候,可能会对业务造成影响,甚至是停机调整等问题。由此,es提供了索引别名来解决这些问题
阅读全文
posted @
2013-05-11 11:36
duanxz
阅读(1994)
推荐(1)
ES之八:ES数据库重建索引——Reindex(数据迁移)
摘要:应用背景: 1、当你的数据量过大,而你的索引最初创建的分片数量不足,导致数据入库较慢的情况,此时需要扩大分片的数量,此时可以尝试使用Reindex。 2、当数据的mapping需要修改,但是大量的数据已经导入到索引中了,重新导入数据到新的索引太耗时;但是在ES中,一个字段的mapping在定义并且导
阅读全文
posted @
2013-05-10 14:18
duanxz
阅读(1978)
推荐(0)
ES之九:ES Java客户端-Elasticsearch Java client(ES Client 简介、Java REST Client、Java Client、Spring Data Elasticsearch)
摘要:一、ES Client 简介 1. ES是一个服务,采用C/S结构 2. 回顾 ES的架构 3. ES支持的客户端连接方式 3.1 REST API ,端口 9200 这种连接方式对应于架构图中的RESTful style API这一层,这种客户端的连接方式是RESTful风格的,使用http的方式
阅读全文
posted @
2013-05-10 10:19
duanxz
阅读(1552)
推荐(0)
ES之十:ElasticSearch监控工具 - cerebro
摘要:最近ElasticSearch使用中出现好多异常情况,一直都是命令行直接排查问题,不够直观。网络上大部分都推荐Kopf,Bigdesk,但是都已经是过时的工具,多年都没有更新了。 ps: kopf的github首页就表明该项目不再维护,推荐使用cerebro;bigdesk也只支持ElasticSe
阅读全文
posted @
2013-05-09 15:41
duanxz
阅读(1858)
推荐(0)
ES之十一:elasticsearch之Routing及restClient API中如何使用route
摘要:一、es中的route 当索引一个文档的时候,文档会被存储到一个主分片中。那么,elasticsearch如何知道一个文档应该存放到哪个分片中呢? 首先这肯定不是随机的,否则在检索文档时就不知道该从哪去寻找它了。实际上这个过程是根据下面公式决定的: shard = hash(routing) % n
阅读全文
posted @
2013-05-09 10:05
duanxz
阅读(2672)
推荐(0)
ES index的数据量大于1万的特殊处理场景
摘要:问题一: 查询结果中 hits.total.value 值最大为10000的限制 问题描述:在用restHighLevel的SearchSourceBuilder查询index时,通过hit获取总数量时,默认的最大限制是10000 String totalHits = response.getHit
阅读全文
posted @
2013-05-07 09:41
duanxz
阅读(3503)
推荐(1)