ElasticSearch - 随笔分类 - 加肥猫咪

ElasticSearch（三十）基于scoll+bulk+索引别名实现零停机重建索引

摘要：1.为什么要重建索引？总结，一个type下的mapping中的filed不能被修改，所以如果需要修改，则需要重建索引 2.怎么zero time重建索引？一个field的设置是不能被修改的，如果要修改一个Field，那么应该重新按照新的mapping，建立一个index，然后将数据批量查询出来，阅读全文

posted @ 2019-05-26 17:38 加肥猫咪阅读(310) 评论(0) 推荐(0)

ElasticSearch（二十七）type的数据结构

摘要：1.什么是type？ type，是一个index中用来区分类似的数据的，类似的数据，但是可能有不同的fields，而且有不同的属性来控制索引建立、分词器field的value，在底层的lucene中建立索引的时候，全部是opaque bytes类型，不区分类型的。 lucene是没有type的概念的阅读全文

posted @ 2019-05-26 16:17 加肥猫咪阅读(611) 评论(0) 推荐(0)

ElasticSearch（二十六）修改分词器及定制自己的分词器

摘要：1、默认的分词器 standard 分词器 standard tokenizer：以单词边界进行切分standard token filter：什么都不做lowercase token filter：将所有字母转换为小写stop token filer（默认被禁用）：移除停用词，比如a the it 阅读全文

posted @ 2019-05-22 23:57 加肥猫咪阅读(3349) 评论(0) 推荐(0)

ElasticSearch（二十四）基于scoll技术滚动搜索大量数据

摘要：1.为什么要使用scroll? 如果一次性要查出来比如10万条数据，那么性能会很差，此时一般会采取用scoll滚动查询，一批一批的查，直到所有数据都查询完处理完 2.原理使用scoll滚动搜索，可以先搜索一批数据，然后下次再搜索一批数据，以此类推，直到搜索出全部的数据来scoll搜索会在第一次搜索阅读全文

posted @ 2019-05-22 23:34 加肥猫咪阅读(296) 评论(0) 推荐(0)

ElasticSearch（二十一）正排和倒排索引

摘要：1.区别搜索的时候，要依靠倒排索引；排序的时候，需要依靠正排索引，看到每个document的每个field，然后进行排序，所谓的正排索引，其实就是doc values 在建立索引的时候，一方面会建立倒排索引，以供搜索用；一方面会建立正排索引，也就是doc values，以供排序，聚合，过滤等操作使阅读全文

posted @ 2019-05-19 20:45 加肥猫咪阅读(780) 评论(0) 推荐(0)

ElasticSearch（二十）定位不合法的搜索及其原因

摘要：这边math拼写错误，相对应的返回：字段拼写错误：一般用在那种特别复杂庞大的搜索下，比如你一下子写了上百行的搜索，这个时候可以先用validate api去验证一下，搜索是否合法阅读全文

posted @ 2019-05-19 19:54 加肥猫咪阅读(220) 评论(0) 推荐(0)

ElasticSearch（十八）初识分词器

摘要：1、什么是分词器作用：切分词语，normalization（提升recall召回率），如给你一段句子，然后将这段句子拆分成一个一个的单个的单词，同时对每个单词进行normalization（时态转换，单复数转换），分词器 recall，召回率：搜索的时候，增加能够搜索到的结果的数量 3个功能：一阅读全文

posted @ 2019-05-19 17:59 加肥猫咪阅读(212) 评论(0) 推荐(0)

ElasticSearch（十七）初识倒排索引

摘要：现在有两条document: 1.分词，初步的倒排索引的建立（*代表有，空代表无）：这边演示了一下倒排索引最简单的建立的一个过程假设进行搜索：mother like little dog，结果是：不可能有任何结果过程是将mother like little dog进行一个个拆分，然后进行匹配，阅读全文

posted @ 2019-05-19 17:41 加肥猫咪阅读(354) 评论(0) 推荐(0)

ElasticSearch（十五) _search api 分页搜索及deep paging性能问题

摘要：1、分页搜索语法：实际操作：查看共有5条数据：我们假设将这7条数据分成3页，每一页是3条数据，来实验一下这个分页搜索的效果第一页：第二页：第三页： 2、深度搜索deep paging的性能问题阅读全文

posted @ 2019-01-18 15:13 加肥猫咪阅读(389) 评论(0) 推荐(0)

ElasticSearch（十四) _search api search timeout 机制

摘要：语法：timeout=10ms，timeout=1s，timeout=1m timeout：默认无timeout，latency平衡completeness，手动指定timeout，timeout查询执行机制阅读全文

posted @ 2019-01-18 14:36 加肥猫咪阅读(1353) 评论(0) 推荐(0)

ElasticSearch（十三） bulk api奇特的json格式的原因

摘要：bulk api的语法正常的语法：异常的语法： 1、bulk中的每个操作都可能要转发到不同的node的shard去执行 2、如果采用比较良好的json数组格式允许任意的换行，整个可读性非常棒，读起来很爽，es拿到那种标准格式的json串以后，要按照下述流程去进行处理（1）将json数组解析为阅读全文

posted @ 2019-01-18 14:11 加肥猫咪阅读(995) 评论(0) 推荐(0)

ElasticSearch（八）关于document的一些知识点

摘要：先查看一条数据： 1、_index元数据（1）代表一个document存放在哪个index中（2）类似的数据放在一个索引，非类似的数据放不同索引：product index（包含了所有的商品），sales index（包含了所有的商品销售数据），inventory index（包含了所有库存相关阅读全文

posted @ 2019-01-17 11:36 加肥猫咪阅读(4143) 评论(0) 推荐(0)

ElasticSearch（十一）批量CURD bulk

摘要：1、bulk语法 bulk api对json的语法，有严格的要求，每个json串不能换行，只能放一行，同时一个json串和一个json串之间，必须有一个换行如果格式是这样：结果：如果格式是这样：结果： bulk操作中，任意一个操作失败，是不会影响其他的操作的，但是在返回结果里，会告诉你异常日阅读全文

posted @ 2019-01-17 11:07 加肥猫咪阅读(448) 评论(0) 推荐(0)

ElasticSearch（十二）批量查询mget

摘要：1、批量查询的好处就是一条一条的查询，比如说要查询100条数据，那么就要发送100次网络请求，这个开销还是很大的如果进行批量查询的话，查询100条数据，就只要发送1次网络请求，网络请求的性能开销缩减100倍 2、mget的语法（1）一条一条的查询 GET /test_index/test_typ 阅读全文

posted @ 2019-01-17 10:31 加肥猫咪阅读(319) 评论(0) 推荐(0)

ElasticSearch（九）基于version进行乐观锁并发控制

摘要：一、基于version进行乐观锁并发控制 1)、查看一条document 2)、模拟多并发下，利用version进行更新同时带上数据的版本号，确保说，es中的数据的版本号，跟客户端中的数据的版本号是相同的，才能修改二、基于external version进行乐观锁并发控制 es提供了一个feat 阅读全文

posted @ 2019-01-15 11:59 加肥猫咪阅读(2366) 评论(0) 推荐(0)

ElasticSearch（七）容错机制

摘要：一、关于横向扩容（1）primary&replica自动负载均衡，6个shard，3 primary，3 replica（2）每个node有更少的shard，IO/CPU/Memory资源给每个shard分配更多，每个shard性能更好（3）扩容的极限，6个shard（3 primary，3 re 阅读全文

posted @ 2019-01-09 14:32 加肥猫咪阅读(757) 评论(0) 推荐(0)

ElasticSearch（四）kibana实现CURD

摘要：一. kibana安装 1.到官网或是用brew下载kibana 安装包，这边我们选择在官网下载对应的安装包 https://www.elastic.co/cn/downloads/kibana 2.解压缩到对应的目录下，我们解压缩到了 /usr/local/kibana-6.5.2-darwin- 阅读全文

posted @ 2018-12-20 11:37 加肥猫咪阅读(409) 评论(0) 推荐(0)

ElasticSearch（三）mac安装

摘要：1.首先要安装jdk 2.到官网或是用brew下载ElasticSearch 安装包，这边我们选择在官网下载对应的安装包 https://www.elastic.co/cn/downloads/elasticsearch 3.解压缩到对应的目录下，我们解压缩到了 /usr/local/elastic 阅读全文

posted @ 2018-12-12 09:52 加肥猫咪阅读(210) 评论(0) 推荐(0)

ElasticSearch（二）核心概念

摘要：elasticsearch核心概念（1）Near Realtime（NRT）：近实时，两个意思，从写入数据到数据可以被搜索到有一个小延迟（大概1秒）；基于es执行搜索和分析可以达到秒级（2）Cluster：集群，包含多个节点，每个节点属于哪个集群是通过一个配置（集群名称，默认是elasticse 阅读全文

posted @ 2018-11-22 10:43 加肥猫咪阅读(419) 评论(0) 推荐(0)

ElasticSearch（一）什么是全文检索？

摘要：全文检索全文检索，即倒排索引。阅读全文

posted @ 2018-11-13 15:05 加肥猫咪阅读(413) 评论(0) 推荐(0)

随笔分类 - ElasticSearch

公告