ES-学习 - 随笔分类 - 5765809

66_索引管理_复杂上机实验：基于scoll+bulk+索引别名实现零停机重建索引

摘要：课程大纲 1、重建索引一个field的设置是不能被修改的，如果要修改一个Field，那么应该重新按照新的mapping，建立一个index，然后将数据批量查询出来，重新用bulk api写入index中批量查询的时候，建议采用scroll api，并且采用多线程并发的方式来reindex数据，每阅读全文

posted @ 2024-10-02 13:09 5765809 阅读(22) 评论(0) 推荐(0)

65_索引管理_定制化自己的dynamic mapping策略

摘要：课程大纲 1、定制dynamic策略 true：遇到陌生字段，就进行dynamic mapping false：遇到陌生字段，就忽略 strict：遇到陌生字段，就报错 PUT /my_index { "mappings": { "my_type": { "dynamic": "strict", " 阅读全文

posted @ 2024-10-02 13:08 5765809 阅读(17) 评论(0) 推荐(0)

64_索引管理_mapping root object深入剖析

摘要：课程大纲 1、root object 就是某个type对应的mapping json，包括了properties，metadata（_id，_source，_type），settings（analyzer），其他settings（比如include_in_all） PUT /my_index { " 阅读全文

posted @ 2024-10-02 13:08 5765809 阅读(10) 评论(0) 推荐(0)

63_索引管理_内核级知识点：深入探秘type底层数据结构

摘要：type，是一个index中用来区分类似的数据的，类似的数据，但是可能有不同的fields，而且有不同的属性来控制索引建立、分词器 field的value，在底层的lucene中建立索引的时候，全部是opaque bytes类型，不区分类型的 lucene是没有type的概念的，在document中阅读全文

posted @ 2024-10-02 13:07 5765809 阅读(11) 评论(0) 推荐(0)

62_索引管理_快速上机动手实战修改分词器以及定制自己的分词器

摘要：1、默认的分词器 standard standard tokenizer：以单词边界进行切分 standard token filter：什么都不做 lowercase token filter：将所有字母转换为小写 stop token filer（默认被禁用）：移除停用词，比如a the it等阅读全文

posted @ 2024-10-02 13:06 5765809 阅读(21) 评论(0) 推荐(0)

61_索引管理_快速上机动手实战创建、修改以及删除索引

摘要：1、为什么我们要手动创建索引？ 2、创建索引创建索引的语法 PUT /my_index { "settings": { ... any settings ... }, "mappings": { "type_one": { ... any mappings ... }, "type_two": { 阅读全文

posted @ 2024-10-02 13:05 5765809 阅读(13) 评论(0) 推荐(0)

60_初识搜索引擎_上机动手实战基于scoll技术滚动搜索大量数据

摘要：如果一次性要查出来比如10万条数据，那么性能会很差，此时一般会采取用scoll滚动查询，一批一批的查，直到所有数据都查询完处理完使用scoll滚动搜索，可以先搜索一批数据，然后下次再搜索一批数据，以此类推，直到搜索出全部的数据来 scoll搜索会在第一次搜索的时候，保存一个当时的视图快照，之后只会阅读全文

posted @ 2024-10-02 13:05 5765809 阅读(54) 评论(0) 推荐(0)

摘要：1、preference 决定了哪些shard会被用来执行搜索操作 _primary, _primary_first, _local, _only_node:xyz, _prefer_node:xyz, _shards:2,3 bouncing results问题，两个document排序，fiel 阅读全文

posted @ 2024-10-02 13:04 5765809 阅读(20) 评论(0) 推荐(0)

58_初识搜索引擎_分布式搜索引擎内核解密之fetch phase

摘要：课程大纲 1、fetch phbase工作流程（1）coordinate node构建完priority queue之后，就发送mget请求去所有shard上获取对应的document （2）各个shard将document返回给coordinate node （3）coordinate node 阅读全文

posted @ 2024-10-02 13:04 5765809 阅读(6) 评论(0) 推荐(0)

57_初识搜索引擎_分布式搜索引擎内核解密之query phase

摘要：1、query phase （1）搜索请求发送到某一个coordinate node，构构建一个priority queue，长度以paging操作from和size为准，默认为10 （2）coordinate node将请求转发到所有shard，每个shard本地搜索，并构建一个本地的priori 阅读全文

posted @ 2024-10-02 13:03 5765809 阅读(13) 评论(0) 推荐(0)

56_初识搜索引擎_内核级知识点之doc value初步探秘

摘要：搜索的时候，要依靠倒排索引；排序的时候，需要依靠正排索引，看到每个document的每个field，然后进行排序，所谓的正排索引，其实就是doc values 在建立索引的时候，一方面会建立倒排索引，以供搜索用；一方面会建立正排索引，也就是doc values，以供排序，聚合，过滤等操作使用 doc 阅读全文

posted @ 2024-10-02 13:02 5765809 阅读(15) 评论(0) 推荐(0)

55_初识搜索引擎_相关度评分TF&IDF算法独家解密

摘要：课程大纲 1、算法介绍 relevance score算法，简单来说，就是计算出，一个索引中的文本，与搜索文本，他们之间的关联匹配程度 Elasticsearch使用的是 term frequency/inverse document frequency算法，简称为TF/IDF算法 Term fre 阅读全文

posted @ 2024-10-02 13:02 5765809 阅读(43) 评论(0) 推荐(0)

54_初识搜索引擎_解密如何将一个field索引两次来解决字符串排序问题

摘要：如果对一个string field进行排序，结果往往不准确，因为分词后是多个单词，再排序就不是我们想要的结果了通常解决方案是，将一个string field建立两次索引，一个分词，用来进行搜索；一个不分词，用来进行排序 PUT /website { "mappings": { "article": 阅读全文

posted @ 2024-10-02 13:01 5765809 阅读(6) 评论(0) 推荐(0)

53_初识搜素引擎_上机动手实战如何定制搜索结果的排序规则

摘要：1、默认排序规则默认情况下，是按照_score降序排序的然而，某些情况下，可能没有有用的_score，比如说filter GET /_search { "query" : { "bool" : { "filter" : { "term" : { "author_id" : 1 } } } } } 阅读全文

posted @ 2024-10-02 13:01 5765809 阅读(15) 评论(0) 推荐(0)

52_初识搜索引擎_上机动手实战如何定位不合法的搜索以及其原因

摘要：GET /test_index/test_type/_validate/query?explain { "query": { "math": { "test_field": "test" } } } { "valid": false, "error": "org.elasticsearch.comm 阅读全文

posted @ 2024-10-02 13:00 5765809 阅读(13) 评论(0) 推荐(0)

51_初识搜索引擎_上机动手实战多搜索条件组合查询

摘要：课程大纲 GET /website/article/_search { "query": { "bool": { "must": [ { "match": { "title": "elasticsearch" } } ], "should": [ { "match": { "content": "e 阅读全文

posted @ 2024-10-02 00:07 5765809 阅读(8) 评论(0) 推荐(0)

50_初识搜索引擎_上机动手实战常用的各种query搜索语法

摘要：课程大纲 1、match all GET /_search { "query": { "match_all": {} } } 2、match GET /_search { "query": { "match": { "title": "my elasticsearch article" }} } 3 阅读全文

posted @ 2024-10-02 00:06 5765809 阅读(131) 评论(0) 推荐(0)

49_初识搜索引擎_filter与query深入对比解密：相关度，性能

摘要：课程大纲 1、filter与query示例 PUT /company/employee/2 { "address": { "country": "china", "province": "jiangsu", "city": "nanjing" }, "name": "tom", "age": 30, 阅读全文

posted @ 2024-10-02 00:05 5765809 阅读(107) 评论(0) 推荐(0)

48_初识搜索引擎_快速上机动手实战Query DSL搜索语法

摘要：课程大纲 1、一个例子让你明白什么是Query DSL GET /_search { "query": { "match_all": {} } } 2、Query DSL的基本语法 { QUERY_NAME: { ARGUMENT: VALUE, ARGUMENT: VALUE,... } } { 阅读全文

posted @ 2024-10-02 00:04 5765809 阅读(22) 评论(0) 推荐(0)

47_初识搜索引擎_search api的基础语法介绍

摘要：课程大纲 1、search api的基本语法 GET /search {} GET /index1,index2/type1,type2/search {} GET /_search { "from": 0, "size": 10 } 2、http协议中get是否可以带上request body H 阅读全文

posted @ 2024-10-02 00:04 5765809 阅读(22) 评论(0) 推荐(0)

随笔分类 - ES-学习

公告