elasticsearch 集群

一、节点

1，Coordination Node

①处理请求的节点，叫Coordination Node，路由请求到正确的节点，例如创建索引的请求，需要路由到master节点

②所有节点默认都是Coordination Node

③通过将其他类型设置false，使其成为Dedicated Coordination Node

2，Data Node

①可以保存数据的节点，叫做Data Node，节点启动后，默认就是数据节点。可以设置node.data:false禁止

②Data Node的职责：保存分片数据。在数据扩展上起到了至关重要的作用（由Master Node决定如何把分片分发到数据节点上）

③通过增加数据节点，可以解决数据水平扩展和解决数据单点问题

3，Master Node

Master Node职责：

①处理创建、删除索引等请求/决定分片被分配到哪个节点/负责索引的创建与删除

②维护并且更新Cluster State

Master Node最佳实践：

①Master 节点非常重要，在部署上需要考虑决绝单点的问题

②为一个集群设置多个Master节点/每个节点只承担Master的单一角色

4，Master Eligible Nodes & 选主流程

①一个集群，支持配置多个Master Eligible节点。这些节点可以在必要时（如Master 节点出现故障，网络故障时）参与选主流程，成为Master节点

②每个节点启动后，默认就是一个Master Eligible节点，可以设置node.master:false 禁止

③单集群内第一个Master Eligible节点启动时，它会将自己选举成Master节点

二、分片

1，主分片-提升系统存储容量

分片是elasticsearch分布式存储的基石（主分片/副本分片）

通过主分片，将数据分布在所有节点上

　　主分片，可以将一份索引的数据，分散在多个Data Node上，实现存储的水平扩展

　　主分片数在索引创建的时候指定，后续默认不能修改，如需修改，需要重建索引

2，副本分片-提高数据可用性

数据可用性

　　通过引入副本分片提高数据的可用性。一旦主分片丢失，副本分片可以promote成主分片。副本分片数可以动态调整。每个节点上都有完备的数据。如果不设置副本分片，一旦出现节点硬件故障，就有可能造成数据丢失

提成系统的读取性能

　　副本分片由主分片同步。通过支持增加replica个数，一定程度可以提高读取的吞吐量

3，分片数的设定-如何规划一个索引的主分片数和副本分片数

① 主分片数过小：例如创建了1个主分片的索引。如果该索引增长的很快，集群无法通过增加节点实现对这个索引的数据扩展

②主分片数设置过大：导致单个分片容量很小，引发一个节点上有过多的分片，影响性能

③副本分片数设置过多，会降低集群整体的写入性能

4，如何确定主分片数

①从存储物理角度看

　　日志类应用，单个分片不要大于50GB

　　搜索类应用，单个分片不要超过20GB

②为什么要控制分片大小

　　提高update的性能

　　Merge时，减少所需的资源

　　丢失节点后，具备更快的恢复速度/便于分片在集群内Rebalancing

5，如何确定副本分片数

①副本是主分片的拷贝

　　提高系统的可用性：相应查询请求，防止数据丢失

　　需要占用和主分片一样的资源

②对性能的影响

　　副本会降低数据的索引速度：有几分副本就会有几倍的CPU资源消耗在索引上

　　会减缓对主分片的查询压力，但是会消耗同样的内存资源。如果机器资源充分，提高副本数，可以提高整体的查询QPS

三、监控elasticsearch集群

# Node Stats：
GET _nodes/stats

#Cluster Stats:
GET _cluster/stats

#Index Stats:
GET kibana_sample_data_ecommerce/_stats

#Pending Cluster Tasks API:
GET _cluster/pending_tasks

# 查看所有的 tasks，也支持 cancel task
GET _tasks


GET _nodes/thread_pool
GET _nodes/stats/thread_pool
GET _cat/thread_pool?v
GET _nodes/hot_threads
GET _nodes/stats/thread_pool


# 设置 Index Slowlogs
# the first 1000 characters of the doc's source will be logged
PUT my_index/_settings
{
  "index.indexing.slowlog":{
    "threshold.index":{
      "warn":"10s",
      "info": "4s",
      "debug":"2s",
      "trace":"0s"
    },
    "level":"trace",
    "source":1000  
  }
}

# 设置查询
DELETE my_index
//"0" logs all queries
PUT my_index/
{
  "settings": {
    "index.search.slowlog.threshold": {
      "query.warn": "10s",
      "query.info": "3s",
      "query.debug": "2s",
      "query.trace": "0s",
      "fetch.warn": "1s",
      "fetch.info": "600ms",
      "fetch.debug": "400ms",
      "fetch.trace": "0s"
    }
  }
}

GET my_index

#案例1
DELETE mytest
PUT mytest
{
  "settings":{
    "number_of_shards":3,
    "number_of_replicas":0,
    "index.routing.allocation.require.box_type":"hott"
  }
}





# 检查集群状态，查看是否有节点丢失，有多少分片无法分配
GET /_cluster/health/

# 查看索引级别,找到红色的索引
GET /_cluster/health?level=indices


#查看索引的分片
GET _cluster/health?level=shards

# Explain 变红的原因
GET /_cluster/allocation/explain

GET /_cat/shards/mytest
GET _cat/nodeattrs

DELETE mytest
GET /_cluster/health/

PUT mytest
{
  "settings":{
    "number_of_shards":3,
    "number_of_replicas":0,
    "index.routing.allocation.require.box_type":"hot"
  }
}

GET /_cluster/health/

#案例2, Explain 看 hot 上的 explain
DELETE mytest
PUT mytest
{
  "settings":{
    "number_of_shards":2,
    "number_of_replicas":1,
    "index.routing.allocation.require.box_type":"hot"
  }
}

GET _cluster/health
GET _cat/shards/mytest
GET /_cluster/allocation/explain

PUT mytest/_settings
{
    "number_of_replicas": 0
}

四、提升集群写性能

1，关闭无关的功能

①只需要聚合不需要搜索，index设置成false

②不需要算分，Norms设置成false

③不要对字符串使用默认的dynamic mapping。字段数量过多，会对性能产生比较大的印象

④index_options控制在创建倒排索引时，那些内容会被添加到倒排索引中。优化这些设置，一定程度上可以cpu

⑤关闭_source，减少io操作；（不能被reindex了，适合指标型数据）

PUT index
{
  "mappings": {
    "properties": {
      "foo":{
        "type": "integer",
        "index": false
      }
    }
  }
}

PUT index
{
  "mappings": {
    "properties": {
      "foo":{
        "type": "text",
        "norms": false
      }
    }
  }
}

2，一个索引设定的例子

DELETE myindex
PUT myindex
{
  "settings": {
    "index": {
      "refresh_interval": "30s",//30秒一次refresh
      "number_of_shards": "2"
    },
    "routing": {
      "allocation": {
        "total_shards_per_node": "3"//控制分片，避免数据热点
      }
    },
    "translog": {
      "sync_interval": "30s",//降低translog落盘
      "durability": "async"
    },
    "number_of_replicas": 0
  },
  "mappings": {
    "dynamic": false,//避免不必要的字段索引
    "properties": {}
  }
}

posted on 2020-05-01 16:15 *Hunter 阅读(276) 评论(0) 收藏举报

刷新页面返回顶部

*Hunter

elasticsearch 集群

导航

公告