Redis哨兵和cluster集群
一、redis数据库哨兵模式
1. 什么是哨兵模式
哨兵模式:哨兵(sentinel):是一个分布式系统,用于对主从结构中的每台服务器进行监控,当出现故障时通过投票机制选择新的Master并将所有Slave连接到新的 Master。所以整个运行哨兵的集群的数量不得少于3个节点。
哨兵核心功能:在主从复制的基础上,实现了主节点的自动故障转移
2. 哨兵的作用
监控:监控主节点和从节点是否在正常运行
故障自动转移:当主节点不能正常工作时,哨兵会开始自动故障转移操作,它会将失效主节点的其中一个从节点升级为新的主节点,并让其他从节点改为复制新的主节点。
通知(提醒):哨兵将故障转移结果发送给客户端
3. 哨兵结构组成
哨兵节点:一个或多个哨兵节点组成,特殊的redis节点不存储数据
数据节点:主节点和从节点即数据节点
4. 哨兵故障转移机制
主观下线:一个哨兵认为主节点有问题,则进行下一步即选举
客观下线:多个哨兵(半数以上)认为主节点有问题(客观下线是主节点上才会有的概念)
①由哨兵节点定期监控主节点是否发生故障
1个从节点每隔1s向哨兵发送ping的命令做心跳检测,主节点在一定时间内不回复或回复有问题则单个从节点认为主节点下线即主观下线,若超过半数的哨兵认为主节点下线了即客观下线真正下线了。
5. 哨兵工作、切换原理
哨兵原理:分布式系统,用于对主从结构中的每台服务器进行监控,当出现故障是通过投票机制选新的master并将所有slave连接到新的master上,整个哨兵的集群数量不能少于3个节点(3台服务器)
由leader哨兵节点执行故障转移,过程如下:
●将某一个从节点升级为新的主节点,让其它从节点指向新的主节点;
●若原主节点恢复也变成从节点,并指向新的主节点;
●通知客户端主节点已经更换。
6. 主节点的选举:
1.过滤掉不健康的(已下线的),没有回复哨兵 ping 响应的从节点。
2.选择配置文件中从节点优先级配置最高的。(replica-priority,默认值为100)
3.选择复制偏移量最大,也就是复制最完整的从节点。
7. 哨兵模式部署
7.1 部署环境
1 Master节点:192.168.50.200 2 Slave1节点:192.168.50.100 3 Slave2节点:192.168.50.150 4 5 systemctl stop firewalld 6 setenforce 0
7.2 修改哨兵模式的配置文件
1 vim /opt/redis-5.0.7/sentinel.conf 2 protected-mode no 3 #17行,关闭保护模式 4 port 26379 5 #21行,Redis哨兵默认的监听端口 6 daemonize yes 7 #26行,指定sentinel为后台启动 8 logfile "/var/log/sentinel.log" 9 #36行,指定日志存放路径 10 dir "/var/lib/redis/6379" 11 #65行,指定数据库存放路径 12 sentinel monitor mymaster 192.168.50.200 6379 13 #84行,修改 指定该哨兵节点监控192.168.50.200:6379这个主节点,该主节点的名称是mymaster,最后的2的含义与主节点的故障判定有关:至少需要2个哨兵节点同意,才能判定主节点故障并进行故障转移 14 sentinel down-after-milliseconds mymaster 30000 15 #113行,判定服务器down掉的时间周期,默认30000毫秒(30秒) 16 sentinel failover-timeout mymaster 180000 17 #146行,故障节点的最大超时时间为180000(180秒)
7.3 启动哨兵模式
1 先启master,再启slave 2 cd /opt/redis-5.0.7/ 3 redis-sentinel sentinel.conf &
7.4 查看redis默认端口信息
master:
slave1:
slave2:
7.5 查看哨兵信息
master:
二、Redis集群模式
1. 什么是集群
集群,即Redis Cluster,是Redis 3.0开始引入的分布式存储方案。集群由多个节点(Node)组成,Redis的数据分布在这些节点中。集群中的节点分为主节点和从节点:只有主节点负责读写请求和集群信息的维护;从节点只进行主节点数据和状态信息的复制。
2. 集群的作用
可以归纳为两点:
(1)数据分区:数据分区(或称数据分片)是集群最核心的功能。
集群将数据分散到多个节点,一方面突破了Redis单机内存大小的限制,存储容量大大增加;另一方面每个主节点都可以对外提供读服务和写服务,大大提高了集群的响应能力。
Redis单机内存大小受限问题,在介绍持久化和主从复制时都有提及;例如,如果单机内存太大,bgsave和bgrewriteaof的fork操作可能导致主进程阻塞,主从环境下主机切换时可能导致从节点长时间无法提供服务,全量复制阶段主节点的复制缓冲区可能溢出。
(2)高可用:集群支持主从复制和主节点的自动故障转移(与哨兵类似);当任一节点发生故障时,集群仍然可以对外提供服务。
3. Redis集群的数据分片
Redis集群引入了哈希槽的概念
Redis集群有16384个哈希槽(编号0-16383)
集群的每个节点负责一部分哈希槽
每个Key通过CRC16校验后对16384取余来决定放置哪个哈希槽,通过这个值,去找到对应的插槽所对应的节点,然后直接自动跳转到这个对应的节点上进行存取操作
以3个节点组成的集群为例:
节点A包含0到5460号哈希槽
节点B包含5461到10922号哈希槽
节点C包含10923到16383号哈希槽
4. Redis集群的主从复制模型
集群中具有A、B、C三个节点,如果节点B失败了,整个集群就会因缺少5461-10922这个范围的槽而不可以用。
为每个节点添加一个从节点A1、B1、C1整个集群便有三个Master节点和三个slave节点组成,在节点B失败后,集群选举B1位为的主节点继续服务。当B和B1都失败后,集群将不可用。
5. 搭建Redis集群模式
5.1 部署环境
redis的集群一般需要6个节点,3主3从,使用三台机器做,每台机器两个端口即可
master 端口 slave 端口
192.168.50.200 6001 192.168.50.200 6002
192.168.50.100 6003 192.168.50.100 6004
192.168.50.150 6005 192.168.50.150 6006
5.2 编译安装
1 三台机器执行: 2 systemctl stop firewalld #关闭防火墙 3 setenforce 0 #关闭selinux 4 yum install gcc gcc-c++ make -y #安装编译工具 5 #将安装包传输到每台机器的/opt目录下,安装包本人资源中心中redis-5.0.7.tar.gz可自行下载 6 tar zxvf redis-5.0.7.tar.gz #将安装包解压在当前目录 7 cd redis-5.0.7 #进入解压后的文件夹中 8 make #编译为二进制语言 9 make install prefix=/url/local/redis #写入磁盘指定位置/url/local/redis
5.3 服务器配置
1 三台机器执行: 2 cd /etc #进入/etc目录 3 mkdir reids #创建 redis目录 4 cd redis #进入redis目录 5 mkdir -p redis-cluster/redis6001 #创建实例1文件夹 6 mkdir -p redis-cluster/redis6002 #创建实例2文件夹 7 cp /opt/redis-5.0.7/redis.conf /etc/redis/redis-cluster/redis6001 #实例1拷贝主配置文件 8 cp /opt/redis-5.0.7/src/redis-cli /opt/redis-5.0.7/src/redis-server /etc/redis/redis-cluster/redis6001 #实例1拷贝客户端、服务端工具 9 cp /opt/redis-5.0.7/redis.conf /etc/redis/redis-cluster/redis6002 #实例2拷贝主配置文件 10 cp /opt/redis-5.0.7/src/redis-cli /opt/redis-5.0.7/src/redis-server /etc/redis/redis-cluster/redis6002 #实例2拷贝客户端、服务端工具 11 cd /etc/redis/redis-cluster/redis6001 #进入实例1进行配置文件修改 12 vim redis.conf #编辑实例1的配置文件 13 bind 0.0.0.0 #69行,监听所有地址 14 protected-mode no #88行,修改,关闭保护模式 15 port 6001 #92行,修改,redis监听端口(同一台机器的2个实例端口号不能相同) 16 daemonize yes #136行,开启守护进程,以独立进程启动 17 logfile /var/log/redis_6001.log #172行,指定日志文件目录 18 cluster-enabled yes #832行,取消注释,开启群集功能 19 cluster-config-file nodes-6001.conf #840行,取消注释,群集名称文件设置为实例端口.conf 20 cluster-node-timeout 15000 #846行,取消注释群集超时时间设置 21 appendonly yes #700行,修改,开启AOF持久化 22 #修改完成实例1后修改实例2,除端口号改为6002 日志文件目录改为6002.conf 群集名称文件改为nodes-6002.conf 其余与实例1一样即可。
5.4 启动多实例并查看服务
1 三台机器执行: 2 cd /etc/redis/redis-cluster/redis6001 #进入对应实例1目录 3 redis-server redis.conf #执行启动redis实例1 4 cd /etc/redis/redis-cluster/redis6002 #进入对应实例2目录 5 redis-server redis.conf #执行启动redis实例2 6 ps -elf |grep redis #查看是否为2个redis进程在运行
5.4 启动集群
随便一台机器执行: redis-cli --cluster create 192.168.50.200:6001 192.168.50.100:6001 192.168.50.150:6001 192.168.50.200:6002 192.168.50.100:6002 192.168.50.150:6002 --cluster-replicas 1 #前面三个ip+端口是master服务器,后面三个是slave服务器 --cluster-replicas 1 是指每个主节点有一个从节点
5.5 验证结果
登录一台reids实例查看主从对应关系及哈希槽位范围 redis-cli -p 6001 -c #登录其中一台主redis -c指集群模式连接可以互相跳转 cluster slots #查看主从对应关系及哈希槽位范围 set ky26 123 #主上设置ky26值为123查看对应备上是否有此键