Redis系列(四):Redis持久化和主从复制原理

一、持久化

  所谓的持久化就是把内存中的数据写到磁盘中去,防止服务宕机后内存数据丢失。Redis4.0之前提供了两种持久化方式:RDB(默认) 和AOF,Redis4.x之后新增了一种混合持久化(本文所用的Redis版本是redis‐5.0.2

  1、RDB

  RDB是Redis Database缩写,在默认情况下,Redis将内存数据库快照保存在名字为dump.rdb的二进制文件中。可以对Redis进行设置,让它在 N秒内至少有M个键值改动这一条件被满足时,自动保存一次数据。比如下图,900秒内有1个键值或者300秒内有10个键值或者60秒内有10000个键值改动,自动保存一次数据;关闭RDB只需要将所有的save保存策略注释掉即可。

   还可以手动执行命令生成RDB快照,进入Redis客户端执行命令save或bgsave可以生成dump.rdb文件,每次命令执行都会将所有Redis内存快照到一个新的rdb文件里,并覆盖原有rdb快照文件。save是同步命令,bgsave是异步命令,bgsave会从redis主进程fork(fork()是linux函数)出一个子进程专门用来生成rdb快照文件。Redis配置自动生成rdb文件后台使用的是bgsave方式。

save与bgsave对比
命令 save bgsave
IO类型 同步 异步
是否阻塞redis其它命令 否(在生成子进程执行调用fork函数时会短暂阻塞)
复杂度 O(n) O(n)
优点 不会消耗额外内存 不阻塞客户端命令
缺点 阻塞客户端命令 需要fork子进程,消耗内存

   2、AOF

  AOF是append-only file缩写,RDB快照并不是非常耐久(durable):如果Redis因为某些原因而造成故障停机,那么服务器将丢失最近写入、且仍未保存到快照中的那些数据。从Redis1.1版本开始,Redis增加了一种完全耐久的持久化方式:AOF持久化。可以通过修改如下配置文件来打开AOF功能:

   修改了配置文件,先执行bin/redis-cli shutdown停止Redis,然后执行bin/redis-server redis.conf启动Redis,此时appendonly生效;从现在开始, 每当Redis执行一个改变键值的命令时(比如 SET),这个命令就会被追加到AOF文件的末尾。这样的话,当 Redis重新启动时,程序就可以通过重新执行AOF文件中的命令来达到重建数据的目的。你可以配置 Redis 多久才将数据 fsync到磁盘一次。

  ① appendfsync always:每次有新命令追加到AOF文件时就执行一次fsync,非常慢,也非常安全。

  ② appendfsync everysec:每秒fsync一次,足够快(和使用 RDB 持久化差不多),并且在故障时只会丢失 1 秒钟的数据。

  ③ appendfsync no:从不 fsync,将数据交给操作系统来处理。更快,也更不安全的选择。

  推荐(并且也是默认)的措施为每秒fsync一次,这种fsync策略可以兼顾速度和安全性。配置文件如下:

  执行如下命令:

  (1)启动客户端,连接Redis bin/redis-cli 并执行set toby xu

   (2) 到dir(redis.conf这个配置文件里面的数据持久化的目录属性)所在的目录下查看,如下图:

   (3)vim appendonly.aof,文件的内容在后面的RESP(Redis序列化协议)中详解讲解,Redis序列化协议官网地址:https://redis.io/topics/protocol

   AOF重写:

  (1)AOF文件里可能有太多没用指令,所以AOF会定期根据内存的最新数据生成新的aof文件,当然可以手工执行bgrewriteaof命令也能重写AOF,比如执行如下命令:

   (2)重写后AOF文件里变成:

   如下两个配置可以控制AOF自动重写频率:

  ① auto-aof-rewrite-min-size 64mb :aof文件至少要达到64M才会自动重写。

  ② auto-aof-rewrite-percentage 100 :aof文件自上一次重写后文件大小增长了100%则再次触发重写。

  当然AOF还可以手动重写,进入redis客户端执行如上图命令bgrewriteaof重写AOF注意,AOF重写Redis会fork出一个子进程去做,不会对Redis正常命令处理有太多影响。

  3、RDB和AOF对比

  Redis启动时如果既有RDB文件又有AOF文件则优先选择AOF文件恢复数据,因为AOF一般来说数据更全一点。

持久化方式 RDB AOF
启动优先级
文件大小
恢复速度
数据安全性 容易丢数据 根据策略决定

   4、Redis4.0混合持久化

  重启Redis时,我们很少使用 RDB来恢复内存状态,因为会丢失大量数据。我们通常使用AOF日志重放,但是重放AOF日志性能相对RDB来说要慢很多,这样在 Redis 实例很大的情况下,启动需要花费很长的时间。 Redis4.0为了解决这个问题,带来了一个新的持久化选项——混合持久化。配置如下:

   如果开启了混合持久化,AOF在重写时,不再是单纯将内存数据转换为RESP命令写入AOF文件,而是将重写这一刻之前的内存做RDB快照处理,并且将RDB快照内容和增量的AOF修改内存数据的命令存在一起,都写入新的AOF文件,新的文件一开始不叫appendonly.aof,等到重写完新的AOF文件才会进行改名,原子的覆盖原有的AOF文件,完成新旧两个AOF文件的替换。于是在Redis重启的时候,可以先加载RDB的内容,然后再重放增量AOF文件就可以完全替代之前的AOF全量文件重放,因此重启效率大幅得到提升。

 二、Redis主从

   1、主从复制概念

  主从复制,是指将一台Redis服务器的数据,复制到其他的Redis服务器。前者称为主节点(master),后者称为从节点(slave),数据的复制是单向的,只能由主节点到从节点。

   2、主从复制的原理

  (1)全量复制

  将主节点中的所有数据都发送给从节点,是一个非常重型的操作,当数据量较大时,会对主从节点和网络造成很大的开销。全量复制流程图如下:

  ① slave会发出一个同步命令,刚开始是Psync命令,表示要求master主机同步数据

  ② master收到psync命令后,会通过执行bgsave生成最新的RDB快照文件,持久化期间,master会继续接收客户端的请求,它会把写请求缓存在内存中

  ③ 发送RDB文件给slave

  ④ master再将之前缓存在内存中的命令发送给slave

  ⑤ 刷新旧的数据。slave在载入主节点的数据之前要先将老数据清除

  ⑥ 加载RDB文件将数据库状态更新至主节点执行bgsave时的数据库状态和缓冲区数据的加载

  ⑦ master同步长连接持续把写命令发送给slave,以保证数据的一致

  (2)部分复制

  部分复制是Redis 2.8以后出现的,用于处理在主从复制中因网络闪断等原因造成的数据丢失场景,当slave再次连上master后,如果条件允许,master会补发丢失数据给slave。因为补发的数据远远小于全量数据,可以有效避免全量复制的过高开销。部分复制流程图如下:

  ① 如果网络抖动(连接断开 connection lost)

  ② master还是会写repl_back_buffer(复制缓冲区)

  ③ slave会继续尝试连接主机

  ④ slave会把自己当前run_id和偏移量传输给master,并且执行pysnc命令同步

  ⑤ slave发送过来的offset在repl_back_buffer中,则master会将缓存中从offset以后的数据一次性同步给slave,否则全量复制

  ⑥ master同步长连接持续把写命令发送给slave,以保证数据的一致

  3、主从搭建

   其中slave的主要配置如下:

port 6380
pidfile /var/run/redis_6380.pid
dir /usr/local/redis-5.0.2/6380
replicaof 192.168.160.146 6379
replica-serve-stale-data yes
replica-read-only yes

  (1)在6379 set toby xu 

   (2)在6380 keys *

   至此Redis主从搭建完成!!!!!

posted @ 2019-12-03 20:25  toby.xu  阅读(...)  评论(... 编辑 收藏