微服务 - Redis缓存 · 数据结构 · 持久化 · 分布式 · 高并发 · 实施方案

系列目录

本篇内容基于 Redis v7.0 的阐述(补充时也有v6.x的应用)；官网：https://redis.io/
本篇计划用 Docker 容器辅助部署，所以需要了解点 Docker 知识；官网：https://www.docker.com

这篇文章呢 ~

这篇文章呢，我本来是用 Docker 来写的，感觉不全面，一段时间过后我又想补充，比如数据类型的解释与排版等等，比如集群的增删改查等等，补充的时候呢，我又没现成的 Docker 数据了，所以就原始编译命令行方式写的，所以有点不统一了，比如截图中的src/redis-cli ...和代码中的redis-cli ...的路径不统一等等，其实意思是一样的了。有v7.x版，有v6.x版，文章中遇到的其实都一样的了。等等等等吧。比如初级学生就为难你们了，这篇文章之外尽量统一吧，尽量不再有比较紊乱的说法吧。

一、分布式解决 Session 的问题

在单站点中，可以将在线用户信息存储在Session中，随时变更获取信息；在多站点分布式集群如何做到Session共享呢？架设一个Session服务，供多服务使用。

频繁使用的数据存在DB端，频繁的DB连接，频繁的IO；数据存于内存中更能减少性能的消耗，更能提高使用效率。

集群化分布式时，为解决以上现象，建立缓存服务显得尤为重要。

建立缓存服务选择性很多，如：Redis、MongoDB等，以下以 Redis 为例：

作者：[Sol·wang] - 博客园，原文出处：https://www.cnblogs.com/Sol-wang/

二、内存数据库 Redis

Remote Dictionary Server；
远程字典服务，Key/Value 存储系统、列存储、文档型存储等，NoSQL开源内存数据库。最多的使用场景是作为数据缓存，存在于应用与DB之间，减少对DB的访问，提高数据操作的性能。

下图展示了缓存服务在整体架构中的位置：
Redis 内存数据库在整体架构中的位置

2.1 Redis 特性

高性能 / 高可用 / 持久化 / 集群化，单实例每秒读写达10万次；

丰富的数据类型：String / Hash / Set / Zset / 队列 / 订阅 / 发布；

高性能数据结构：SDS / Intset / ziplist / listpack / quicklist / skiplist；

支持 ACL：Access Control List；精细化的权限管理策略；

单线程处理事务：顺序执行，容易上锁；

多线程处理辅助功能：连接请求 / 持久化等；

单线程处理事务的优缺点

优点：顺序执行，不存在脏读脏写幻读等情况，不存在死锁，不存在线程管理的开销。
缺点：单线程的性能瓶颈，多处理器的资源浪费。

2.2 单线程IO多路复用

通常情况下，同时连接 Redis 的客户端有成千上万的，但 Redis 只有一个主线程处理事务，那如何做到多路连接集中到一个线程处理呢？

当多个客户端同时发起连接后，这也是需要一个过程的，也是有连接完成的先后，谁连接完成就会告诉 Redis，这里的告诉用的是回调方式，Redis就会把他的任务放到单一的队列中，队列的另一头连接着主线程。

在这个过程当中，多路的连接汇集到一个有足够处理能力的队列中进行传输；是不是可以理解为：多路连接重复利用了单个管道；我想...这里也是体现了 Redis 的多路复用技术。当然，单单就多路复用来讲，也会是多路集中到一路，然后这一路又分成了多路到各各目标。

多路复用也有不同的算法：select、poll、epoll，Redis用的是epoll算法，所以其中有回调的动作，目前而言，epoll是最高效的；关于每个具体的算法，有兴趣的同学可以继续研究一下。

2.3 启动 Redis

2.3.1 用 Docker 启动

1、拉取镜像docker pull redis

2、运行容器 docker run -d --name=some-redis redis

3、连接到 Redis docker exec -it some-redis redis-cli

Redis Docker版默认是没有配置文件的，官网说：可以再生成镜像方式解决...

既然没有配置文件，那 Redis 启动完全是按所有配置项的默认值运行的；如下传参启动：

# 启动 redis-server，多参数配置
docker run -d --name some-redis -p 6379:6379 redis redis-server \
    --bind 0.0.0.0 \        # 支持任意的连接
    --save 60 1 \           # 每60秒 持久化一次
    --protected-mode no \   # 取消保护模式
    --requirepass 123456    # 登录密码 123456；连接后用 auth {password} 方式登录

Redis 启动后，都包含 redis-server / redis-cli；
所以任意 Redis 都可用 redis-cli 连接到其它 redis-server：docker exec -it some-redis redis-cli -h {目标IP} -p {目标端口}

2.3.2 编译与启动

在应用包的根目录下执行（粗略汇总）：

准备环境：dnf install make gcc gcc-c++ -y / apt install make gcc build-essential manpages-dev -y
编译脚本：make CFLAGS="-march=x86-64"
防火墙设置6379（关闭吧）：(systemctl stop firewalld / ufw disable)
提示系统设置：sysctl vm.overcommit_memory=1
配置文件 Redis.conf 的改动：protected-mode 改为 no
启动 Redis 的命令：src/redis-server redis.conf
另开新窗口启动客户端：src/redis-cli -h {连接的IP}

2.3.3 效果演示

以下查看配置文件 Redis.conf 的效果：config get *列出所有配置项

2.4 重要配置项

通常配置参数于配置文件中；比如：/etc/redis/redis.conf

配置项	说明
bind	可访问限制，白名单；注释后不限制
port	对外端口
timeout	连接后，没有通信任务的空闲时间，超出此时长后自动断开
daemonize	后台运行（容器运行时忽略）
protected-mode	只能本地访问的保护模式
tcp-backlog	网络连接队列最大连接数（对应Linux内核参数 net.core.somaxconn，有关命令`sysctl`）
tcp-keepalive	网路通信检测间隔，网络是否已断开（当timeout为0才起效吧）
pidfile	存放ProcessID编号的文件Pid的存放目录（后台运行时才会产生pid文件，容器时是否忽略）
loglevel	日志级别
logfile	日志文件目录
database	数据库个数
requirepass	Client 连接密码
maxclients	客户端同时最大连接数（对应Linux user openfile limit，必设；有关命令`ulimit`）
maxmemory	内存最大使用量，推荐70%

三、数据类型 / 常用命令

Key/Value 的存储系统，Key相当于区分的变量名称，类型区别在于Value；常用数据类型有：

String：字符串，基础类型，递增递减

SET/GET key [value]
写入/取值
INCR/DECR key
从0开始，递增1/递减1
INCRBY/DECRBY key increment
增加减少指定量的整数，指定量的步长自己选择
INCRBYFLOAT key increment
每次指定累加值的总和的双精度浮点型
APPEND key value
向字符串的末尾累加字符串
STRLEN key
获取字符串的长度；英文1个字节，汉字3个字节
MGET/MSET key [value]
同时获取/设置多个键值
GETBIT/SETBIT key offset [value]
变量中字符串以二进制位(0/1)显示；如第offset位换成新值value
BITCOUNT key [start end]
变量中字符串二进制位的(全部/局部)长度
BITOP operation destkey key [key ...]
AND，OR，XOR，NOT，四种运算符；如 key1 OR key2 = destkey
BITPOS key 0/1 [start end]
字符串的二进制位，指定字符的起始范围，第1个0/1的位置

List：有序队列，并非唯一，先进先出，先进后出

LPUSH/RPUSH key value [value]
依次向左向右累计增加
LPOP/RPOP key
依次向左向右累计减少
LLEN key
获取列表中元素的个数
LRANGE numbers start end
获取列表指定范围的个数，包括两端点的元素；可用负数，统一左边最小右边最大
LREM key count value
count 大/小 0时，从左/右删除 count个value的元素；count=0时，删除所有为value的元素
LINDEX key index
index 正数从左负数从右
LSET key index value
索引位置的后面加value值
LTRIM key start end
只保留指定范围的值
LINSERT key BEFORE|AFTER pivot value
找 pivot 的位置前后方加 value
RPOPLPUSH source destination
右侧减少一个值，左侧增加一个值

Set：无序集合，唯一字符串，可查询交集、并集、差集等

SADD/SREM key member [member ...]
增加/删除元素
SMEMBERS key
获取集合中的所有元素
SISMEMBER key member
元素是否存在集合中
SDIFF key [key ...]
集合中，只第一个存在的项
SINTER key [key ...]
集合中，共有的项
SUNION key [key ...]
集合中，全部去重
SCARD key
集合中的元素个数
SDIFFSTORE des key [key ...]
只在第一个中有的，存到des中
SINTERSTORE des key [key ...]
共有的，存到des中
SUNIONSTORE des key [key ...]
全有的，存到des中
SRANDMEMBER key [count]
集合中，随机取，数量不变；count>0随机不重复，count<0随机重复
SPOP key [count]
集合中，随机用，越来越少；count>0随机不重复，count<0随机重复

ZSet：带排序的Set集合；比Set多出一个专用的score值，又可排出名次列；比列表类型更快更耗内存

ZADD key score member [score member ...]
新增成员及序列数，可覆盖
ZSCORE key member
获取单个元素的分数
ZRANGE key start stop [WITHSCORES]
指定范围中的值；从小到大；-1位置为无穷大；WITHSCORES 姓名分数同输出
ZREVRANGE key start stop [WITHSCORES]
指定范围中的值；从大到小；-1位置为无穷大；WITHSCORES 姓名分数同输出
ZRANGEBYSCORE key min max [WITHSCORES] [LIMIT offset count]
按从小到大的顺序输出；(LIMIT 2 3 往后2位再取三个)
ZINCRBY key increment member
元素追加的值，负数为减法
ZCARD key
集合中元素的总个数
ZCOUNT key min max
集合中范围内的元素个数
ZREM key member [member ...]
删除多个元素
ZREMRANGEBYRANK key start stop
按排名范围删除元素
ZREMRANGEBYSCORE key min max
按分数范围删除元素
ZRANK key member
获取元素的排名，最小名次为0
ZREVRANK key member
获取元素的排名，最大名次为0
ZINTERSTORE des numkeys key [key ...] [WEIGHTS weight] [AGGREGATE SUM|MIN|MAN]
共有的集合项值相加；最小值最大值

Hash：如在操作对象属性

HGET/HSET key field [value]
单个属性取/赋值
HMGET/HMSET key field [value]
同时多个属性取赋值
HGETALL key
取全部属性及值
HEXISTS key field
判断字段是否存在，存在1/其它0
HSETNX key field value
不存在的字符，才会被赋值；其它没有任何动作
HINCRBY key field value
类似声明并赋值；所有的类/属性/值都是新声明的
HDEL key field [field ...]
删除多个字段
HKEYS key
取类的纯属性名
HVALS key
取类的纯属性值
HLEN key
取类的属性个数

四、数据结构

为什么 Redis 要有自己的数据结构

查询要快：体现在单条Key用了连续性的内存空间
占用空间少，节约内存：体现在了集合的数据压缩

Redis 中有这么几种数据结构：sds (动态字符串)、hashtable (字典)、linkedlist (链表)、intset (整数集合)、ziplist (压缩列表)、listpack (紧凑列表)、quicklist (混合列表)、skiplist (跳表)；它们分别应用于Redis各数据类型中，使得Redis在资源利用和运行效率上有着明显的效果。

以下列出了数据类型与数据结构的应用关系图：

关于 Listpack；未来作为 Ziplist 的升级替代品，v7.0版本也会有 Ziplist 的存在，后续版本中逐渐被替代。

数据结构的自动切换

每种数据类型也会有多种数据结构，至于何种数据类型在什么情况下用何种数据结构，取决于存储的数据；
比如：List 每元素小于8KB时，自动使用 Ziplist，否则自动切换为 Quicklist；
比如：Set 每元素为数字，元素小于512个时，自动使用 Intset，否则自动切换为 Hashtable；
比如：Hash 元素小于512个，每元素长度小于64字节，自动使用 Ziplist；否则自动切换为 Hashtable。

影响数据结构转换的配置项

# 配置文件中 各数据类型中的数据结构
# 能承载的最大长度/个数/容量
# 超出最大限制后，变更为其它数据结构
hash-max-listpack-value 64
hash-max-listpack-entries 512
list-max-listpack-size -2(8KB)
set-max-intset-entries 512
set-max-listpack-value 64
set-max-listpack-entries 128
zset-max-listpack-value 64
zset-max-listpack-entries 128

以下主要以 sds / ziplist / listpack / skiplist 为例的阐述，基本涵盖了重要的数据结构，一些扩展性的数据结构有兴趣的同学再深入了解下。

4.1 动态字符串 - SDS

很多计算机语言都一样，Redis 也是基于C语言写的；对于String类型，当给一个变量拼接一个字符串时，都是以一个新对象在内存中重新开辟新的更长的连续空间来存储；重新开辟/释放旧空间这样的内存损耗。。。所以为什么开发人员会避免strname + "xxx"这样的拼接方式；字符串长度也是底层每次通过遍历得出的结果。。。Redis为了避免这样的损耗，于是就有了 Simple Dynamic Strings 这样的解决方案 SDS。

Redis String 会事先分配好比实际字符串更长的内存空间，并记录实际字符串的长度，也记录存储后剩余的空间长度。

取字符串长度时，直接返回记录的长度值
追加字符串时，直接使用空闲的剩余空间

预分配空间有多长？总有用完的时候：

当实际字符串长度<1M时，预分配实际字符串两倍的连续长度，相当于本次只会占用一半
当实际字符串长度>1M时，每次预分配多出1M的长度空间。便于下次直接存储
当字符串减少缩短时，多出的剩余空间保留，便于下次追加，或手动命令清除空闲空间

这种空间预分配策略和惰性删除策略就是SDS的性能优势。

4.2 压缩列表 - ziplist

一块连续性的内存空间存放了整个Value，也就是一个ziplist，如何做的呢？一个集合的示例：

ziplist结构图
bytes：记录 ziplist 的总长度
tail：记录最后一个 entry 的偏移量，便于快速定位
len：记录 entry 的总个数
entry：列表元素，数据存放的元素
end：单个 ziplist 的结束符
prevlen：记录上个 entry 的总长度；这里记录值所占用的空间长度，取决于上个 entry 的长度，所以1-5会自动切换
encoding：记录 data 的实际数据类型及长度；如：int时占空间小，可直接存到 encoding，就不用 data 了
data：实际数据；占用空间小的数据类型，可直接放到 encoding 中，所以这时候没有 data 的存在，省空间。

ziplist 的取值：
结构图中，有总长/个数/偏移量/结束符/上个元素长度；所以 ziplist 正序倒序是都可以算出每个 entry 具体位置并取出数据。

ziplist 的写入，插/改/删统一为覆盖方式：
1、为新元素找到被覆盖元素的位置，位置之前的元素 + 新元素 + 位置之后的元素 = 新的ziplist的完整结构
2、申请新ziplist所需长度的内存连续空间，并存入新空间
3、释放旧空间

看起来挺不错的，相比链表的非连续性存储所带来的性能提升明显。。那为什么还会有新的改进版本 listpack 的出现？

ziplist 的弊端

ziplist 的问题出在 prevlen；
也就是上面蓝色部分的描述，存了相邻 entry 的长度；如果 entry 长度过长，相邻的 prevlen 所占空间长度就会从1变为5；也就是说 entry 数据变更，会影响到相邻的 entry；最严重的情况是很多entry长度恰好都在一个临界值，会导致相邻prevlen长度的变化，连锁反应是之后位置上的entry级联性的连续重复多次变更；
上面提到，变更：就是重新申请新的内存连续空间，释放旧空间；那么级联性的连锁反应呢？一个写操作，引发的恶性灾难事件！！！

4.3 紧凑列表 - listpack

listpack 是 ziplist 的升级版于v7.0中，作为替代品都有什么变化，listpack结构如下图：
listpack 结构图
上图看出，listpack 与 ziplist 的区别在于：
1、header 取消 tail
2、entry 取消 prevlen
3、当前 entry 中增加 encoding + data 的总长度 element-total-len
4、element-total-len 中的首位会标识出左侧是否还有值，主要用于逆序读

element-total-len 编码
长度 1-5 bytes 是可变的，不固定长度如何读出整个 element-total-len？这其中0/1标识了左侧是否有数据；
element-total-len 示意图

listpack 的读，假设逆序读出每个元素的值，已知end固定长度，跳过 1 bytes 到 element-total-len 中读固定(7)位数，就会知道左侧是否有值，这样会把 element-total-len 整个读下来，也就知道了当前 entry 长度，那么也就知道了相邻 entry 的起始位置；继续这样按序把每个 entry 读出来就完成逆序读数据。

listpack 的写入，同样是基于 ziplist 的方式，新元素替换旧元素组成新的长度，存储到新申请的内存连续空间，释放旧空间；由于未影响到其它元素，申请一次新空间后完成写入操作。

这样以来，listpack 任何写入的操作，entry 都是在变更自己，不会牵连到其它 entry，这就是对 ziplist 改善的地方。

4.4 跳跃列表 - skiplist

跳表是在链表的基础上追加了更多指针的存储；链表的指针指向了相邻元素的地址，但跳表又追加了指向间隔元素的指针；这使得跳表在查询元素的效率上更快。

下表 Linkedlist 与 Skiplist 的查询区别：
skiplist 结构图
上图：两种查询的路径不同，影响到的元素数量也不同，链表搜了11次才找到指定的元素，而跳表仅搜了5次就找到了指定的元素。
比如：元素1 既存了指向下个元素2 的指针，也存了指向元素4 的指针；所以跳表多存的指针让其可以跳跃搜索，相对于链表减少了搜索次数，这就体现了相比链表搜索的高效率。

其它数据结构

除以上几种数据结构外，Redis也会有Intset、quicklist、Hashtable等，由于基本原理相识，这里简单描述：
Intset：与ziplist、listpack相似的连续性集合，主要区别在于Intset仅支持数字型；
quicklist：在 ziplist 基础上扩展的数据结构，其中每个成员是一个ziplist，插入元素时：插入到前个元素ziplist中的末尾、后ziplist的开头、或独立的ziplist。

五、持久化

5.1 RDB 模式

Redis Database：持久化以指定的时间间隔执行数据集的时间点的快照整库备份。

触发RDB配置：save 36000 1 600 10 30 100
以上从右往左，成对解释：
当30秒内写入了100次，触发持久化，如果未满足条件，继续下一对；
当600秒内写入了10次，触发持久化，如果未满足条件，继续下一对；
当36000秒内写入了1次，触发持久化。

持久化过程：内存 -> 临时文件 -> 磁盘。

影响RDB效率的配置项：
stop-writes-on-bgsave-error yes当持久化失败后强制停止写入
rdbcompression yes快照数据压缩，损耗CPU
rdbchecksum yes是否检测备份文件，损耗CPU≈10%

关闭RDB持久化模式：save ""

手动不阻塞

需要手动进行快照时推荐使用 BGSAVE 命令。BGSAVE 命令可以在后台异步地进行快照，快照的同时服务器还可以继续响应来自客户端的请求。执行 BGSAVE 命令后，Redis 会立即返回 OK，表示开始进行快照，如果想知道快照是否完成，可以通过 LASTSAVE 命令获取最后一次成功快照的时间，返回结果是一个 Unix 时间戳。

另外，SAVE 在手动快照时，会阻塞客户端的请求。不推荐。

模式优劣

优势：体积小，占用磁盘少。
劣势：当持久化发生异常时，最后一次的持久化有可能失效，不能确保整体数据的绝对完整性。

5.2 AOF 模式

Append Only File：追加记录服务器接收到的每个写入命令，增量保存；如果写入错误，Redis 也会具有自动修复受损的AOF文件；恢复时，重新按序执行指令，从而重建内存库。

配置开启AOF模式：appendonly yes

持久化频率策略配置：appendfysnc always|everysec|no

每次命令追加：每次写命令立刻记录，太频繁，太耗性能
每秒追加一次：每秒集中记录一次，依然有可观的性能表现
不主动执行同步，转由操作系统执行，每30秒一次，最不安全

所以，everysec 默认选项就够了，既兼顾了性能又保证了安全。

自动触发重写相关配置：
auto-aof-rewrite-min-size 64mb重写触发条件，文件超过指定大小
auto-aof-rewrite-percentage 100重写触发条件，文件超过已使用%

AOF文件64MB是不是显得太小了，可适当增加容量如3GB，以防止过多的触发压缩重写后影响性能；也不可过大，影响数据恢复效率。

文件压缩 Rewrite
主进程 redis-server 创建出一个子进程 bgrewriteaof 对 AOF文件的重新整理，先整理出一个临时文件，再覆盖原AOF文件。

Rewrite 的重写策略：

只针对写入命令的整理
相同数据只记录最后写入命令
过期数据不记录
多命令合并记录

多命令合并示例：如累加命令 Incrby 的累加总和合并成一次累加；如集合命令 rpush 的多次追加合并成一次追加多个。

AOF 启动时，自动使用其恢复数据。

模式优劣

优势：丢失率低，数据较完整。
劣势：AOF占用磁盘空间大；恢复时重新全部执行一遍命令，恢复速度慢了点；持久化失败时，最后一秒写入命令可能会丢失。

Redis 默认开启 RDB，可同时开启 RDB + AOF，恢复数据时以 AOF 为优先。

六、复制关系

在复制的概念中，数据库分为两类，一类是主数据库（master），另一类是从数据库（replica）。主数据库可以进行读写操作，当数据变动时会同步给从数据库。而从数据库一般是只读的，并接收主数据库同步过来的数据。一个主数据库可以有多个从数据库，而从数据库只能拥有一个主数据库。

我们这里启动两台 Redis 服务器，只要在从数据库中为其指定主数据库的命令：slaveof {主库IP} {主库端口}

主从关系截图：

复制 - 主从关系

以上表示从数据库同步于主数据，也可以再增加从数据库，还可以通过info replication命令查看主从关系详情。

或者为其中的从数据库下面再增加从数据库，是的，主从从三级关系，或者更多。

也可在从数据库中执行命令slaveof no one，使该库停止接受同步数据，升级为主数据库；也就是说脱离主从关系了。

七、分布式集群

7.1 虚拟插槽

Redis 分布式给出一个 16384 长度的集合，每个元素称为一个 Slot，将所有 Slots 分段平均映射到各个 Master 节点上；数据通过对 Key 的算法映射到各Slot，也就存到了对应的 Master 节点上，所以每个节点实例负责其中一部分的Slot读写。

通过控制节点与槽 Slot 的关系，决定每个 Master 节点所承载的数据量；这在集群节点维护的时候非常有用。

7.2 创建集群

集群必须了解的conf配置项：

# 每个节点必须的配置项
cluster-enabled yes
# 节点失去连接超时时间
cluster-node-timeout 15000
# 节点间传输效率 默认 no（yes:单次多量发送/no:单次少量多次发送）
tcp-nodelay no
# DOCKER/NAT support
# (地址端口可能被转发)静态配置公共地址
cluster-announce-ip <外部访问IP>
cluster-announce-port <外部访问端口>
cluster-announce-bus-port <节点互通外部端口>

按 Redis 要求的最低 Master 节点数量3实例，多主多从的模式，需要创建6个运行实例：(6371-6376,16371-16376)

# 实例示例1（6371,16371）
docker run -d --name clu-rds-1 \
    -p 6371:6371 -p 16371:16371 \        # 容器分别开放 对外连接端口 和 节点间通信端口
    redis \
    redis-server \                       # 启动 Redis 服务命令
    --bind 0.0.0.0 \                     # 不限连接的客户端来源
    --port 6371 \                        # 实例对外连接端口
    --protected-mode no \                # 非保护模式
    --cluster-enabled yes \              # 开启集群
    --cluster-announce-ip 13.13.1.16 \   # 对外的访问IP
    --cluster-announce-port 6371 \       # 集群对外的连接端口
    --cluster-announce-bus-port 16371    # 集群节点间通讯端口（通常为：10000+Port）

Docker 查看6个容器实例：

Docker 3主3从模式创建集群：

docker exec -it clu-rds-1 \
    # 连接到任意实例
    redis-cli -p 6371 \
    # 创建集群 并指定 1主几从
    --cluster create --cluster-replicas 1 \
    # 要包含的所有(6个)运行实例<ip:port>
    13.13.1.16:6371 13.13.1.16:6372 13.13.1.16:6373 \
    13.13.1.16:6374 13.13.1.16:6375 13.13.1.16:6376

连接到任意容器节点，查看集群成员：docker exec -it <container-name> redis-cli -p <container-port> cluster nodes

7.3 重新分配插槽

每个主库(master)插槽需要改为不同数量的插槽，应该是比较常见的，这里就计划把 xx.xx.x.16 的 1 个插槽转到 xx.xx.x.17 上。

命令：$ redis-cli --cluster reshard <ip:port>如下，确认完成就结束了。这仅限于主库到主库的转移。以下截图的重新分配插槽解释了各输入项。

还有，重新查看分配后的插槽，截图的检查很直观，命令：$ redis-cli --cluster check <ip:port>

Redis-集群-reshard-check

插槽有自己的分配方式，这里总共有三台主数据库(master)分担这16383插槽，如果我连的是A节点(数据库)，可实际键值存储在C节点(数据库)上，那么此时来看看集群如何重定向的？如果键值不在该节点(数据库)中时，集群就会返回一个MOVE重定向请求，告诉客户端这个键目前由哪个节点(数据库)负责，然后客户端将同样的请求向目标节点(数据库)重新发送一次以获得结果。如下图演示：

7.4 节点操作

# 集群信息
$ redis-cli -h <ip> -p <port> cluster info
# 查看现有节点成员
$ redis-cli -h <ip> -p <port> cluster nodes
# 新建集群
$ redis-cli --cluster create --cluster-replicas 1 <ip:port ...>
# 加入新成员，从节点
$ redis-cli --cluster add-node <new-node-ip:port> <cluster-member-ip:port> \
    --cluster-slave --cluster-master-id <to-master-id>
# 删除集群成员节点
$ redis-cli --cluster del-node <del-ip:port> <del-node-id>
# 检查节点
$ redis-cli --cluster check <member-ip:port>
# 重新分配节点与插槽映射
$ redis-cli --cluster reshard <member-ip:port>
# 查看某节点同步信息
$ redis-cli -h <ip> -p <port> info replication
# 停止某节点实例运行
$ redis-cli -h <ip> -p <port> shutdown

分布式带来的影响

事务支持有限；
跨节点的多Key操作有限；如：SET集合不能计算两KEY的交集等

7.5 分布式锁

7.5.1 为什么会需要锁？

🔲场景 A：

多用户对同一产品下单购买，库存有10个，同一时间进来100个用户各买一个；
购买前都会看下库存是否够买，才会生成订单，否则提醒无货；
当前10个用户还没有下单成功并未扣库存完成时，后90个用户看到有库存，也继续生成订单；
最后卖出100各产品，实际库存不够。。。

如何确保有库存，不超卖。
对库存加锁，每个用户按序进来扣库存，当前用户扣完库存后，释放自己加的锁，以视完成操作继续后续用户，下个用户再进来看库存是否能购买。

🔲场景 B：

当某个用户下单扣库存时，倘若发送了异常，导致未能释放自己加上去的锁，那么。。。没人负责释放此锁了，后续不能查扣库存，谁也不能下单了。

如何确保防止出现死锁？
对库存锁加过期时间，时间超出后，自动强制解锁。

是的，加锁、过期自动解锁，是确保以上场景能够顺利进行的必要条件，共享数据被多用户处理的时候，同一时间点，只能被一个用户访问处理，多用户有序访问处理，及时更新处理结果。

共享锁：数据统一放缓存中做业务处理，在缓存中加锁，供所有服务利用。

7.5.2 SET NX EX 命令

SET：String 类型的KV操作
NX：Key唯一，仅当没有Key时才能写入
EX：Key 的有效时长，到期后自动删除

所以完整的命令为：set {business-key} {value} nx ex {过期时长}
返回失败，表示上个用户正使用
返回成功，表示自己已开始使用

符合分布式锁的必要条件

1、当 get {business-key} 有值时，表示已有用户在占用，需要等待
2、当占用用户处理完成后，正常释放自己加的锁，del {business-key}
3、当占用用户处理发生异常退出时，等ex {过期时长}后，系统自动解锁，后续用户继续购买

命令演示案例：(ttl：剩余过期时间秒)

也可以在 Value 中保存用户的标识，解锁的时候只能解除自己的锁，防止某些场景下解锁错误。

分布式Id

由于 Redis Incrment (Incr/Incrby)，过期时长等，可以限制用户短时间内的下单量等场景，也可以生成唯一标识，用到各服务中。

7.5.3 Lua 脚本

持续更新。。。

八、高并发带来的问题

8.1 缓存穿透(Penetration)

现象：

DB没有查询结果或为NULL，导致查询结果没有进入到缓存；当大批量的这种请求时，就会每次“穿透”缓存“直抵”DB，引发DB的高并发查询导致宕机，这种现象就叫缓存穿透。

方案：

S1、黑名单策略（IP/用户名），防止恶意行为

S2、对结果为空的DB查询，给出默认值于缓存中

8.2 缓存击穿(Breakdown)

现象：

访问量大的热门 Key 过期后，缓存需要重建该Key，大量的访问到DB引发高并发查询，导致DB宕机，这种情况称为缓存击穿。

方案：

S1、若被视为热门Key，也就需要被定为永不过期

S2、为热度排名，时时调整热度数据，自动延长过期时间

以下的重点是缓存重建Key的过程：双重锁机制

双重锁逻辑阐述

也常应用于单例模式中
第一把锁处理首个请求动作是否已有缓存，并挡住了第二或大量的后续请求动作；
当首个请求动作处理完成后结果于缓存中，并释放锁，处于等待的大量的请求动作会陆续进来，这就不对了，等待的请求动作应该直接用首个请求处理的结果才对；
所以，后续的请求进来后应该再次锁验证缓存中是否已有数据，也就是第二次的锁是为了解决并发时被阻塞的请求动作，防止重复查询DB更新缓存。

8.3 缓存雪崩(Crash)

现象：

缓存中的大量 Key 同时过期，缓存运行正常，查询请求直接冲击数据库，导致DB查询压力短时间内上升至宕机现象。

方案：

S1、随机的过期时间，分散过期时间，避免统一生成过期时间

S2、仅允许核心业务访问DB，如支付/审批等，在缓存修复前，禁止非核心业务访问DB

九、杂项信息

ℹ️ 数据库密码

提到本机数据库密码功能，在v6.0以上版本中支持了多用户的权限控制功能。通过配置文件 Redis.conf 的参数 requirepass 来设置一个密码，如：requirepass 123456，那账号呢？不过要简单的说一下，原本只有密码，现在新版本其实是有账号的，default，是的，它只不过省略了而已，不输入也行，或者你改个其它账号也行。以后也许必输账号吧。如图：

Redis-requirepass

或许你觉得自己设定密码不够复杂，那就用随机密码，如：redis> ACL GENPASS，会给出一个不知道多少位的字符数字的密码。可参考。

但是如果在集群的配置采用密码时，主从关系之间，节点之间就需要认证了。那么在各自的 Redis.conf 中调整为：

主数据库调整 requirepass <password>
从数据库调整 masterauth <password>

主数据库告诉从数据库，主数据库的密码是 <password>。

ℹ️ 耗时命令日志

当一条命令执行时间超过限制时，Redis 会将该命令的执行时间等信息加入耗时命令日志以供查看。可通过配置文件 Redis.conf 的 slowlog-log-slower-than 参数设置这一限制，要注意单位是微秒，默认为10000。通过 SLOWLOG GET 命令来获得当前的耗时命令日志(当然，我是在集群模式下)，如下图：

集群中每条日志都由以下几部分组成：
（1）该日志唯一ID；
（2）该命令执行的 Unix 时间；
（3）该命令的耗时时间，单位是微秒；
（4）命令及其参数；
（5）所在节点的信息。

也可以通过配置文件 Redis.conf 中的 slowlog-max-len 参数来限制记录的条数。

posted @ 2023-04-18 13:36 Sol·wang 阅读(1828) 评论(4) 收藏举报

刷新页面返回顶部

、Sol⋅wang ~ 📑阅读者

... 其修远兮，吾将上下而求 ...