rabbitmq 集群相关操作
rabbitmq 集群相关操作
1. 集群启停
-
正常启动
- 如果关闭了集群中的所有节点,启动时需要首先启动最后一个关闭的节点。
如果第一个启动的不是最后关闭的节点,那这个节点会等待最后关闭的节点启动。默认尝试连接10次,响应超时30s。如果对方在这段时间可用,节点会成功启动,并同步所需信息,否则启动失败。
- 如果关闭了集群中的所有节点,启动时需要首先启动最后一个关闭的节点。
-
异常情况的启动
最后关闭的节点因某些原因无法启动 通过rabbitmqctl forget_cluster_node rabbit@node1 -offline 剔除rabbit@node1(故障节点) 此命令在 rabbit@node2上执行,因为此时rabbit@node1未启动,需要加上-offline执行命令 rabbit@node1 需要剔除的故障节点集群由于非正常因素,比如断电而全部关闭,集群中的节点会认为还有其他节点在它后面关闭 通过rabbitmqctl force_boot 启动一个节点
2. 移除单节点
-
节点未能正常运行
rabbitmqctl forget_cluster_node rabbit@node1 -offline 此命令在 rabbit@node2上执行,因为此时rabbit@node1未启动,需要加上-offline执行命令 rabbit@node1 需要剔除的故障节点 -
节点正常运行
在节点执行: [root@node1 ~]# rabbitmqctl stop_app Stopping rabbit application on node rabbit@node1 ... [root@node1 ~]# rabbitmqctl reset Resetting node rabbit@node1 ... [root@node1 ~]# rabbitmqctl start_app Starting node rabbit@node1 ... completed with 0 plugins. [root@node1 ~]# rabbitmqctl cluster_status Cluster status of node rabbit@node1 ... [{nodes,[{disc,[rabbit@node1]}]}, {running_nodes,[rabbit@node1]}, {cluster_name,<<"rabbit@node1">>}, {partitions,[]}, {alarms,[{rabbit@node1,[]}]}]
3. 单节点故障恢复
单节点故障包括:机器硬件(硬盘、内存、网卡)故障、机器掉电、网络异常、服务进程异常
1. rabbitmqctl forget_cluster_node rabbit@node1
2. rabbitmqctl reset
3. 重新加入集群
如果有客户端连接故障节点,客户端会有异常报出,此时需要将故障节点的IP从连接列表里删除,并让客户端重新与集群中的节点建立连接

浙公网安备 33010602011771号