节点替换
操作场景
数据库实例由多台主机组成,当实例中主机发生故障时,为了使数据库快速地恢复正常,可以使用该功能将发生故障的节点替换为正常节点。当前替换节点只针对故障节点开放,且替换操作与自身互斥。
约束限制
- 节点不是异常状态且该节点的组件也不是异常状态,无法执行节点替换。
- 单节点实例不支持节点替换。
- 替换时所选新主机的CPU、内存不能小于旧节点所用主机的规格,磁盘容量不能小于旧节点实际使用的磁盘大小。
- 若替换时所选新主机原先的安装模式与当前实例不同,请先手动清理新扩节点。具体操作可参考转换安装模式前手动清理节点方法。
- 待替换节点需要和实例原有节点操作系统版本保持一致。
- 新替换节点的操作系统版本、架构类型、CPU厂商、主机类型、网络平面、网络协议类型必须与原实例的主机保持一致。
注意事项
- 替换节点与原节点需要在同一可用区下。
- 替换操作需要在一个正常主机上执行。
- 替换节点如果之前安装过实例,请先执行重置主机后再执行节点替换。
- 替换节点与原节点的磁盘规划、挂载路径需保持一致。
- 替换节点与原节点的文件系统保持一致。
- 实例异常或磁盘满状态下不允许进行节点替换。
- 替换的主机上不能含有主DN。
- 实例内下列组件中分别至少存在一个正常运行的:CM Server、CM Agent、CN(仅分布式混合部署)。
- 正常的ETCD个数必须大于ETCD总个数的一半。
- 如果实例中部署有GTM,需保证至少存在一个正常运行的GTM实例(仅分布式实例混合部署)。
- 修复CN过程中,在CN状态未变为Normal前,不能连接该CN执行业务(仅分布式实例混合部署)。
- 节点替换完成后,如果告警平台仍然有原节点的告警,请参考节点替换后残留告警清理方法进行处理。
- ETCD异常时,替换需要等待一段时间才可执行。
- 未清理的机器需要下线并人工清理机器,具体清理步骤参考如何后台手动删除实例章节。
- 如果实例处于容灾关系中,需要保证待替换节点与对端实例互通,否则会影响容灾任务进行。
- 如果实例中节点异常数量在2个及2个以上,或需要对单个节点进行同IP替换,请参见《云数据库GaussDB管理平台(TPOPS) 应急预案 (for GaussDB轻量化部署形态)》中
- 节点替换失败,需要手动回滚。如何手动回滚,请参见《GaussDB轻量化部署形态 维护指南》中
- 节点替换时,若实例带有浮动IP,则替换节点的业务IP需与被替换节点业务IP在同一网面下,保证节点替换后浮动IP可用。
操作步骤
- 登录云数据库GaussDB管理平台(TPOPS)。
- 单击左侧目录“实例管理”,进入“实例列表”页面。
- 单击具体实例名称,进入“基本信息”界面。
- 在“实例拓扑 > 节点列表”中,当节点为“异常”时,单击“操作 > 节点修复”。
- 在节点修复对话框中,修复方式选择“节点替换”,根据情况勾选“是否自动清理旧节点数据”。
- 输入“YES”并单击“确定”。
![点击放大]()
- 当节点替换下发成功时,提示替换命令下发成功信息。
“运行状态”从“节点替换中”到“正常”,且节点列表处显示新替换的节点信息,表示替换成功。

浙公网安备 33010602011771号