yuan-er

导航

 

节点替换

操作场景

数据库实例由多台主机组成,当实例中主机发生故障时,为了使数据库快速地恢复正常,可以使用该功能将发生故障的节点替换为正常节点。当前替换节点只针对故障节点开放,且替换操作与自身互斥。

约束限制

  • 节点不是异常状态且该节点的组件也不是异常状态,无法执行节点替换。
  • 单节点实例不支持节点替换。
  • 替换时所选新主机的CPU、内存不能小于旧节点所用主机的规格,磁盘容量不能小于旧节点实际使用的磁盘大小。
  • 若替换时所选新主机原先的安装模式与当前实例不同,请先手动清理新扩节点。具体操作可参考转换安装模式前手动清理节点方法
  • 待替换节点需要和实例原有节点操作系统版本保持一致。
  • 新替换节点的操作系统版本、架构类型、CPU厂商、主机类型、网络平面、网络协议类型必须与原实例的主机保持一致。

注意事项

  • 替换节点与原节点需要在同一可用区下。
  • 替换操作需要在一个正常主机上执行。
  • 替换节点如果之前安装过实例,请先执行重置主机后再执行节点替换。
  • 替换节点与原节点的磁盘规划、挂载路径需保持一致。
  • 替换节点与原节点的文件系统保持一致。
  • 实例异常或磁盘满状态下不允许进行节点替换。
  • 替换的主机上不能含有主DN。
  • 实例内下列组件中分别至少存在一个正常运行的:CM Server、CM Agent、CN(仅分布式混合部署)。
  • 正常的ETCD个数必须大于ETCD总个数的一半。
  • 如果实例中部署有GTM,需保证至少存在一个正常运行的GTM实例(仅分布式实例混合部署)。
  • 修复CN过程中,在CN状态未变为Normal前,不能连接该CN执行业务(仅分布式实例混合部署)。
  • 节点替换完成后,如果告警平台仍然有原节点的告警,请参考节点替换后残留告警清理方法进行处理。
  • ETCD异常时,替换需要等待一段时间才可执行。
  • 未清理的机器需要下线并人工清理机器,具体清理步骤参考如何后台手动删除实例章节。
  • 如果实例处于容灾关系中,需要保证待替换节点与对端实例互通,否则会影响容灾任务进行。
  • 如果实例中节点异常数量在2个及2个以上,或需要对单个节点进行同IP替换,请参见《云数据库GaussDB管理平台(TPOPS) 应急预案 (for GaussDB轻量化部署形态)》中运维案例库 > 集群故障类 > 节点替换”章节内容。
  • 节点替换失败,需要手动回滚。如何手动回滚,请参见《GaussDB轻量化部署形态 维护指南》中云数据库GaussDB管理平台(TPOPS) 故障管理 (for GaussDB轻量化部署形态) > 故障处理 > 业务故障 > 实例管理 > 节点替换失败需要回滚”章节内容。
  • 节点替换时,若实例带有浮动IP,则替换节点的业务IP需与被替换节点业务IP在同一网面下,保证节点替换后浮动IP可用。

操作步骤

  1. 登录云数据库GaussDB管理平台(TPOPS)
  2. 单击左侧目录“实例管理”,进入“实例列表”页面。
  3. 单击具体实例名称,进入“基本信息”界面。
  4. 在“实例拓扑 > 节点列表”中,当节点为“异常”时,单击“操作 > 节点修复”。
  5. 在节点修复对话框中,修复方式选择“节点替换”,根据情况勾选“是否自动清理旧节点数据”。
  6. 输入“YES”并单击“确定”。

     

     

  7. 当节点替换下发成功时,提示替换命令下发成功信息。

     

    “运行状态”从“节点替换中”到“正常”,且节点列表处显示新替换的节点信息,表示替换成功。

     

 
posted on 2025-06-27 15:20  数据库笔记  阅读(14)  评论(0)    收藏  举报