yuan-er

导航

 

GaussDB-DBMind实例版本降级

操作场景

降级DBMind实例的版本,包含DBMind Server进程版本以及相关exporter组件的版本。

前提条件

  • 确保管理面服务已升级至24.1.30及以上版本。
  • 确保DBMind实例的管控Agent已升级至24.1.30及以上版本。
  • 进行降级操作时,请确保DBMind实例运行状态为正常。

约束限制

  • 只有V2.0-8.102.0及以上版本的DBMind实例,才支持版本降级,其他低版本不支持。
  • 对于V2.0-8.100.0及以上版本的GaussDB数据库实例,需要V2.0-8.102.0及以上版本的DBMind实例才能对其进行纳管,否则不允许纳管,会造成智能运维相关功能异常。
  • 如果V2.0-8.102.x及以上版本DBMind实例已纳管了V2.0-8.100.x及以上版本GaussDB数据库实例,不建议将DBMind实例降级到V2.0-8.1.x版本,可能会导致V2.0-8.100.x及以上版本的GaussDB数据库实例出现智能运维相关功能不可用的问题。如需要进行降级,需解除已纳管的8.100.x及以上版本GaussDB数据库实例。
  • V2.0-8.102.0及以上版本的DBMind实例,支持纳管V2.0-8.102.0及以下版本的GaussDB数据库实例。
  • 对于操作系统为HCE的DBMind实例,不支持从高版本降级到V2.0-8.1.x及以下版本,即目标版本不能选择V2.0-8.1.x及以下版本。

注意事项

  • 建议在DBMind实例进行版本降级操作时,不执行实例重启、删除等重大变更操作。
  • 如果DBMind实例版本降级失败,请联系运维人员在DBS运维管理平台查看失败原因进行修复。选择实例运维 > 任务管理”,可查看对应工作流详情,定位到具体任务报错位置。
  • DBMind实例版本降级失败后,不支持重新下发降级操作,可通过修复失败任务并进行重试,以此继续进行降级操作。
  • DBMind实例版本降级过程中,会尝试自动进行回滚处理(回退到降级前的版本),如果发生回滚失败的情况,需要解决失败任务故障后并重试版本降级任务,才能继续降级到目标版本。如需回退到降级前版本,需要先完成版本降级操作,再进行版本升级操作。

操作步骤

  1. 登录管理控制台
  2. 单击管理控制台左上角的,选择区域和项目。
  3. 在页面左上角单击,选择数据库 > 云数据库 GaussDB”,进入云数据库 GaussDB信息页面。
  4. 在左侧导航栏中单击“DBMind管理”,显示“DBMind管理”页面。
  5. “DBMind管理”页面,查看待升级的正常DBMind实例。
  6. 选择“操作”列中的“更多”,单击“版本降级”。
  7. 弹框中勾选对应“目标版本”,输入“YES”进行确认,单击“确定”,完成降级任务的申请。

     

    图1 DBMind实例版本降级

     

     

  8. 返回“DBMind管理”页面,可根据实例运行状态,查看降级进展,直至状态变成正常,即为降级成功。

问题定位

DBMind实例版本降级过程支持失败回滚机制,一般情况下,降级失败会自动回滚到降级前版本。

当发生降级失败时,实例状态会展示为“版本降级失败”,并会触发告警产生,提醒用户出现降级故障。联系运维人员登录DBS运维管理平台,参考

《云数据库 GaussDB 维护指南(for 华为云Stack 8.5.0)》中的“故障管理 > 告警处理”处理。

对于降级失败的情况,针对降级工作流任务,一般有如下几类主要场景:

  1. 降级任务失败在“PrepareUpgradeServerPkgTask”任务中,表示获取目标版本软件包存在问题,可根据回显的具体原因,进行问题排查。

    常见的可能报错信息包含“target pkg xxx not in obs”,说明目标版本的软件包没有上传到OBS桶中,则可联系运维人员将对应软件包手动上传至OBS桶中。

  2. 降级任务失败在“UpgradeServerTask”任务中,表示下发降级操作到实例Agent侧失败,可根据回显的具体原因,进行问题排查。

    常见的可能报错原因可能为网络故障,导致降级请求无法正常下发,此时可联系运维人员排查并修复网络故障后,然后重试失败任务。

  3. 降级任务失败在“WaitServerUpgradeResultTask”任务中,表示实例Agent侧处理降级流程异常,可根据回显的具体原因并结合实例节点后台Agent侧日志,进行问题排查。

    常见的可能报错原因可能为DBMind节点突发未知故障(如磁盘故障或机器宕机),导致降级操作异常终止,造成回滚失败,此时可联系运维人员排查并修复实例故障,然后重试失败任务。

 
posted on 2025-03-25 09:26  数据库笔记  阅读(1)  评论(0)    收藏  举报