GaussDB-ALM-5023516 云数据库 GaussDB启动增备失败
告警解释
GaussDB启动增备失败,产生告警。
告警属性
|
5023516 |
重要 |
操作告警 |
租户面 |
云数据库 GaussDB |
是 |
告警参数
|
定位信息 |
云服务 |
产生告警的云服务 |
|
系统 |
产生告警的系统 |
|
|
模块 |
产生告警的模块 |
|
|
实例 |
产生告警的实例ID |
|
|
附加信息 |
租户名称 |
产生告警的租户名称 |
|
实例名称 |
产生告警的实例名称 |
|
|
云服务 |
产生告警的云服务 |
|
|
服务 |
产生告警的服务 |
|
|
微服务 |
产生告警的微服务 |
|
|
告警源IP |
告警源IP |
对系统的影响
实例启动增备备份失败,未产生增备的时间点无法恢复。
可能原因
- Agent处理异常。
- 内核处理异常。
处理步骤
- 参考下载管理节点日志,收集相关失败日志。
- 如果管理节点日志中存在“archive on failed”关键字,则错误原因是内核处理异常或者agent处理异常。先尝试通过重新触发关键全备来再次开启(3~7),如果仍然失败在RdsBackupStartAgentLogBackupJob,则需要联系开发人员进行实例节点修复。
- 在DBS运维管理平台,选择“实例运维 > 实例管理”,在“实例列表”页签的搜索框中通过实例ID搜索实例信息。
- 单击实例名称,进入实例详情页。
- 在实例详情页下方“备份设置”处,单击“创建备份”,在弹出框选择是否是关键备份的选项中,选择“True”,单击“确定”,就下发了关键备份操作。
- 观察实例的状态,是否为“备份中”,等待备份完成。
- 如果备份流程出现失败,停留在RdsBackupStartAgentLogBackupJob处理异常,需要参考登录实例节点登录实例所在虚拟机,并且参考下载管理节点日志和收集日志,并收集告警信息,联系技术支持进行处理。需要下载的日志信息有:
- DBS-GaussDB-backupmanager组件下的日志。
- DBS-GaussDB-instancemanager组件下的日志。
- /home/Ruby/log/agent.log
- /home/Ruby/log/asyncJobResult.dat
- Agent组件下的:
- 管理侧:
告警清除
此告警修复后,系统会自动清除此告警,无需手工清除。
参考信息
不涉及。
更多详情请参考GaussDB 文档中心:https://doc.hcs.huawei.com/db/zh-cn/gaussdbqlh/24.1.30/productdesc/qlh_03_0001.html
浙公网安备 33010602011771号