ALM-5101351 Ops巡检-CMA进程启动时间异常
告警解释
此告警对应指标“CMA进程启动时间”,此指标反映cm_agent进程启动的时间超出阈值,如果此指标的值发生更新,说明cm_agent进程重启。
告警属性
|
5101351 |
巡检配置 |
业务质量告警 |
租户面 |
云数据库 GaussDB 节点 |
是 |
告警参数
|
定位信息 |
云服务 |
产生告警的云服务 |
|
实例ID |
产生告警的实例ID |
|
|
节点ID |
产生告警的节点ID |
|
|
巡检名称 |
产生告警的巡检名称 |
|
|
指标编码 |
产生告警的指标编码 |
|
|
附加信息 |
租户名称 |
产生告警的租户名称 |
|
实例名称 |
产生告警的实例名称 |
|
|
租户ID |
产生告警的租户ID |
|
|
云服务 |
产生告警的云服务 |
|
|
服务 |
产生告警的服务 |
|
|
微服务 |
产生告警的微服务 |
|
|
告警源IP |
告警源IP |
|
|
节点角色 |
产生告警节点的节点角色 |
|
|
指标编码 |
产生告警节点的指标编码 |
|
|
指标采集值 |
产生告警节点的指标采集值 |
|
|
指标阈值 |
产生告警节点的指标阈值 |
对系统的影响
重启会导致业务闪断。
可能原因
- 存在变更操作
- 存在重启进程操作。
- 虚拟机、物理机重启。
- CMA故障。
处理步骤
- 收到告警后,首先查看监控指标查看指标“CMA进程启动时间”,确认指标情况以及触发告警的组件。
- 确认是否有内核升级或重启进程的操作。
- 如果有属于正常重启,重启时间在变更期间,符合预期。
- 如果无,执行3。
- 确认虚拟机和物理机是否发生过重启,可以通过登录告警组件所在节点,执行如下命令,查看所有进程的启动时间。ps -T
- 如果节点上所有进程启动时间相同,可能是虚拟机或者物理机发生过重启,执行5。
- 如果不相同,执行4。
- 确认重启时间周围,是否有其他的事件告警或者故障告警存在。
- 联系技术支持。
告警清除
此告警修复后,系统会自动清除此告警,无需手工清除。
参考信息
不涉及。
更多详情请参考GaussDB 文档中心:https://doc.hcs.huawei.com/db/zh-cn/gaussdbqlh/24.1.30/productdesc/qlh_03_0001.html
浙公网安备 33010602011771号