yuan-er

导航

 

ALM-5101351 Ops巡检-CMA进程启动时间异常

告警解释

此告警对应指标“CMA进程启动时间”,此指标反映cm_agent进程启动的时间超出阈值,如果此指标的值发生更新,说明cm_agent进程重启。

告警属性

5101351

巡检配置

业务质量告警

租户面

云数据库 GaussDB 节点

告警参数

定位信息

云服务

产生告警的云服务

实例ID

产生告警的实例ID

节点ID

产生告警的节点ID

巡检名称

产生告警的巡检名称

指标编码

产生告警的指标编码

附加信息

租户名称

产生告警的租户名称

实例名称

产生告警的实例名称

租户ID

产生告警的租户ID

云服务

产生告警的云服务

服务

产生告警的服务

微服务

产生告警的微服务

告警源IP

告警源IP

节点角色

产生告警节点的节点角色

指标编码

产生告警节点的指标编码

指标采集值

产生告警节点的指标采集值

指标阈值

产生告警节点的指标阈值

对系统的影响

重启会导致业务闪断。

可能原因

  • 存在变更操作
  • 存在重启进程操作。
  • 虚拟机、物理机重启。
  • CMA故障。

处理步骤

  1. 收到告警后,首先查看监控指标查看指标“CMA进程启动时间”,确认指标情况以及触发告警的组件。
  2. 确认是否有内核升级或重启进程的操作。
    • 如果有属于正常重启,重启时间在变更期间,符合预期。
    • 如果无,执行3
  3. 确认虚拟机和物理机是否发生过重启,可以通过登录告警组件所在节点,执行如下命令,查看所有进程的启动时间。ps -T
    • 如果节点上所有进程启动时间相同,可能是虚拟机或者物理机发生过重启,执行5
    • 如果不相同,执行4
  4. 确认重启时间周围,是否有其他的事件告警或者故障告警存在。
    • 如果有,按照对应告警的处理方式处理,处理完再关注告警是否自动消除,长时间未消除,执行5
    • 如果无,执行5
  5. 联系技术支持

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

不涉及。

更多详情请参考GaussDB 文档中心:https://doc.hcs.huawei.com/db/zh-cn/gaussdbqlh/24.1.30/productdesc/qlh_03_0001.html

posted on 2024-10-24 08:45  数据库笔记  阅读(4)  评论(0)    收藏  举报