yuan-er

导航

 

ALM-5027018 DBMind prometheus进程异常

告警解释

DBMind prometheus进程异常,且无法修复,产生此告警。

告警属性

5027018

重要

业务质量告警

租户面

云数据库 GaussDB

告警参数

定位信息

系统

上报该报警的系统

实例ID

告警所属的实例ID

节点ID

告警所属的节点ID

服务器ID

告警所属的虚拟机ID

附加信息

租户名称

实例所属租户名称

实例名称

实例名称

云服务

产生告警的云服务

服务

产生告警的服务

微服务

产生告警的微服务

告警源IP

告警源IP

对系统的影响

DBMind无法正常工作,导致被纳管实例无法使用DBMind相关特性。

可能原因

prometheus进程异常。

处理步骤

  1. 参考登录实例节点,登录到异常实例节点上。
  2. 根据查看Agent日志,在日志中搜索prometheus。
    • 如果日志中prometheus的状态为NORMAL,忽略此告警并手动清除告警即可。
    • 否则,执行3
  3. 执行以下命令查看prometheus进程是否存在。ps -ef | grep prometheus
    • 进程存在,通过执行kill -9 {pid}命令强制关闭prometheus进程,pid可通过以下命令的执行结果获取,并等待5分钟,查看告警是否自动清除。ps -ef | grep prometheus | grep java | awk '{print $2}'
      • 告警自动清除,告警已修复,结束步骤。
      • 告警未自动清除,执行4
    • 进程不存在,等待五分钟,如果告警未消除,执行4
  4. 请收集告警信息和配置信息,并下载管理节点日志收集日志联系技术支持进行处理。日志包括:/home/Ruby/log/watchdog.log
  5. /home/Ruby/log/agent.log

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

不涉及。

更多详情请参考GaussDB 文档中心:https://doc.hcs.huawei.com/db/zh-cn/gaussdbqlh/24.1.30/productdesc/qlh_03_0001.html

posted on 2024-09-29 14:30  数据库笔记  阅读(1)  评论(0)    收藏  举报