yuan-er

导航

 

ALM-5027044 DBMind Monitor进程异常

告警解释

DBMind Monitor进程异常,且无法修复,产生此告警。

告警属性

5027044

重要

业务质量告警

租户面

云数据库 GaussDB 节点

告警参数

定位信息

系统

上报该报警的系统

实例ID

告警所属的实例ID

节点ID

告警所属的节点ID

服务器ID

告警所属的虚拟机ID

附加信息

租户名称

实例所属租户名称

实例名称

实例名称

云服务

告警云服务

服务

告警服务

微服务

告警微服务

告警源IP

告警源IP

对系统的影响

可能导致全量SQL无解析能力时无法正常恢复。

可能原因

DBMind Monitor进程异常。

处理步骤

  1. 根据登录实例节点 ,登录到异常实例节点上。
  2. 根据查看Agent日志,在日志中搜索关键字“dbmind_monitor”,查看其上报的工作状态。
    • 如果状态为NORMAL,忽略此告警并消除告警即可。
    • 如果状态不是NORMAL,执行3
  3. 执行以下命令查看DBMind Monitor进程是否存在。ps -ef | grep gaussdbv5_dbmind_monitor
    • 存在,通过kill -9 [pid]命令强行杀掉DBMind Monitor进程,其中pid可通过如下命令的执行结果获得,并等待5分钟,如果告警未消除,执行4ps -ef | grep python | grep gaussdbv5_dbmind_monitor | awk '{print $2}'
    • 不存在,等待五分钟,告警未消除,执行4
  4. 请收集告警信息和配置信息,并下载管理节点日志收集日志联系技术支持。日志包括:
    • /home/Ruby/log/agent.log
    • /home/Ruby/log/watchdog.log

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

不涉及。

更多详情请参考GaussDB 文档中心:https://doc.hcs.huawei.com/db/zh-cn/gaussdbqlh/24.1.30/productdesc/qlh_03_0001.html

posted on 2024-09-29 15:06  数据库笔记  阅读(0)  评论(0)    收藏  举报