yuan-er

导航

 

ALM-5101352 Ops巡检-GTM进程内存占用异常

告警解释

此告警对应指标“gtm进程内存占用”超出配置阈值,此指标反映gtm进程占用内存的大小。

告警属性

告警ID

告警级别

告警类型

告警归属

业务类型

是否可自动清除

5101352

巡检配置

物理资源告警

租户面

云数据库 GaussDB 节点

告警参数

类别

参数名称

参数含义

定位信息

云服务

产生告警的云服务

实例ID

产生告警的实例ID

节点ID

产生告警的节点ID

巡检名称

产生告警的巡检名称

指标编码

产生告警的指标编码

附加信息

租户名称

产生告警的租户名称

实例名称

产生告警的实例名称

租户ID

产生告警的租户ID

云服务

产生告警的云服务

服务

产生告警的服务

微服务

产生告警的微服务

告警源IP

告警源IP

节点角色

产生告警节点的节点角色

指标编码

产生告警节点的指标编码

指标采集值

产生告警节点的指标采集值

指标阈值

产生告警节点的指标阈值

对系统的影响

  • 一般情况下,如果无变更,gtm进程占用内存都是平稳恒定的。不同的数据库内核版本之间,gtm进程占用的内存会有差别,如果内核升级之后出现此指标上涨之后很快平稳,属于正常现象。
  • 如果出现内存持续上涨不趋于平稳,可能会影响gtm进程的运行,严重时会导致节点上内存资源耗尽,其他组件无法申请到内存。

可能原因

内存泄漏。

处理步骤

  1. 收到告警后,参考查看监控指标查看指标“gtm进程内存占用”,确认指标情况以及触发告警的组件。
  2. 持续观察指标,确认是否趋于平稳,并同步排查是否有数据库内核的升级操作。

     

    • 如果指标很快趋于平稳,且数据库内核有升级操作,为正常现象,对系统无影响,建议联系技术支持确认上涨后的内存值是否合理。
    • 如果数据库内核没有升级且指标持续上涨,执行3

     

  3. 登录实例节点,执行如下命令确认gtm的内存占用情况。

     

    1. 获取gtm进程的PID。

      ps ux | grep gtm | grep -v grep | awk '{print $2}'

    2. 确认RSS列的值和指标展示的是否一致,并联系技术支持处理。

      ps -p 113744 v

     

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

不涉及。

posted on 2024-10-24 08:46  数据库笔记  阅读(8)  评论(0)    收藏  举报