yuan-er

导航

 

ALM-5101260 Ops巡检-进程内存使用率异常

告警解释

此告警对应指标“进程内存使用率”超出配置阈值,此指标反映gaussdb进程已使用的内存占CN或DN节点可用的最大物理内存的,即max_process_memory配置的值的百分比。

告警属性

告警ID

告警级别

告警类型

告警归属

业务类型

是否可自动清除

5101260

巡检配置

物理资源告警

租户面

云数据库 GaussDB 节点

告警参数

类别

参数名称

参数含义

定位信息

云服务

产生告警的云服务

实例ID

产生告警的实例ID

节点ID

产生告警的节点ID

巡检名称

产生告警的巡检名称

指标编码

产生告警的指标编码

附加信息

租户名称

产生告警的租户名称

实例名称

产生告警的实例名称

租户ID

产生告警的租户ID

云服务

产生告警的云服务

服务

产生告警的服务

微服务

产生告警的微服务

告警源IP

告警源IP

节点角色

产生告警节点的节点角色

指标编码

产生告警节点的指标编码

指标采集值

产生告警节点的指标采集值

指标阈值

产生告警节点的指标阈值

对系统的影响

此指标持续上涨,达到100%的值,语句执行会因无内存报错。

可能原因

  • 业务量增加,内存正常使用。
  • 内存泄漏。

处理步骤

  1. 收到告警后,首先通过查看监控指标查看指标“进程内存使用率”,确认指标情况以及触发告警的组件。
  2. 确认此指标是否已达100%。

     

    • 如果已达或超过90%仍持续上涨。
      1. 登录系统库
      2. 执行如下语句,查看内存使用情况。
        • 分布式
          select * from pv_total_memory_detail;
           
           
          
          

        • 主备式
          select * from gs_total_memory_detail;
           
           
          
          
      3. 通过重启进程或参考《云数据库 GaussDB 24.1.30 使用指南 (for 华为云Stack 8.3.1)》中的“用户指南 > 操作指南 > 变更实例 > DN主备倒换”章节进行主备倒换,执行重启或主备倒换需保证分片内备DN的指标“备机RTO时间”指标小于60s。
    • 指标小于100%,执行3

     

  3. 通过查看监控指标查看“动态内存使用率”、“已使用的其他内存”、“已使用的共享内存”三个指标是否同步上涨。

     

    • 如果同步上涨,参考对应指标的异常处理方法。
    • 如果此三个指标都没有上涨,联系技术支持查看处理。

     

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

不涉及。

posted on 2024-10-22 10:47  数据库笔记  阅读(9)  评论(0)    收藏  举报