yuan-er

导航

 

ALM-5101177 Ops巡检-用户DML语句数异常

告警解释

此告警对应指标“Data Manipulation Language/s”超出配置阈值,产生告警。此指标反映用户每秒执行的DML数量,即QPS。

告警属性

告警ID

告警级别

告警类型

告警归属

业务类型

是否可自动清除

5101177

巡检配置

业务质量告警

租户面

云数据库 GaussDB 节点

告警参数

类别

参数名称

参数含义

定位信息

云服务

产生告警的云服务

实例ID

产生告警的实例ID

节点ID

产生告警的节点ID

巡检名称

产生告警的巡检名称

指标编码

产生告警的指标编码

附加信息

租户名称

产生告警的租户名称

实例名称

产生告警的实例名称

租户ID

产生告警的租户ID

云服务

产生告警的云服务

服务

产生告警的服务

微服务

产生告警的微服务

告警源IP

告警源IP

节点角色

产生告警节点的节点角色

指标编码

产生告警节点的指标编码

指标采集值

产生告警节点的指标采集值

指标阈值

产生告警节点的指标阈值

对系统的影响

  • 此指标如果下降,如果非业务正常变更,反映业务性能下降。
  • 此指标如果持续上升,会增加业务对数据库的压力,超过数据库处理能力上限时,可能会导致系统崩溃。

可能原因

  • 业务模型发生变化,请求量正常变化。
  • 如果持续上涨,为业务行为,联系客户确认。
  • 如果下降,如果非业务正常变更,则可能是数据库或者底层出现故障。

处理步骤

  1. 收到告警后,参考查看监控指标,查看指标“Data Manipulation Language/s”,确认指标情况以及触发告警的节点。
  2. 判断指标情况。

     

    • 指标上涨,业务行为导致,查看请求量是否上涨到的最大值,同时查看其他的所有巡检指标,确认是否有指标同步上涨并可能超出阈值。

      如果其他巡检指标同时上涨,联系业务进行限流。

      请求量最大值的确认:数据库没有办法知道业务的最大值,客户自己可以根据历史的峰值确认。

    • 指标下降,执行3

     

  3. 参考查看监控指标查看“80% SQL的响应时间”和“95% SQL的响应时间”的指标情况。

     

     

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

不涉及。

 
posted on 2024-10-22 10:27  数据库笔记  阅读(4)  评论(0)    收藏  举报