ALM-5101177 Ops巡检-用户DML语句数异常
告警解释
此告警对应指标“Data Manipulation Language/s”超出配置阈值,产生告警。此指标反映用户每秒执行的DML数量,即QPS。
告警属性
|
告警ID |
告警级别 |
告警类型 |
告警归属 |
业务类型 |
是否可自动清除 |
|---|---|---|---|---|---|
|
5101177 |
巡检配置 |
业务质量告警 |
租户面 |
云数据库 GaussDB 节点 |
是 |
告警参数
|
类别 |
参数名称 |
参数含义 |
|---|---|---|
|
定位信息 |
云服务 |
产生告警的云服务 |
|
实例ID |
产生告警的实例ID |
|
|
节点ID |
产生告警的节点ID |
|
|
巡检名称 |
产生告警的巡检名称 |
|
|
指标编码 |
产生告警的指标编码 |
|
|
附加信息 |
租户名称 |
产生告警的租户名称 |
|
实例名称 |
产生告警的实例名称 |
|
|
租户ID |
产生告警的租户ID |
|
|
云服务 |
产生告警的云服务 |
|
|
服务 |
产生告警的服务 |
|
|
微服务 |
产生告警的微服务 |
|
|
告警源IP |
告警源IP |
|
|
节点角色 |
产生告警节点的节点角色 |
|
|
指标编码 |
产生告警节点的指标编码 |
|
|
指标采集值 |
产生告警节点的指标采集值 |
|
|
指标阈值 |
产生告警节点的指标阈值 |
对系统的影响
- 此指标如果下降,如果非业务正常变更,反映业务性能下降。
- 此指标如果持续上升,会增加业务对数据库的压力,超过数据库处理能力上限时,可能会导致系统崩溃。
可能原因
- 业务模型发生变化,请求量正常变化。
- 如果持续上涨,为业务行为,联系客户确认。
- 如果下降,如果非业务正常变更,则可能是数据库或者底层出现故障。
处理步骤
- 收到告警后,参考查看监控指标,查看指标“Data Manipulation Language/s”,确认指标情况以及触发告警的节点。
- 判断指标情况。
- 指标上涨,业务行为导致,查看请求量是否上涨到的最大值,同时查看其他的所有巡检指标,确认是否有指标同步上涨并可能超出阈值。
请求量最大值的确认:数据库没有办法知道业务的最大值,客户自己可以根据历史的峰值确认。
- 指标下降,执行3。
- 指标上涨,业务行为导致,查看请求量是否上涨到的最大值,同时查看其他的所有巡检指标,确认是否有指标同步上涨并可能超出阈值。
- 参考查看监控指标查看“80% SQL的响应时间”和“95% SQL的响应时间”的指标情况。
- 如果指标同步下降,业务问题,联系业务确认。
- 如果指标上升,参考ALM-5101180 Ops巡检-80% SQL的响应时间异常和ALM-5101181 Ops巡检-95% SQL的响应时间异常处理方法。
告警清除
此告警修复后,系统会自动清除此告警,无需手工清除。
参考信息
不涉及。

浙公网安备 33010602011771号