ALM-5101717 Ops巡检-候选槽位数量异常
告警解释
此告警对应指标“候选槽位数量”超出配置阈值,此指标反映数据库中候选槽位的数量。
告警属性
|
告警ID |
告警级别 |
告警类型 |
告警归属 |
业务类型 |
是否可自动清除 |
|---|---|---|---|---|---|
|
5101717 |
巡检配置 |
业务质量告警 |
租户面 |
云数据库 GaussDB 节点 |
是 |
告警参数
|
类别 |
参数名称 |
参数含义 |
|---|---|---|
|
定位信息 |
云服务 |
产生告警的云服务 |
|
实例ID |
产生告警的实例ID |
|
|
节点ID |
产生告警的节点ID |
|
|
巡检名称 |
产生告警的巡检名称 |
|
|
指标编码 |
产生告警的指标编码 |
|
|
附加信息 |
租户名称 |
产生告警的租户名称 |
|
实例名称 |
产生告警的实例名称 |
|
|
租户ID |
产生告警的租户ID |
|
|
云服务 |
产生告警的云服务 |
|
|
服务 |
产生告警的服务 |
|
|
微服务 |
产生告警的微服务 |
|
|
告警源IP |
告警源IP |
|
|
节点角色 |
产生告警节点的节点角色 |
|
|
指标编码 |
产生告警节点的指标编码 |
|
|
指标采集值 |
产生告警节点的指标采集值 |
|
|
指标阈值 |
产生告警节点的指标阈值 |
对系统的影响
- 如果候选槽位降为0,说明共享内存已经被占满,会影响业务时延。
- 如果没有降为0,且平稳或者回落,对业务无影响,需要持续观察,防止达到上限。
可能原因
- 业务侧大量写操作。
- 大量写操作集中在单个DN上容易出现。
处理步骤
- 收到告警后,参考查看监控指标,查看指标“候选槽位数量”,确认指标情况以及触发告警的组件。
- 候选槽位的数量和未落盘脏页数量相加,为共享缓冲区中页面数量上限。
如果候选槽位下降,会对应未落盘脏页上升,处理方法见ALM-5101718 Ops巡检-未落盘脏页数量异常。
告警清除
此告警修复后,系统会自动清除此告警,无需手工清除。
参考信息
不涉及。
浙公网安备 33010602011771号