ALM-5023082 云数据库 GaussDB主机流控时间超阈值
告警解释
系统每一分钟检查云数据库 GaussDB每一分片中主DN的流控时间,当主DN的流控时间超过设置的阈值10秒(默认)时,产生此告警。
告警属性
|
告警ID |
告警级别 |
告警类型 |
告警归属 |
业务类型 |
是否可自动清除 |
|---|---|---|---|---|---|
|
5023082 |
紧急 |
业务质量告警 |
租户面 |
云数据库 GaussDB 节点 |
是 |
告警参数
|
类别 |
参数名称 |
参数含义 |
|---|---|---|
|
定位信息 |
区域 |
产生告警的资源所属区域 |
|
云数据库 GaussDB 节点名称 |
产生告警的数据库实例节点名称 |
|
|
云数据库 GaussDB 节点ID |
产生告警的数据实例节点资源ID |
|
|
附加信息
|
门限值 |
产生告警的指标监控门限值 |
|
当前值 |
产生告警的指标当前值 |
|
|
可能影响 |
产生当前告警对系统的可能影响 |
|
|
级别 |
产生告警的级别 |
|
|
云数据库 GaussDB节点 |
产生告警的数据库实例节点ID |
|
|
云数据库 GaussDB实例 |
产生告警的数据库实例ID |
|
|
云数据库 GaussDB组件 |
产生告警的数据库实例组件ID |
|
|
阈值规则名称 |
产生告警的阈值告警规则名称 |
对系统的影响
主机流控时间超过阈值,可能对业务时延有影响。
可能原因
- 业务写请求量大,触发流控。
- 阈值条件设置不合理。
处理步骤
- 使用浏览器,通过地址“https://ManageOne运维面主页的访问地址:31943”,登录ManageOne运维面,或通过地址“https://ManageOne主门户的访问地址”,登录ManageOne主门户,选择“运维中心(OC)”,进入ManageOne运维面。
- 密码方式:输入账号和密码。
- 默认账号:bss_admin
对于从8.2.0或更早版本升级上来的ManageOne,默认账号为admin。
- 默认密码:参见《华为云Stack 8.3.1 账户一览表》的“A类(Portal)”页签中,“ManageOne运维面”账户对应的默认密码。
- 默认账号:bss_admin
- USB Key方式:插入已预置用户证书的USB Key,选择设备和用户证书,并输入PIN码。
- 密码方式:输入账号和密码。
- 在主菜单选择“告警 > 告警管理 > 当前告警”中查看告警信息返回的监控指标阈值以及当前采集的指标值。
- 检查监控指标的阈值设置。
- 主菜单选择“监控 > 监控配置 ”,进入监控配置页面。
- 在左侧导航栏选择“阈值告警规则”。
- 在“阈值告警规则”页面,选择云数据库 GaussDB服务,找到对应监控指标的阈值。
- 如果指标来源为系统预置,执行5。
- 自定义创建的监控指标,单击对应监控指标操作列的“修改”,查看阈值条件设置是否合理。
NOTICE:预置的监控指标告警阈值不支持修改,只支持查看。
- 修改指标阈值策略。
- 根据实际指标数据修改阈值。
- 等待5分钟,在主菜单选择“告警> 告警管理 > 当前告警”,检查告警是否清除。
- 是:处理完毕。
- 否:执行5。
- 参考收集日志,并收集告警信息,联系技术支持进行处理
需要下载的日志信息有:
Agent组件下的:
- /home/Ruby/log/agent.log
- /home/Ruby/log/ops_collector.log
GaussDB Kernel组件下的:/var/lib/log/Ruby
告警清除
此告警修复后,系统会自动清除此告警,无需手工清除。
参考信息
不涉及。
浙公网安备 33010602011771号