ALM-5101757 Ops巡检-OMA进程内存占用异常
告警解释
此告警对应指标“oma进程内存占用”,此指标反映om_agent进程占用的内存大小。
告警属性
|
5101757 |
巡检配置 |
业务质量告警 |
租户面 |
云数据库 GaussDB 节点 |
是 |
告警参数
|
定位信息 |
云服务 |
产生告警的云服务 |
|
实例ID |
产生告警的实例ID |
|
|
节点ID |
产生告警的节点ID |
|
|
巡检名称 |
产生告警的巡检名称 |
|
|
指标编码 |
产生告警的指标编码 |
|
|
附加信息 |
租户名称 |
产生告警的租户名称 |
|
实例名称 |
产生告警的实例名称 |
|
|
租户ID |
产生告警的租户ID |
|
|
云服务 |
产生告警的云服务 |
|
|
服务 |
产生告警的服务 |
|
|
微服务 |
产生告警的微服务 |
|
|
告警源IP |
告警源IP |
|
|
节点角色 |
产生告警节点的节点角色 |
|
|
指标编码 |
产生告警节点的指标编码 |
|
|
指标采集值 |
产生告警节点的指标采集值 |
|
|
指标阈值 |
产生告警节点的指标阈值 |
对系统的影响
- 一般情况下,如果无变更,om_agent进程占用内存都是平稳的。不同的数据库内核版本之间,om_agent进程占用的内存会有差别,如果内核升级之后出现此指标上涨之后很快平稳,属于正常现象。
- 如果出现内存持续上涨不趋于平稳,可能会影响om_agent进程的运行,严重时会导致节点上内存资源耗尽,其他组件无法申请到内存。
可能原因
内存泄漏。
处理步骤
- 收到告警后,通过查看监控指标查看指标“oma进程内存占用”,确认指标情况以及触发告警的组件。
- 持续观察指标,确认是否趋于平稳,并同步排查是否有数据库内核的升级操作。
- 通过登录实例节点,登录到告警节点上,使用如下命令确认om_agent的内存占用情况。
- 执行命令,查询om-agent的父进程,获取om_agent父进程的PID。ps -ef | grep 'om_agent.py'
- 确认RSS列的值和指标展示的是否一致,并联系技术支持处理。ps -p '151334' v | grep -E '151334|PID'
告警清除
此告警修复后,系统会自动清除此告警,无需手工清除。
参考信息
不涉及。
更多详情请参考GaussDB 文档中心:https://doc.hcs.huawei.com/db/zh-cn/gaussdbqlh/24.1.30/productdesc/qlh_03_0001.html
浙公网安备 33010602011771号