open-falcon无法报警 alarm运行一段时间不告警

案例描述

说明

openfalcon的alarm运行一段时间不告警

 

案例分析

事故过程

说明

alarm组件运行一段时间不告警,日志显示都是ok状态

问题影响

说明

影响正常的故障报警,导致告警系统失效

技术分析

说明

经过排查,judge可以正常写入到redis中,key为event_cases,存入了报警信息,alarm无法获取到redis报警,检查配置文件一切正常,升级alarm到最新版,问题依然存在

解决方案

说明

更换redis,测试24小时,是否可以正常告警,发现redis4.0环境下,alarm会无法取值 ,redis3.0下测试24小时发现可以正常取值报警



根本原因

说明

redis4.0及以上版本无法兼容open-falcon的alarm组件

 

预防措施

说明

必须使用redis3.0版本

posted @ 2021-07-19 15:14  运维小兵#杨  阅读(195)  评论(0)    收藏  举报