open-falcon 添加主机到hostgroup后agent.alive数值错误问题

案例描述

说明

 一个机器的alive如果不加入hostgroup,就是正常的,都是1,一旦加入hostgroup后就变成-1了, 其他的监控项都正常

 

案例分析

事故过程

说明

添加一台机器到hostgroup,结果触发告警,取值为-1

问题影响

说明

异常数值的机器无法正常监控agent存活

技术分析

说明

1.先重启agent,结果并无效果

2.排查nodata日志,发现组内所有机器都正常,结果只有本台服务器异常

3.排查mysql的endpoint数据是否正确,是否有空格,结果并无异常

4.最后排查得知,linux系统时间有不同步,同步后异常恢复

解决方案

说明

同步系统时间

 

根本原因

说明

系统时间不同步

 

预防措施

说明

定时同步系统时间

posted @ 2021-07-19 15:20  运维小兵#杨  阅读(151)  评论(0)    收藏  举报