open-falcon 添加主机到hostgroup后agent.alive数值错误问题
案例描述
说明
一个机器的alive如果不加入hostgroup,就是正常的,都是1,一旦加入hostgroup后就变成-1了, 其他的监控项都正常
案例分析
事故过程
说明
添加一台机器到hostgroup,结果触发告警,取值为-1
问题影响
说明
异常数值的机器无法正常监控agent存活
技术分析
说明
1.先重启agent,结果并无效果
2.排查nodata日志,发现组内所有机器都正常,结果只有本台服务器异常
3.排查mysql的endpoint数据是否正确,是否有空格,结果并无异常
4.最后排查得知,linux系统时间有不同步,同步后异常恢复
解决方案
说明
同步系统时间
根本原因
说明
系统时间不同步
预防措施
说明
定时同步系统时间
浙公网安备 33010602011771号