摘要: 近期业务查询线上ES集群出现频繁超时告警,尤其是早晨某个时间点固定的报一波超时,从调用链监控上很难看出是什么业务行为导致的。 初步猜测查看Grafana上Elasticsaerch的基础监控,发现业务告警与ES的Old GC(老年代GC)卡顿时间基本吻合: 同时注意到,Old区的内存持续增长,不到1 阅读全文
posted @ 2025-05-29 20:57 大数据从业者FelixZh 阅读(54) 评论(0) 推荐(0)
摘要: 问题背景 客户方面反馈的问题是ES入库速度变慢,延迟升高到几百毫秒,导致数据积压过多,影响了业务。 排查发现ES的服务日志出现不少的gc overhead现象,下面是一个示例的日志片段: [yyyy-MM-ddTHH:mm:ss,SSS][LEVEL][component][node_name][g 阅读全文
posted @ 2025-05-29 20:39 大数据从业者FelixZh 阅读(93) 评论(0) 推荐(0)
大数据从业者