常见监控项
1.服务器资源监控
服务器的CPU、内存、TCP链接数、线程数是否超出标准
标准:CPU 80%;内存 80%;线程 500;TCP 7天环比30%
cup 过高常见原因:
1.死循环 2 .大量IO 3.频繁GC
2.Web服务器IIS队列 堆积情况检查
4小时瞬时堆积>5,高峰期次数>5,平时大于2,
3.调用链用户请求性能分析
UI层接口目标300ms,大于500,底层接口目标10ms,大于20酌情分析
24小时Top10频次、最慢Top5、
4.服务内部监控
链接数平均超过500,重点监控服务使用情况
链接数平均超过800,酌情添加服务链接数或添加服务节点。
链接数偶发大于等于1000,立刻添加服务链接数或添加服务节点。
5.队列堆积监控
kafka 如何判断堆积:同一个group 的同一个topic 的最大offset 和当前消费的offset 的差值大于一定的阈值
浙公网安备 33010602011771号