运维之监控系统实践

一、监控的分类

  • 基础资源监控系统:
    • zabbix
    • open-falcon
    • n9e(夜莺)
    • prometheus (CNCF)
    • cacti
    • nagions
    • ganglia
  • 应用程序监控(APM): Pingpoint ,Twitter的Zipkin,美团的CAT 商业化厂商: 听云
  • 日志监控: ES / 自研

二、监控系统(我们在用什么?)

  • open-falcon
  • zabbix
  • prometheus
  • n9e(夜莺)

zabbix 架构:
image
图片来自: https://www.jianshu.com/p/5bdeb896af08

open-falcon架构(图片来自官网):
image

image

图片来自: https://www.jianshu.com/p/210dc70b493e

n9e架构(图片来自官网):
image

prometheus 架构(图片来自官网):
image

image
【说明】摘自prometheus监控实践第二章

三、经典案例(我们怎么用?)

  • zabbix lld 功能 (MySQL 自动发现案例)
  • open-falcon expression ( 状态码案例 )
    • es-mon
      image
  • grafana + zabbix
  • n9e 大盘,环比功能,指标聚合

四、监控系统整体对比

image

⚠️: 本文编写于2020年,由于本人水平有限,难免会存在不合理的地方,欢迎指正。

posted @ 2021-06-16 23:31  Topic  阅读(358)  评论(0编辑  收藏  举报
转载请注明出处. 作者: 运维的自我修养 地址: http://www.cnblogs.com/topicjie/