Zabbix监控笔记

  了解zabbix,有必要了聊一下监控系统相关内容

  企业中常用的开源监视系统目前有 cactiNagiosOpen-Falconzabbixprometheus

使用监控系统的目的在于

     /1、能够及时发现故障、及时处理、降低损失

    /2、另一方面降低运维人员的工作量

    /3、监控对象几乎涵盖所有服务程序 服务器的硬件CPU使用率 / 负载、内存使用率 / 空闲情况、磁盘使用情况等

                                服务器性能带宽 IO、磁盘 IO、进程等

                           网络服务不同服务的运行情况等

                           当前业务访问量、发货状态、成交量、正在支付的用户量等

                           网络设备,及应用程序等 }

  为什么需要对各类系统进行监控?

    在系统构建时,通常不允许未被监控的系统或应用上线,因为未被监控的系统存在不可预知性故障未知性等不稳定因素,且无法及时被发现并排除。这对整个架构或系统都是很大的风险隐患,所以原则上需要对整个架构或系统进行监控,随时监测各方面指标正常与否,提高系统稳定性。

  一个完整的监控系统包括:

      • 数据采样 :周期性的获取某个被监测指标的相关数据

      • 数据存储 :将采集的数据存储在指定的存储系统,zabbix默认是MySQL

      • 数据展示 :直观的展示在用户面前,可将采集的数据做二次处理,做成各类图形

      • 报警 :当监控指标出现异常时需要实时发出告警信息,必要情况可自行修复等

Zabbix

    基于WEB界面的提供分布式系统监视以及网络监视功能企业级的开源解决方案,目前大部分企业公司均有使用

      官方手册https://www.zabbix.com/documentation/4.0/zh/manual……支持中文版

  相关特性

    zabbix 是一个高度集成的网络监控套件,通过一个软件包就可提供诸多特性

    /1、数据收集通过 snmp 、ssh 、telnet 、agent 、ipmi 、jmx 、等通道采集被监控数据的数据。详情点击

    /2、实时绘图:展示,读取数据绘图,支持 graph 、map 、screen 、slide show

    /3、告警:邮件,短息,微信,钉钉等通讯软件

    /4、数据存储:mysql 、pgsql 、时间序列数据库

    /5、灵活阈值定义:zabbix中称为触发器 trigger

    /6、配置简单:一次配置,终生监控

    /7、网络自动发现:自动发现网络设备,agent 自动注册

    /8、WEB 接口:使用PHP编写,访问快速无障碍

    /9、二进制守护进程高性能,低内存消耗,易移植

    等

  常用组件

    • Server  服务端,数据集成地

    • Agent   客户端,收集数据

    • Proxy    代理,相当于中转站,需要把收集到的数据提交 / 被提交到 Server

    • Database  数据存储,配置信息及采集的数据

    • Web GUI   提供的WEB界面

  工作原理

    zabbix agent需要安装到被监控的主机上,它负责定期收集各项数据,并发送到zabbix server端;

    zabbix server将数据存储到数据库中,zabbix web根据数据在前端进行展现和绘图。

         这里agent收集数据分为主动和被动两种模式:

           主、agent请求server获取主动的监控项列表,并主动将监控项内需要检测的数据提交给server/proxy

           被、server向agent请求获取监控项的数据,agent返回数据

  工作进程

    • zabbix_get  单独使用命令,用来故障排错

    • zabbix_sender  发送数据给server或proxy,用于耗时较长的检查

    • zabbix_java_gateway  2.0后引入,Java 网关,主动的获取数据

    • zabbix_agentd  客户端守护进程

    • zabbix_proxy  代理守护进程

    • zabbix_server  服务端守护进程 

  相关概念

    host • 主机 要监控的网络设备,可由IP或DNS名称指定

    host group • 主机组 主机的逻辑容器,可以包含主机和模板,但同一个组织内的主机和模板不能互相链接

    item • 监控项 一个特定监控指标的相关的数据;item是zabbix进行数据收集的核心,相对某个监控对象,每个item都由"key"标识;

    trigger • 触发器 一个表达式,用于评估某监控对象的特定item内接收到的数据是否在合理范围内,也就是阈值

    event • 事件 触发一个值得关注的事情,比如触发器状态转变,新的agent或重新上线的agent的自动注册等

    action • 动作 指对于特定事件事先定义的处理方法,如发送通知,何时执行操作

    escalation • 报警升级 发送警报或者执行远程命令的自定义方案

    media • 媒介 发送通知的手段或者通道,如Email、Jabber或者SMS等

    notification • 通知 通过选定的媒介向用户发送的有关某事件的信息

    template • 模版 用于快速定义被监控主机的预设条目集合,通常包含了item、trigger、graph、等,模板可以直接链接至某个主机

    application • 应用 一组item的集合

    web scennario • web场景 用于检测web站点可用性的一个或多个HTTP请求

    frontend • 前端 Zabbix的web接口   

  监控架构

    根据网络环境、监控规模等,分以下三种架构

    /1、server-client  直接由zabbix server和zabbix agentd之间进行数据交互,适用于网络比较简单,设备比较少的监控环境 

   

 

 

 

 

    /2、server-proxy-client  server+proxy+agentd建立,一般适用于跨机房跨网络中型网络架构的监控

    

 

 

    /3、master-node-client  每个node同时也是一个server端,node下面可以接proxy,也可以直接接client 。node有自已的配置文件和数据库,将配置信息和监控数据向master同步

                  适用于跨网络、跨机房、设备较多的大型环境

    

 

 

 

     

posted @ 2020-11-20 21:08  反手柠檬拳  阅读(141)  评论(0编辑  收藏  举报