Zabbix基本配置

zabbix基本配置
Host Groups(主机组) ->
Hosts(主机) ->
Templates(模板){模板内有众多Applications应用集也就是监控项组}->
Items (监控项,添加监控项后可添加图形) ->
Triggers(触发器,监控项可以选择性关联触发器)->
Actions (告警动作)->
Medias (告警方式)->
User Groups(用户组)->
Users(用户)
 
主机组->主机->监控项->图形->触发器->动作 <-报警媒介类型,用户
 
我们用前面自己定义的自定义监控项目来完成以下基本配置

添加主机组(可选)

 
主机组 (host group), 主机的逻辑组, 它包含主机和模板。一个主机组中的主机通常具有某些共同特征。
一个主机组里的主机和模板之间并没有任何直接的关联。通常在给不同用户组的主机分配权限时候使用主机组。
 
在这个界面我们可以看到默认已经有很多主机组了
如果需要创建一个新组, 可点击右上角的 按钮
然后输入组名, 点击"添加", 就可以了
 
 

添加主机

 
主机(host): 是指要监控的网络设备,可由 IP 或 DNS名称 指定
我们要把 host2 主机监控起来, 可以手动将 host2 主机添加进来
这个界面会列出所有可被监控的主机列表
点右上角的按钮, 进入创建主机的页面
 
点击添加, 就可以把这个主机添加进来了.
 
 

添加监控项

 
监控项(item):一个特定监控指标的相关的数据;这些数据来自于被监控对象
item是zabbix进行数据收集的核心,相对某个监控对象,每个item都由"key"标识
 
在主机列表中, 点击 "监控项" ,可列出相应主机的监控项列表
 
因为我们刚添加的这台 host2 主机没有关联任何模板, 所以现在没有监控项. 点击右上角的 按钮
 
设置完成后, 点击 "添加" 即可完成监控项的配置
 
回到仪表板, 也可以看到有一个监控项处理启用状态
 
另外, 可以在 "最新数据" 中看到指定主机的数据
在数据的最后一列, 还有个"图形", 点开可以看到数据的变化情况
 
在这个图形中, 我们注意到中文无法显示
 
zabbix字体文件位置: /usr/share/zabbix/assets/fonts/
# cd /usr/share/zabbix/assets/fonts/
# ll # 可以看到它是一个软链接, 指向了/etc/alternatives/zabbix-web-font
lrwxrwxrwx 1 root root 33 Oct 18 22:21 graphfont.ttf -> /etc/alternatives/zabbix-web-font
# ll /etc/alternatives/zabbix-web-font # 再看, 它还是一个链接, 真正的字体文件为/usr/share/fonts/dejavu/DejaVuSans.ttf
lrwxrwxrwx 1 root root 38 Oct 18 22:21 /etc/alternatives/zabbix-web-font -> /usr/share/fonts/dejavu/DejaVuSans.ttf
我们可以从windows上拷一个字体(例如微软雅黑或宋体) 来替换掉它
Windows系统中字体路径: C:\Windows\Fonts
将原来的字体链接替换掉:
# ln -sf /usr/share/fonts/dejavu/msyh.ttf /etc/alternatives/zabbix-web-font
# ll /etc/alternatives/zabbix-web-font
lrwxrwxrwx 1 root root 32 Oct 19 05:04 /etc/alternatives/zabbix-web-font -> /usr/share/fonts/dejavu/msyh.ttf
再看图形, 显示正常了
 
 
告警配置
 
当出现问题时,我们要能及时发现问题, 并且需要去基于一个对应的事件为条件来指明该做什么事,一般就是执行远程命令或者发警报。
 
我们可以为采集到的数据定义一个条件, 如果满足条件说明出现了问题, 这个条件我们称之为触发器
每一个用户都应该有一个接收告警信息的方式,即媒介,就像我们接收短信是需要有手机号的一样。  
我们的每一个监控主机,能够传播告警信息的媒介有很多种。
而对于一个媒介来说,每一个用户都有一个统一的或者不同的接收告警信息的端点,我们称之为目标地或者目的地。
 
综上: 
• 为了能够发现问题, 我们需要定义触发器
• 为了能够发告警信息,第一,我们要事先定义一个媒介,第二,还要定义这个媒介上用户接收消息的用户。
 

定义触发器

 
触发器(trigger):一个表达式,用于评估某监控对象的特定item内接收到的数据是否在合理范围内,也就是阈值
接收的数据量大于阈值时,触发器状态将从"OK" 转变为 "Problem",当数据再次恢复到合理范围,又转变为"OK";
 
例如: 如果由于业务要求, /data 这个目录下的文件数量不能超过20个. 那这个 20 就可以做为这个监控项的阈值
在主机列表中, 点击 "触发器" ,可列出相应主机的触发器列表
 
点击右上角的按钮
 
下图是上面的 "添加" 界面
 
触发器创建好了我们可以测试一下:
在 host2 主机上的 /data 目录下创建文件
# touch /data/{a..z}
 
查看 "最新数据"
 
查看 图形
 
查看仪表板
 
 
 

报警媒介类型

 
报警媒介类型(media):发送通知的手段或者通道,如Email、SMS等, 随着互联网的发展, 还可以通过微信, 钉钉等发送通知
 
这里我们配置邮件通知
 
点击Email, 设置发送的SMTP服务信息
配置完成后可以点击后面的 "测试" 按钮测试配置是否正确
 
 
 

定义接收告警的用户

 
前面我们配置好了邮件服务器, 那如果要发邮件发给谁呢? 在用户中配置
例如发邮件给Admin
点击Admin用户
点击"更新"后, 用户就配置完成了
 
 

动作

 
动作(action):指对于特定事件事先定义的处理方法,可以是执行脚本或发送通知
动作是在某些特定条件下触发的,比如,某个触发器被触发了,就执行我们的动作。
类似于 if 语句, 触发器为条件表达式, 动作为具体的代码块
 
执行脚本动作: 这类动作一般用于智能地解决问题
发送通知: 一般用于提醒用户出现了问题 或 问题已解决
 
在此我们学习发邮件的动作, 例如 host2 中的 /data 目录下文件数大于20个时, 给Admin用户发送邮件
 
点击右上角的按钮
**注意, 这里事件源为触发器, 不要更改了
 
先定义本动作的触发条件
再定义具体的动作
 
配置好之后就可以测试了
 
 
posted @ 2020-10-20 19:56  梦里花落知多少sl  阅读(308)  评论(0)    收藏  举报