zabbix监控总结【维度】

zabbix监控总结【维度】

# 0.物理服务器用的型号?
Dell R710 720 730...
IDRAC自带一个远程管理卡,安装一个软件包就能监控
如果不使用dell的IDRAC 可以使用IPMI
# 1.物理硬件监控 (cpu温度,风扇转速,主板温度,电压,功率,ipmi工具监控,机房巡检) 
ipmitoo1命令行可监控这些 但是需要ipmi芯片
[root@zabbix ~]# yum install -y ipmitool.x86_64 

cpu温度高:声音大
风扇不转:cpu温度高
电压不稳:出现蓝屏
ipmi命令硬盘的健康状态监控不了 所以需要人工巡检
# 2.操作系统监控 (cpu负载,内存,磁盘容量io,网卡io,进程数,安全监控/etc/password) 
linux自带模板 帮你做了

cpu负载高:影响用户体验
内存高:卡顿
硬盘满:写不下日志报错退出
网卡流量满:考虑扩容
# 3.应用软件监控 (nginx,php-fpm, mysql,redis,分布式文件系统glusterFS,ceph) 
修改开源的模板
# 4.业务监控 (业务状态,网页速度,pv,uv,ip监控,会员活跃数量,每天的成单量)
pv:页面
uv:设备 终端
ip:公网ip

签到可以监控活跃量
# 5.网络设备监控 snmp
监控总入口 不监控单个服务器流量
# 6.ELK监控日志
比如我们有上千台服务器 跑着跑着突然崩了 是谁的问题?
收集所有日志 过滤error 找到问题
# 7.应用层面
服务进程 端口号

一些特殊程序我们还需要额外监控
1) MySQL:主从复制是否有延迟(zabbⅸx监控模板)
2) redis:主从复制是否有延迟
监控思路:zabbix没有固定模板,可以在主库中set一个key为时间戳,然后从库会同步这个时间戳(动态),写脚本时时获取这两个时间戳,作对比。
3) NFS:磁盘挂载状况
4) tomcat:JVM监控,老年代、新生代、永久带、 full-gc、垃圾回收
5) rsync的同步情况,MD5校验文件是否被篡改
posted @ 2019-12-24 13:38  干瘪的柠檬  阅读(609)  评论(0)    收藏  举报