nagios监控平台的部署和使用
nagios的监控都是通过插件实现
启动nagios后,它会周期性的自动调用插件去检测服务状态,同时nagios会维持一个状态队列,所以插件返回的状态都会进入队列,nagios从队首读取处理后把状态结果显示到web页面
一、安装部署nagios(4.4.11)和nagios插件(2.4.6)
1、通过官网下载源码包
2、安装依赖包
yum install -y gcc gcc-c++ glibc glibc-common php gd gd-devel libpng libmng libjpeg zlib openssl-devel
3、安装httpd和php
yum install -y httpd php
#http服务用来显示web监控页面,nagios3.1.x版本之后,配置nagios监控界面需要php的支持
4、创建用户和目录
useradd -s /sbin/nologin nagios
groupadd nagcmd
mkdir /usr/local/nagios
chown -R nagios.nagios /usr/local/nagios
5、部署和初始化
./configure --with-command-group=nagcmd --prefix=/usr/local/nagios #指定命令组的名称,该组用户可以执行nagios命令
make all #编译nagios的所有组件和插件,生成可执行文件
make install #安装nagios的可执行文件、配置文件到指定路径
make install-init #安装初始化脚本,用于启动、停止、重启服务
make install-commandmode #设置nagios的命令权限,其他用户可以访问
make install-config #安装nagios的配置文件模板
make install-webconf #安装web界面及其配置文件
6、创建web页面登录用户和密码
htpasswd -c /usr/local/nagios/etc/htpasswd.users nagiosadmin #用户建议使用nagiosadmin,其他用户可能没权限
输入密码
7、启动服务并加入开机自启
systemctl restart nagios
systemctl restart httpd
systemctl enable nagios
systemctl enable httpd
systemctl reload nagios #重新加载配置文件,修改后不需要重启服务
8、访问
http://ip/nagios
9、安装插件
./configure --prefix=/usr/local/nagios
make
make install
二、修改配置,通过自定义脚本进行监控
1、把写好的自定义shell脚本复制到插件目录/usr/local/nagios/libexec
2、给脚本添加可执行权限,确认脚本中会返回任意4个状态值,通过exit返回
chmod 777 check_test.sh
0(ok)--绿色、1(waring)--黄色、2(critical)--红色、3(unknown)--深黄色
3、修改nagios配置
1) vim commands.cfg
define command {
command_name check_test #自定义
command_line $USER1$/check_test.sh
}
建议复制该配置文件中的其它command,再进行修改,name就是web页面上显示的名字
2)vim test.cfg
define service {
use generic-service
host_name localhost
service_description test #自定义
check_command check_test #和command里配置的一致
}
建议复制该配置文件中的其它service,再进行修改
3)vim nagios.cfg
cfg_file=/usr/local/nagios/etc/objects/test.cfg #新增指定的配置文件
4、重新加载nagios配置
systemctl reload nagios
有报错,根据提示进行排查 journalctl -xe #查看错误日志
5、当脚本触发报错返回2或者3时,web页面会看到告警
6、监控客户端机器
服务端和客户端都需要安装nrpe,客户端还需要安装插件
客户端本地的nrpe运行本地插件检测本机的服务和状态,之后把状态结果传递给服务端的check_nrpe,check_nrpe会再把结果送到队列
浙公网安备 33010602011771号