nagios监控平台的部署和使用

nagios的监控都是通过插件实现
启动nagios后,它会周期性的自动调用插件去检测服务状态,同时nagios会维持一个状态队列,所以插件返回的状态都会进入队列,nagios从队首读取处理后把状态结果显示到web页面

一、安装部署nagios(4.4.11)和nagios插件(2.4.6)

1、通过官网下载源码包

2、安装依赖包

yum install -y gcc gcc-c++ glibc glibc-common php gd gd-devel libpng libmng libjpeg zlib openssl-devel

3、安装httpd和php

yum install -y httpd php

#http服务用来显示web监控页面,nagios3.1.x版本之后,配置nagios监控界面需要php的支持

4、创建用户和目录

useradd -s /sbin/nologin nagios

groupadd nagcmd

mkdir /usr/local/nagios

chown -R nagios.nagios /usr/local/nagios

5、部署和初始化

./configure --with-command-group=nagcmd --prefix=/usr/local/nagios         #指定命令组的名称,该组用户可以执行nagios命令

make all                                         #编译nagios的所有组件和插件,生成可执行文件

make install                                   #安装nagios的可执行文件、配置文件到指定路径

make install-init                             #安装初始化脚本,用于启动、停止、重启服务

make install-commandmode        #设置nagios的命令权限,其他用户可以访问

make install-config                       #安装nagios的配置文件模板

make install-webconf                   #安装web界面及其配置文件

6、创建web页面登录用户和密码

htpasswd -c /usr/local/nagios/etc/htpasswd.users nagiosadmin      #用户建议使用nagiosadmin,其他用户可能没权限

输入密码

7、启动服务并加入开机自启

systemctl  restart nagios

systemctl  restart httpd

systemctl enable  nagios

systemctl enable  httpd

systemctl  reload  nagios    #重新加载配置文件,修改后不需要重启服务

8、访问

http://ip/nagios

9、安装插件

./configure  --prefix=/usr/local/nagios

make

make install

 

二、修改配置,通过自定义脚本进行监控

1、把写好的自定义shell脚本复制到插件目录/usr/local/nagios/libexec

2、给脚本添加可执行权限,确认脚本中会返回任意4个状态值,通过exit返回

chmod 777 check_test.sh

0(ok)--绿色、1(waring)--黄色、2(critical)--红色、3(unknown)--深黄色

3、修改nagios配置

1) vim commands.cfg

define command {

      command_name        check_test        #自定义

      command_line           $USER1$/check_test.sh

}

建议复制该配置文件中的其它command,再进行修改,name就是web页面上显示的名字

2)vim test.cfg

define service {

   use                                          generic-service

   host_name                              localhost

   service_description                 test                            #自定义

   check_command                     check_test                #和command里配置的一致

}

建议复制该配置文件中的其它service,再进行修改

3)vim nagios.cfg

cfg_file=/usr/local/nagios/etc/objects/test.cfg              #新增指定的配置文件

4、重新加载nagios配置

systemctl reload nagios

有报错,根据提示进行排查  journalctl -xe   #查看错误日志

5、当脚本触发报错返回2或者3时,web页面会看到告警

6、监控客户端机器

服务端和客户端都需要安装nrpe,客户端还需要安装插件

客户端本地的nrpe运行本地插件检测本机的服务和状态,之后把状态结果传递给服务端的check_nrpe,check_nrpe会再把结果送到队列

 

posted @ 2023-10-13 14:35  菜菜陈  阅读(418)  评论(0)    收藏  举报