nagios在ibm power集群上的安装
nagios安装配置过程记录
环境介绍
ibm power机器
记录一下其中的要点
使用的安装包
nagios4.0.2
nagios plugin 1.5
nrpe 2.1.1
参照网上安装方法,
http://my.oschina.net/duangr/blog/183160
主机环境检查
rpm -q gcc glibc glibc-common gd gd-devel xinetd openssl-devel
其中我检查的时候,发现
namenode 节点中 gd gd-devel 没有安装
但是我想gd包是有关图形开发的包,先不安装,看看编译的时候有什么错误没有。
编译过程中没有发现有问题。
数据节点中gd gd-devel openssl-devel都没有安装,我在编译nagios plugin的时候,没有报错,
但是在编译nrpe的时候出错,configure的时候就报错,没有找到ssl header。
nrpe是SSL进行访问的,所以ssl是必须要有的。
但是因为是namenode节点上有,所以就直接在namenode节点上进行编译,然后直接复制到
其他数据节点即可,不需要在每一个节点都编译。
简易的安装过程
创建nagios用户:
useradd nagios -d /usr/local/nagios
安装nagios 核心
#安装nagios core 监控节点安装
tar zxvf nagios-4.2.tar.gz
./configure --prefix=/usr/local/nagios/
make all
make install
make install-init
make install-commandmode
make install-config
make install-webconf
install-webconf 会在/etc/httpd/conf.d/下生成nagios.conf 文件。
#安装nagios plugsin (全部节点安装)
tar xf nagios-plugins-1.5.tar.gz
./configure --prefix=/usr/local/nagios
make && make install
#安装NRPE (全部节点安装)
./configure --enable-command-args
make all
make install-plugin
make install-daemon
make install-daemon-config
make install-xinetd
install-daemon-config 复制nrpe.cfg 到/usr/local/nagios/etc/下面。
install-xinetd 其实是把nrpe复制到 /etc/xinetd.d/下面。
web配置
生成的nagios.conf 里面是启用了基本用户安全认 证的
生成的文件要与nagios.conf一致
htpasswd -c /usr/local/nagios/etc/htpasswd.users nagiosadmin
#配置自动启动服务
chkconfig --add nagios
chkconfig --level 35 nagios on
chkconfig --list nagios
NRPE的配置
sed
-i "s/127.0.0.1/127.0.0.1 namenodeip/s" /etc/xinetd.d/nrpe
echo "nrpe 5666/tcp #nrpe" >>/etc/services
sed -i "s/dont_blame_nrpe=0/dont_blame_nrpe=1/" /usr/local/nagios/etc/nrpe.cfg
重新启动xinetd
service xinetd restart
检查进程是否启动:
netstat -antl | grep 5666
/usr/local/nagios/libexec/check_nrpe -H localhost
修改配置文件,主要是命令部分:
|
/usr/local/nagios/etc/nrpe.cfg |
放开有些命令,添加如下命令:
|
command[check_procs_args]=/usr/local/nagios/libexec/check_procs $ARG1$ |
vi /usr/local/nagios/etc/nagios.cfg
|
#cfg_file=/export/home/nagios/etc/objects/localhost.cfg (注释掉) cfg_dir=/export/home/nagios/etc/servers |
其他的可以参照
http://my.oschina.net/duangr/blog/183160
数据节点的部署:
先做一个数据节点,然后复制即可。
for dn in px{43..60}
do
echo "$dn is configuring the nagios............................."
ssh $dn useradd nagios -d /usr/local/nagios
scp -r /usr/local/nagios/ root@$dn:/usr/local/
scp /etc/xinetd.d/nrpe root@$dn:/etc/xinetd.d/nrpe
ssh $dn 'echo "nrpe 5666/tcp #nrpe" >>/etc/services'
ssh $dn 'chown -R nagios:nagios /usr/local/nagios/'
ssh $dn 'service xinetd restart'
echo "$dn is end configuring the nagios........................"
done
在监控节点上做配置文件:
#do this in px01
for dn in {43..60}
do
cp px42pub.cfg px${dn}pub.cfg
sed -i "s/px42pub/px${dn}pub/g" px${dn}pub.cfg
sed -i "s/10.19.206.142/10.19.206.1$dn/" px${dn}pub.cfg
done
浙公网安备 33010602011771号