关注领域建模

追随UML,学会思考

Zabbix增加邮箱后Server宕处理

zabbix版本:4.1  DB为Mysql

过程:

1,为了增加邮件报警功能,按照网上文章,开始增加发送邮件模块。先停postfix,后安装mailx和sendmail。

  systemctl list-unit-files | grep post
  systemctl stop postfix
  systemctl disable postfix

 yum -y install mailx sendmail

2,设置邮箱信息,vi /etc/mail.rc。

3,测试邮箱echo "zabbix test " |mail -s "zabbix" sss@aaa.com.cn

4,在zabbix web配置中报警媒介类型,停用Jabber和SMS;启用Email。用户内增加email.

5,动作Report problems to Zabbix administrators内增加操作:发送消息给用户群组。

开始测试。发现邮件无法收到。于是停止某个主机的agent来看看是否发送邮件报警信息。未果。

发展:

在继续配置其他信息后,需要重启服务器,发现server无法正常启动。

vi /var/log/zabbix/zabbix_server.log

多次检查后,发现报 server #2 started [alerter #1] 错误,服务重启。有时候报alerter #2错误。

 17996:20190403:202634.460 Starting Zabbix Server. Zabbix 4.2.0alpha2 (revision 88094).
 17996:20190403:202634.460 ****** Enabled features ******
 17996:20190403:202634.460 SNMP monitoring:           YES
 17996:20190403:202634.460 IPMI monitoring:           YES
 17996:20190403:202634.460 Web monitoring:            YES
 17996:20190403:202634.460 VMware monitoring:         YES
 17996:20190403:202634.460 SMTP authentication:       YES
 17996:20190403:202634.460 Jabber notifications:      YES
 17996:20190403:202634.460 Ez Texting notifications:  YES
 17996:20190403:202634.460 ODBC:                      YES
 17996:20190403:202634.461 SSH2 support:              YES
 17996:20190403:202634.461 IPv6 support:              YES
 17996:20190403:202634.461 TLS support:               YES
 17996:20190403:202634.461 ******************************
 17996:20190403:202634.461 using configuration file: /etc/zabbix/zabbix_server.conf
 17996:20190403:202634.476 current database version (mandatory/optional): 04010004/04010004
 17996:20190403:202634.477 required mandatory version: 04010004
 17996:20190403:202634.754 server #0 started [main process]
 18001:20190403:202634.757 server #1 started [configuration syncer #1]
 18002:20190403:202634.759 server #2 started [alerter #1]
 18003:20190403:202634.760 server #3 started [alerter #2]
 18004:20190403:202634.762 server #4 started [alerter #3]
 18005:20190403:202634.763 server #5 started [housekeeper #1]
 18006:20190403:202634.765 server #6 started [timer #1]

  18002:20190403:202635.172 Got signal [signal:11(SIGSEGV),reason:1,refaddr:0x50]. Crashing ...
  18002:20190403:202635.172 ====== Fatal information: ======
  18002:20190403:202635.172 Program counter: 0x7f59c68f080f
  18002:20190403:202635.172 === Registers: ===

解决:

1,在配置文件中vi /etc/zabbix/zabbix_server.conf将alerter设置为0,以为能解决问题:错误,问题没有解决。Server没有alerter不能启动。设置为1也不行,还是报同样的错误。

2,网上搜索一番,没有类似的答案。想来应该是邮箱配置问题,将mailx和sendmail卸载,重启还是同样的错误。

3,将web配置信息全部禁用,还是报alerter错误。

4,想到服务器上已经有很多监控信息,决定先备份数据库。

5,用以前的系统恢复zabbix,然后启动检查,server正常。停止后还原数据库。发现还是出现问题。

6,判断应该是配置问题,在mysql中将alert表中的数据全部删除。

7,服务重启后,开始变得正常了。

 

蠢,耗时1天!!!

 

posted on 2019-04-04 09:16  Beewolf  阅读(763)  评论(0编辑  收藏  举报

导航