Alertmanager配置 (3)

配置项:

1、global定义全局的公共参数

2、template定义告警通知使用的模版

3、route根据标签匹配,确定告警如何处理

4、receiver接受者,在告警路由后发送的组件

5、inhibit_rules设置抑制规则以减少不必要告警的产生

 

1、下载alertmanager

2、配置alertmanager.service服务

vim /usr/lib/systemd/system/alertmanager.service

[Unit]
Description=alertmanager
After=network-online.target

[Service]
ExecStart=/usr/local/alertmanager/alertmanager --storage.path=/usr/local/alertmanager --config.file=/usr/local/alertmanager/alertmanager.yml --log.level=info --data.retention=720h
Restart=on-failure
ExecStop=/bin/kill -9 $MAINPID

[Install]
WantedBy=multi-user.target

 

重载服务

systemctl daemon-reload

启动alertmanager服务

systemctl start alertmanager.service

更改prometheus配置

vim /usr/local/prometheus/prometheus.yml

因为是本机所以可以更改为localhost

更改配置之后重启prometheus

systemctl restart prometheus.service

查看状态是否成功

systemctl status prometheus.service

更改alertmanager.yml的配置

cat alertmanager.yml

alertmanager.yml默认没有global和template配置我们可以手动增加这两项配置

 

resolve_timeout:

如果某个告警已经恢复,要等过了这个参数项设置的时间才发送告警已经解决的消息

 

 

data.retention配置项:

在进行配置的时候,alertmanager有个参数repeat_interval,当告警未解决就自动触发

为了不让告警重复发送,这个值可以设置得大一点,但是不能大于data.retention,所以我们要在起启动参数这里改大这个参数

posted @ 2024-03-26 22:17  ~技术小白  阅读(32)  评论(0)    收藏  举报