Promethus(普罗米修斯)的Grafana+onealert实现报警功能

1、Centos7安装Promethus(普罗米修斯)监控系统完整版

2、Promethus(普罗米修斯)监控Mysql数据库

3、Promethus(普罗米修斯)安装Grafana可视化图形工具

4、Promethus的Grafana图形显示MySQL监控数据

目录

1、Centos7安装Promethus(普罗米修斯)监控系统完整版

2、Promethus(普罗米修斯)监控Mysql数据库

3、Promethus(普罗米修斯)安装Grafana可视化图形工具

4、Promethus的Grafana图形显示MySQL监控数据

Grafana+onealert报警

1、 先在onealert里添加grafana应用(申请onealert账号)

2、在Grafana中配置Webhook URL

现在可以去设置一个报警来测试了(这里以我们前面加的cpu负载监控来 做测试)

最终的邮件报警效果:

测试mysql链接数报警

总结报警不成功的可能原因

扩展


 

Grafana+onealert报警

prometheus报警需要使用alertmanager这个组件,而且报警规则需要手 动编写(对运维来说不友好)。所以我这里选用grafana+onealert报警。

注意: 实现报警前把所有机器时间同步再检查一遍.

ntpdate time.windows.com

1、 先在onealert里添加grafana应用(申请onealert账号)

https://caweb.aiops.com/

 

2、在Grafana中配置Webhook URL

1、在Grafana中创建Notification channel,选择类型为Webhook;

2、推荐选中Send on all alerts和Include image,Cloud Alert体验更佳;

3、将第一步中生成的Webhook URL填入Webhook settings Url;

4、Http Method选择POST;

5、Send Test&Save;

现在可以去设置一个报警来测试了(这里以我们前面加的cpu负载监控来 做测试)

配置

保存后就可以测试了

如果node1上的cpu负载还没有到0.5,你可以试试0.1,或者运行一些程序 把node1负载调大。最终能测试报警成功

模拟cpu负载

cat /dev/urandom | md5sum

 

最终的邮件报警效果:

测试mysql链接数报警

总结报警不成功的可能原因

  • 各服务器之间时间不同步,这样时序数据会出问题,也会造成报警出问 题
  • 必须写通知内容,留空内容是不会发报警的
  • 修改完报警配置后,记得要点右上角的保存
  • 保存配置后,需要由OK状态变为alerting状态才会报警(也就是说,你 配置保存后,就已经是alerting状态是不会报警的)
  • grafana与onealert通信有问题

扩展

prometheus目前还在发展中,很多相应的监控都需要开发。但在官网的 dashboard库中,也有一些官方和社区开发人员开发的dashboard可以直接 拿来用。

相关博文

1、Centos7安装Promethus(普罗米修斯)监控系统完整版

2、Promethus(普罗米修斯)监控Mysql数据库

3、Promethus(普罗米修斯)安装Grafana可视化图形工具

4、Promethus的Grafana图形显示MySQL监控数据

 

posted @ 2020-01-13 21:04  南宫乘风  阅读(2141)  评论(0编辑  收藏  举报