06 2018 档案

摘要:监控系统中非常重要的一环,就是告警,系统得在故障发生的第一时间将事件发送出来,通知干系人,prometheus提供了alertmanager来实现这个功能。 第一步:prometheus.yml配置文件,配置alertmanager地址 第二步:编写触发器,也就是在什么情况下产生告警。 Promet 阅读全文
posted @ 2018-06-25 14:07 郑立赛 阅读(1139) 评论(0) 推荐(0)
摘要:这几天忙着开发别的项目,今天抽空写一下Prometheus的查询语法 1,查看指标 直接输入指标名字就行了,grafana会自动补全 2,查看某个指标的使用率,比如cpu使用率 用到rate函数,rate用来计算两个间隔时间内发生的变化率。如 rate(指标名{筛选条件}[时间间隔]) 比如查看1分 阅读全文
posted @ 2018-06-21 10:13 郑立赛 阅读(12184) 评论(0) 推荐(1)
摘要:前言: 说到监控方案,市面上开源的有很多,最常用的zabbix,深入使用zabbix以后,才知道zabbix设计团队有多厉害,简直是一个完美的监控告警方案。但是在针对docker的监控上还差点,需要自己写监控脚本实现。为此从去年开始调研针对docker的监控方案,如下: 1,cadvisor+inf 阅读全文
posted @ 2018-06-13 16:17 郑立赛 阅读(984) 评论(0) 推荐(0)