会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
凯文队长
系统运维 k8s 微服务
博客园
首页
新随笔
联系
管理
订阅
随笔分类 -
监控
alertmanager详解
摘要:https://blog.csdn.net/u014029783/article/details/80654727 # alertmanager发送告警阶段 在第一个阶段Silence中,Alertmanager会判断当前通知是否匹配到任何的静默规则,如果没有则进入下一个阶段,否则则中断流水线不发送
阅读全文
posted @
2020-06-20 10:16
凯文队长
阅读(8121)
评论(0)
推荐(0)
普罗告警处理流程
摘要:主要处理流程1、接收到Alert,根据labels判断属于哪些Route(可存在多个Route,一个Route有多个Group,一个Group有多个Alert)2、将Alert分配到Group中,没有则新建Group3、新的Group等待group_wait指定的时间(等待时可能收到同一Group的
阅读全文
posted @
2020-06-20 09:42
凯文队长
grafna如何用新的dashbord覆盖旧的dashbord
摘要:方式一、import一个和之前不一样的名字,然后删除旧的方式二、浏览器json页面复制粘贴,覆盖旧的dashbord 1、记录旧dashbord的var参数,从旧dashbord的json页面复制全部出来,然后修改底部的uid和title,uid需要给为其他,然后覆盖旧的dashbord 2、修改v
阅读全文
posted @
2019-11-01 17:42
凯文队长
阅读(187)
评论(0)
推荐(0)
prometheus 最全面的书籍推荐
摘要:https://yunlzheng.gitbook.io/prometheus-book/
阅读全文
posted @
2019-04-15 11:13
凯文队长
阅读(2966)
评论(0)
推荐(0)
prometheus和alertmanager热重启
摘要:# prometheus热重启 prometheus启动命令添加参数 --web.enable-lifecycle 然后热重启:curl -XPOST http://localhost:9090/-/reload # alertmanager热重启 curl -XPOST http://localh
阅读全文
posted @
2019-03-18 14:51
凯文队长
阅读(9982)
评论(0)
推荐(0)
prometheus告警配置注意事项
摘要:global: scrape_interval: 15s # Set the scrape interval to every 15 seconds. Default is every 1 minute. evaluation_interval: 15s # Evaluate rules every
阅读全文
posted @
2019-03-14 18:07
凯文队长
阅读(1276)
评论(0)
推荐(0)
prometheus函数
摘要:PromQL基础 http_request_total{} 瞬时向量表达式,选择当前最新的数据 http_request_total{}[5m] 区间向量表达式,选择以当前时间为基准,5分钟内的数据 http_request_total{} offset 5m http_request_total{
阅读全文
posted @
2019-03-11 09:20
凯文队长
阅读(4528)
评论(0)
推荐(0)
prometheus远程连接m3db实现存储
摘要:如果是prometheus server配置文件添加如下: 如果是prometheus-operator里的prometheus资源添加如下 remoteRead: - url: "http://m3coordinator.m3db.svc.cluster.local:7201/api/v1/pro
阅读全文
posted @
2019-01-10 17:43
凯文队长
阅读(3093)
评论(2)
推荐(0)
nginx-exporter安装使用
摘要:一、没有vts的启动方式 #nginx_exporter -telemetry.address=:9113 -nginx.scrape_uri="http://127.0.0.1:10000/nginx_status #nginx_exporter -telemetry.address=:9113
阅读全文
posted @
2018-12-13 15:47
凯文队长
阅读(3711)
评论(0)
推荐(0)
consul总结
摘要:一、介绍 @raft server节点之间的数据一致性保证,一致性协议使用的是raft,而zookeeper用的paxos,etcd采用的也是taft。 @服务发现协议 consul采用http和dns协议,etcd只支持http @服务注册 consul支持两种方式实现服务注册,一种是通过cons
阅读全文
posted @
2018-12-11 10:39
凯文队长
阅读(1374)
评论(0)
推荐(0)
prometheus-operator 详细总结(helm一键安装)
摘要:一、介绍prometheus-operator 二、查看配置rbac授权 三、helm安装prometheus-operator 四、配置监控k8s组件 五、granafa添加新数据源 六、监控mysql七、alertmanager配置 最后、卸载prometheus-operator新版、变动 一
阅读全文
posted @
2018-12-10 16:10
凯文队长
阅读(15386)
评论(2)
推荐(0)
公告