2020年5月13日

基于VictoriaMetrics的prometheus 集群监控报警方案

摘要: VictoriaMetrics 是一个不错的prometheus 集群方案,同时也提供了比较全的周边工具,同时社区也很活跃,以下 是一个简单的集成,后续落地实施踩坑 参考方案图 主要是基于VictoriaMetrics提供的周边工具做的集成 参考说明 主要是各点的一些说明,详细的可以看相关资料 说明 阅读全文

posted @ 2020-05-13 16:01 荣锋亮 阅读(1892) 评论(0) 推荐(0)

VictoriaMetrics vmalert 重启状态的处理

摘要: 默认vmalert 是不存储状态的,但是为了方便vmalert支持了一些配置 状态持久化 我们可以通过配置-remotewite 写报警状态到支持remote write 协议的存储(很多,VictoriaMetrics,一些adadter。。。) 状态恢复 我们可以通过-remoteread 配置 阅读全文

posted @ 2020-05-13 11:40 荣锋亮 阅读(527) 评论(0) 推荐(0)

karma prometheus alertmanager dashboard简单试用

摘要: 官方提供了一个简单的all-in-one 的dockerfile 我们可以学习下karma,了解下karma的处理机制,同时在这个all-in-one 中 也还包含了kthxbye一个方便的报警确认进程,整个项目基于supervisord运行(当然这个也是大家基于all-in-one容器的一个套路) 阅读全文

posted @ 2020-05-13 11:37 荣锋亮 阅读(1232) 评论(0) 推荐(0)

kthxbye一种解决prometheus alertmanager 报警确认的守护进程

摘要: 一些问题 当前,在Alertmanager中触发新警报时,有两种选择: 解决警报时,使其处于活动状态 使此警报静音一段时间 这在小型环境中效果很好,但可能会导致大型团队出现问题: 如果您将警报保持处于活动状态,则需要以某种方式传达您正在处理它的信息,否则团队中的其他人也可能会开始处理它,或者(更糟糕 阅读全文

posted @ 2020-05-13 10:50 荣锋亮 阅读(854) 评论(0) 推荐(0)

karma 一个不错的prometheus alertmanager dashboard

摘要: 默认的alertmanager已经包含了ui,但是比较简单,karma是一个不错的alert dashboard,核心基于golang开发,ui 使用react编写 运行 参考命令 ALERTMANAGER_URI=https://alertmanager.example.com karma or 阅读全文

posted @ 2020-05-13 09:43 荣锋亮 阅读(961) 评论(0) 推荐(0)

导航