摘要: 1. 高可用性 单台的 Prometheus 存在单点故障的风险,随着监控规模的扩大,Prometheus 产生的数据量也会非常大,性能和存储都会面临问题。毋庸置疑,我们需要一套高可用的 Prometheus 集群。 1. 可用性 我们知道 Prometheus 是采用的 Pull 机制获取监控数据 阅读全文
posted @ 2023-03-15 16:00 wanghhhh 阅读(250) 评论(0) 推荐(0)
摘要: 1. promethus配置 1. 配置 -- 2. 更新 热更新: # 配置文件添加配置 --web.enable-lifecycle reload: curl -XPOST http://10.10.1.162:9090/-/reload 2. alertmanagers配置 告警配置参考 ht 阅读全文
posted @ 2023-03-15 11:01 wanghhhh 阅读(48) 评论(0) 推荐(0)