Prometheus部署+Grafana可视化+Alertmanager邮件告警并重启服务

选型

我们单位自己开发的软件平台，需要自己来运维，正所谓不监控无运维，等着甲方来通知你服务挂了是一件很尴尬的事情。

在软件选型方面，监控工具简直是太多了，每个软件都有自己的领地，有的是偏向跟踪分析、有的是报警的、有的是日志收集、有的只监控硬件。

Prometheus、Nagios、Datadog、skywalking、zabbix、elk、SigNoz、Zipkin、Grafana、New Relic、Cacti、Munin……

因为单位将上线K8s，所以打算使用Prometheus。我们网管用zabbix，这个也挺好，功能丰富，拿来即用。

需求

我的需求如下：

1. 监控arcserver地图服务是否挂掉

2. 如果挂掉了，就重启服务，并通知我重启啦

Prometheus部署

Prometheus通过提供不同的exporter组件监控不同的目标。监测HTTP服务健康需要采用blackbox_exporter组件。

Prometheus各种组件都是单独运行的，这种原子化的灵活组合更符合云原生的理念。

首先我们配置 prometheus.yml

global:
scrape_interval: 1s
scrape_configs:
　　job_name: iarc-ping
metrics_path: /arc
params:
module: [iarc]
static_configs:
　　targets:　　"192.168.200.175"
relabel_configs:
　　source_labels: [__address__]
target_label: __param_target
　　source_labels: [__param_target]
target_label: instance
　　target_label: __address__
replacement: 127.0.0.1:9115

posted @ 2024-02-01 15:26 浦金宏阅读(82) 评论(0) 收藏举报

刷新页面返回顶部

红的工作与禅

——日积月累，终有收获。

Prometheus部署+Grafana可视化+Alertmanager邮件告警并重启服务

选型

需求

Prometheus部署

公告