Prometheus 部署 +grafana + 报警 + 邮箱

环境:

服务器A:prometheus

服务器B:被监控端

软件:

标红的传到prometheus端,其余的传到被监控端

安装前时间同步:否则会出错

 

 解决就是时间同步:

[root@localhost ~]# yum -y install ntpdate
[root@localhost ~]# ntpdate cn.pool.ntp.org  

 安装prometheus :

[root@192 ~]# cd /usr/local/src/
[root@192 src]# ll
总用量 142600
-rw-r--r--. 1 root root 25710888 8月   5 19:47 alertmanager-0.21.0.linux-amd64.tar.gz
-rw-r--r--. 1 root root 54991977 8月   5 19:47 grafana-5.4.2-1.x86_64.rpm
-rw-r--r--. 1 root root 65312139 8月   5 19:47 prometheus-2.20.0.linux-amd64.tar.gz
[root@192 src]# tar zxf prometheus-2.20.0.linux-amd64.tar.gz 
[root@192 src]# mkdir /usr/local/prometeus
[root@192 src]# mv prometheus-2.20.0.linux-amd64/* /usr/local/prometeus/
[root@192 src]# cd /usr/local/prometeus/
[root@192 prometeus]# ls 
console_libraries  consoles  LICENSE  NOTICE  prometheus  prometheus.yml  promtool  tsdb
[root@192 prometeus]# ./prometheus  #前台启动

[root@192 prometeus]# nohup ./prometheus &   #后台启动 生成nohup.out文件

[root@192 prometeus]# ll
总用量 153588
drwxr-xr-x. 2 3434 3434       38 7月  23 05:00 console_libraries
drwxr-xr-x. 2 3434 3434      173 7月  23 05:00 consoles
drwxr-xr-x. 4 root root       70 8月   5 20:12 data
-rw-r--r--. 1 3434 3434    11357 7月  23 05:00 LICENSE
-rw-------. 1 root root     2374 8月   5 20:13 nohup.out
-rw-r--r--. 1 3434 3434     3420 7月  23 05:00 NOTICE
-rwxr-xr-x. 1 3434 3434 90933367 7月  23 02:53 prometheus
-rw-r--r--. 1 3434 3434      926 7月  23 05:00 prometheus.yml
-rwxr-xr-x. 1 3434 3434 51151585 7月  23 02:55 promtool
-rwxr-xr-x. 1 3434 3434 15159115 7月  23 02:56 tsdb
[root@192 prometeus]# tailf nohup.out  #实时打印日志
[root@192 prometeus]# vim prometheus.yml
alerting:
  alertmanagers:
  - static_configs:
    - targets:
      # - alertmanager:9093   #打开报警

rule_files:
  # - "first_rules.yml"
  # - "second_rules.yml"        #报警规则

- job_name: 'prometheus'

    # metrics_path defaults to '/metrics'
    # scheme defaults to 'http'.

    static_configs:
    - targets: ['localhost:9090']  #监控本机

- job_name: 'node_exporter'

    # metrics_path defaults to '/metrics'
    # scheme defaults to 'http'.

    static_configs:
    - targets: ['192.168.177.142:9100']  #监控被监控端  

  

 被监控端:

[root@192 ~]# cd /usr/local/src/
[root@192 src]# ll
总用量 16388
-rw-r--r--. 1 root root 7121565 8月   5 19:47 mysqld_exporter-0.12.1.linux-amd64.tar.gz
-rw-r--r--. 1 root root  134391 8月   5 19:47 mysql_rev1.json
-rw-r--r--. 1 root root 9520728 8月   5 19:47 node_exporter-1.0.1.linux-amd64.tar.gz
[root@192 src]# tar zxf node_exporter-1.0.1.linux-amd64.tar.gz 
[root@192 src]# mkdir /usr/local/node_exporter
[root@192 src]# mv node_exporter-1.0.1.linux-amd64 /usr/local/node_exporter/
[root@192 src]# cd /usr/local/node_exporter/
[root@192 node_exporter]# ll
总用量 0
drwxr-xr-x. 2 3434 3434 56 6月  16 21:19 node_exporter-1.0.1.linux-amd64
[root@192 node_exporter]# cd node_exporter-1.0.1.linux-amd64/
[root@192 node_exporter-1.0.1.linux-amd64]# ll
总用量 19216
-rw-r--r--. 1 3434 3434    11357 6月  16 21:19 LICENSE
-rwxr-xr-x. 1 3434 3434 19657731 6月  16 20:44 node_exporter
-rw-r--r--. 1 3434 3434      463 6月  16 21:19 NOTICE
[root@192 node_exporter-1.0.1.linux-amd64]# ./node_exporter #启动服务前台

  

web检测:192.168.177.252:9090

 

 

 

查看数据指标

 

 

 下面要结合grafana来进行监控:

安装grafana

[root@192 src]# rpm -ivh --nodeps grafana-5.4.2-1.x86_64.rpm  #会有依赖 加上--nodeps
[root@192 src]# systemctl daemon-reload
[root@192 src]# systemctl restart grafana-server
[root@192 src]# systemctl status grafana-server 
● grafana-server.service - Grafana instance
   Loaded: loaded (/usr/lib/systemd/system/grafana-server.service; disabled; vendor preset: disabled)
   Active: active (running) since 三 2020-08-05 21:00:49 CST; 16s ago 

 web访问:ip+3000

 

 

之后改密码:自己随便改:

 

 

 

 

 

 

 

 

 监控的本机

 

 

 

 

 

 

 

 

 保存

 

 

 

 监控被监控端

 

 

 插入与上面重复一样:

 

 

 

 报警机制的选择:

[root@192 prometeus]# vim prometheus.yml 
[root@192 prometeus]# vim first_rules.yml
groups:
- name: node_exporter_1 alert rule
  rules:
  - alert: node_exporter_1Down
    expr: sum(up{job="node_exporter_1"}) == 0
    for: 10s
    labels:
      severity: critical
[root@192 prometeus]# vim prometheus.yml
rule_files: 
- "first_rules.yml" 拖进来
# - "first_rules.yml"
# - "second_rules.yml" ~

 停掉监控端查看:

 

 

 

 

 报警机制:

[root@192 src]# ll
总用量 142600
-rw-r--r--. 1 root root 25710888 8月   5 19:47 alertmanager-0.21.0.linux-amd64.tar.gz
-rw-r--r--. 1 root root 54991977 8月   5 20:58 grafana-5.4.2-1.x86_64.rpm
drwxr-xr-x. 2 3434 3434        6 8月   5 20:12 prometheus-2.20.0.linux-amd64
-rw-r--r--. 1 root root 65312139 8月   5 19:47 prometheus-2.20.0.linux-amd64.tar.gz
[root@192 src]# tar zxf alertmanager-0.21.0.linux-amd64.tar.gz 
[root@192 src]# mkdir /usr/local/alertmanager
[root@192 src]# mv alertmanager-0.21.0.linux-amd64/* /usr/local/alertmanager/
[root@192 src]# cd /usr/local/alertmanager/
[root@192 alertmanager]# ll
总用量 51644
-rwxr-xr-x. 1 3434 3434 28871879 6月  17 16:54 alertmanager
-rw-r--r--. 1 3434 3434      380 6月  17 17:34 alertmanager.yml
-rwxr-xr-x. 1 3434 3434 23987848 6月  17 16:55 amtool
-rw-r--r--. 1 3434 3434    11357 6月  17 17:34 LICENSE
-rw-r--r--. 1 3434 3434      457 6月  17 17:34 NOTICE
[root@192 alertmanager]# vim alertmanager.yml 
[root@192 alertmanager]# vim alertmanager.yml 
[root@192 alertmanager]# ./alertmanager 
[root@192 alertmanager]# cat alertmanager.yml 
global:
  resolve_timeout: 5m
  smtp_smarthost: 'smtp.qq.com:465'
  smtp_from: 'QQ号@qq.com'
  smtp_auth_username: 'QQ号@qq.com'
  smtp_auth_password: '验证码'

route:
  group_by: ['alertname']
  group_wait: 10s
  group_interval: 10s
  repeat_interval: 10s
  receiver: 'mail-receiver'
receivers:
- name: 'mail-receiver'
  email_configs:
  - to: 'QQ号@qq.com'
inhibit_rules:
  - source_match:
      severity: 'critical'
    target_match:
      severity: 'warning'
    equal: ['alertname', 'dev', 'instance']

  

 

 

 

 可以调整报警规则,来进行检测,收到邮箱就为成功!!!

  

 

posted @ 2020-08-05 23:06  luowendy  阅读(409)  评论(0编辑  收藏  举报