摘要: Prometheus 编写告警规则案例 注:确保alertmanager配置完毕! 1、创建编辑文件:vim /usr/local/prometheus/rules/node.yml 2、检查并重新加载配置文件 3、控制台查看配置 4、调整阀值测试报警 调整到1%。 把配置文件的80改成1就行 - 阅读全文
posted @ 2019-08-02 17:24 kevin.Xiang 阅读(15075) 评论(2) 推荐(0)
摘要: Prometheus 一条告警的触发流程、等待时间 报警处理流程如下:1. Prometheus Server监控目标主机上暴露的http接口(这里假设接口A),通过上述Promethes配置的'scrape_interval'定义的时间间隔,定期采集目标主机上监控数据。2. 当接口A不可用的时候, 阅读全文
posted @ 2019-08-02 17:20 kevin.Xiang 阅读(11119) 评论(0) 推荐(0)
摘要: Prometheus 告警收敛 告警面临最大问题,是警报太多,相当于狼来了的形式。收件人很容易麻木,不再继续理会。关键的告警常常被淹没。在一问题中,alertmanger在一定程度上得到很好解决。 Prometheus成功的把一条告警发给了Altermanager,而Altermanager并不是简 阅读全文
posted @ 2019-08-02 17:16 kevin.Xiang 阅读(9859) 评论(0) 推荐(0)
摘要: Prometheus 告警分配到指定接收组 route属性用来设置报警的分发策略,它是一个树状结构,按照深度优先从左向右的顺序进行匹配。 主要处理流程:1. 接收到Alert,根据labels判断属于哪些Route(可存在多个Route,一个Route有多个Group,一个Group有多个Alert 阅读全文
posted @ 2019-08-02 17:10 kevin.Xiang 阅读(4507) 评论(0) 推荐(0)
摘要: Prometheus 告警状态了解 一旦这些警报存储在Alertmanager,它们可能处于以下任何状态: · Inactive:这里什么都没有发生。 · Pending:已触发阈值,但未满足告警持续时间(即rule中的for字段) · Firing:已触发阈值且满足告警持续时间。警报发送到Noti 阅读全文
posted @ 2019-08-02 17:08 kevin.Xiang 阅读(4129) 评论(0) 推荐(1)
摘要: Prometheus 监控目标运行状态并邮件通知 邮件服务安装:https://www.cnblogs.com/xiangsikai/p/9809654.html 告警规则示例:https://prometheus.io/docs/prometheus/latest/configuration/al 阅读全文
posted @ 2019-08-02 17:06 kevin.Xiang 阅读(3029) 评论(0) 推荐(0)
摘要: Prometheus 与 Alertmanager 通信 1、编辑Prometheus配置文件配置连接地址:vim prometheus.yml 2、编辑Prometheus配置文件配置,开启告警配置文件:vim prometheus.yml 3、创建告警规则目录 4、检查并重新加载配置文件 阅读全文
posted @ 2019-08-02 17:02 kevin.Xiang 阅读(1601) 评论(1) 推荐(0)
摘要: Prometheus 安装Alertmanager集成 # 下载地址 地址1:https://prometheus.io/download/ 地址2:https://github.com/prometheus/alertmanager/releases 安装部署 Alertmanager 1、下载后 阅读全文
posted @ 2019-08-02 17:00 kevin.Xiang 阅读(3314) 评论(0) 推荐(0)
摘要: Prometheus 之 Alertmanager 介绍详解 告警无疑是监控中非常重要的环节,虽然监控数据可视化了,也非常容易观察到运行状态。但我们很难做到时刻盯着监控,所以程序来帮巡检并自动告警,这个程序是幕后英雄,保障业务稳定性就靠它了。 前面讲到过Prometheus的报警功能主要是利用Ale 阅读全文
posted @ 2019-08-02 16:55 kevin.Xiang 阅读(4296) 评论(0) 推荐(0)
摘要: Prometheus 监控Mysql服务器及Grafana可视化、 mysql_exporter:用于收集MySQL性能信息。 使用版本 mysqld_exporter 0.11.0 官方地址 使用文档:https://github.com/prometheus/mysqld_exporter 图标 阅读全文
posted @ 2019-08-02 16:53 kevin.Xiang 阅读(24682) 评论(1) 推荐(6)
摘要: Prometheus 监控Docker服务器及Granfanna可视化 cAdvisor(Container Advisor)用于收集正在运行的容器资源使用和性能信息。 使用Prometheus监控cAdvisor cAdvisor将容器统计信息公开为Prometheus指标。 默认情况下,这些指标 阅读全文
posted @ 2019-08-02 16:40 kevin.Xiang 阅读(5945) 评论(0) 推荐(0)
摘要: Prometheus Grafana可视化展示Linux资源使用率 Grfana官方仪表盘下载:https://grafana.com/dashboards 数据源推荐:https://grafana.com/dashboards/9276 使用Grafana创建自定义监控Linux系统1、创建仪表 阅读全文
posted @ 2019-08-02 16:26 kevin.Xiang 阅读(3592) 评论(0) 推荐(0)
摘要: Prometheus 安装Grafana与Prometheus集成 Grafana是一个开源的度量分析和可视化系统。 下载地址:https://grafana.com/grafana/download Grafana支持查询普罗米修斯。自Grafana 2.5.0(2015-10-28)以来,包含了 阅读全文
posted @ 2019-08-02 16:25 kevin.Xiang 阅读(2462) 评论(0) 推荐(0)
摘要: Prometheus PromSQL 获取系统服务运行状态 使用systemd收集器:--collector.systemd.unit-whitelist=".+" 从systemd中循环正则匹配单元--collector.systemd.unit-whitelist="(docker|sshd|n 阅读全文
posted @ 2019-08-02 16:19 kevin.Xiang 阅读(4081) 评论(0) 推荐(1)
摘要: Prometheus PromSQL 常用资源 PromSQL 使用 运算乘:*除:/加:+减:- 函数 sum() 函数:求出找到所有value的值 irate() 函数:统计平均速率 by (标签名) 范围匹配 # 5分钟之内[5m] 其他用法 被监控指标的状态、1为正常、0为不正常 PromS 阅读全文
posted @ 2019-08-02 16:13 kevin.Xiang 阅读(7710) 评论(0) 推荐(0)
摘要: Prometheus 监控linux服务器 node_exporter:用于*NIX系统监控,使用Go语言编写的收集器。 使用版本 node_exporter 0.17.0 相关文档 使用文档:https://prometheus.io/docs/guides/node-exporter/ GitH 阅读全文
posted @ 2019-08-02 16:08 kevin.Xiang 阅读(10559) 评论(0) 推荐(0)
摘要: Prometheus 基于文件的服务发现 官方文档:https://github.com/prometheus/prometheus/tree/master/discovery 服务发现支持: endpoints,ingress,kubernetes,node,pod,service。Prometh 阅读全文
posted @ 2019-08-02 16:01 kevin.Xiang 阅读(4136) 评论(0) 推荐(0)
摘要: Prometheus 监控实例 一、Prometheus 根据标签聚合总CPU使用率 1、主机添加标签(可在多个主机内添加相同标签实现聚合):vim prometheus.conf 2、检查配置文件 3、配置文件重新生效 4、监控平台:使用promSQL查询指定标签内主机的所有CPU总和 二、Pro 阅读全文
posted @ 2019-08-02 15:57 kevin.Xiang 阅读(12917) 评论(0) 推荐(0)
摘要: Prometheus 重新标签 允许在采集之前对任何目标及其标签进行修改 • 重命名标签名 • 删除标签 • 过滤目标 action:重新标签动作 replace:默认,通过regex匹配source_label的值,使用replacement来引用表达式匹配的分组 keep:删除regex与连接不 阅读全文
posted @ 2019-08-02 15:42 kevin.Xiang 阅读(4284) 评论(0) 推荐(0)
摘要: Prometheus 配置采集目标 1、根据配置的任务(job)以http/s周期性的收刮(scrape/pull)2、指定目标(target)上的指标(metric)。目标(target)3、可以以静态方式或者自动发现方式指定。Prometheus将收刮(scrape)的指标(metric)保存在 阅读全文
posted @ 2019-08-02 15:34 kevin.Xiang 阅读(5886) 评论(0) 推荐(2)