随笔分类 -  Prometheus课程

视频教程总结
摘要:客观的来说 每⼀款监控⼯具 都有⾃⼰的优点缺点 并不是越 新的就⼀定越好 就拿 nagios 和 prometheus来说,虽然nagios它的年头很⽼了 ⽽且很多功能已经⽐较落后了 但是 nagios即便在今天 , 运维⼯作中 依然有它独⽴存在的意 义 ⽐如说: 我之前所在的⼀家公司,我们核⼼监控 阅读全文
posted @ 2020-07-28 16:30 minseo 阅读(263) 评论(0) 推荐(0) 编辑
摘要:本讲内容 pagerduty 注册新账号 pagerduty 创建新的service pagerduty 报警信息的设置 注册账号 https://www.pagerduty.com/sign-up/ 免费试用14天 注意:注册会获得一个自定义的二级域名用于管理,如果出现subdomain unde 阅读全文
posted @ 2020-07-28 13:37 minseo 阅读(951) 评论(0) 推荐(0) 编辑
摘要:本讲内容 Prometheus+grafana TCP等待链接监控 企 业实际使⽤ 使⽤公式 count_netstat_wait_connections ⼀个key⾜够了 gauge 数据来源: pushgateway + 脚本 其实 node_exporter 也有对应的 tcp wait 不过 阅读全文
posted @ 2020-07-27 15:07 minseo 阅读(723) 评论(0) 推荐(0) 编辑
摘要:本讲主要内容 prometheus+grafana 企业CPU监控 真实案例 prometheus+grafana 企业内存监控 真实案例 prometheus+grafana 企业硬盘/IO监控 真实案例 prometheus+grafana 企业⽹络传输 真实案例 (一)prometheus+g 阅读全文
posted @ 2020-07-27 14:45 minseo 阅读(406) 评论(0) 推荐(0) 编辑
摘要:本讲内容 Grafana 这款软件的介绍 Grafana 下载/安装/配置/运⾏ Grafana 设置数据源 连接prometheus_server Grafana 建⽴ Dashboard Grafana 创建 graph 成图 Grafana graph进阶内容 Grafana Dashboar 阅读全文
posted @ 2020-07-27 11:48 minseo 阅读(699) 评论(0) 推荐(0) 编辑
摘要:(一)编写一个exporter流程 ⾸先 不同于pushgateway, exporter是⼀个独⽴运⾏ 的采集程序 其中的功能需要有这三个部分 1) ⾃⾝是HTTP 服务器,可以响应 从外发过来的 HTTP GET 请求 2) ⾃⾝需要运⾏在后台,并可以定期触发 抓取本地的监控 数据 3) 返回给 阅读全文
posted @ 2020-07-27 09:45 minseo 阅读(305) 评论(0) 推荐(0) 编辑
摘要:第十讲内容 • pushgateway 的介绍 • pushgateway 的安装和运⾏和配置 • ⾃定义编写脚本的⽅法 发送pushgateway 采集 • 使⽤pushgateway的优缺点 (⼀) pushgateway 的介绍 pushgateway 是另⼀种采⽤被动推送的⽅式(⽽不是exp 阅读全文
posted @ 2020-07-24 18:07 minseo 阅读(447) 评论(0) 推荐(0) 编辑
摘要:第九讲内容如下 1)prometheus服务端安装和后台稳定运行 2)prometheus服务端配置文件写法 3)node_exporter安装和后台运行 4)node_exporter观察和采集数据 5)prometheus查询采集回来的各种数据 6) 使用我们之前学过的prometheus命令行 阅读全文
posted @ 2020-07-24 10:33 minseo 阅读(807) 评论(0) 推荐(0) 编辑
摘要:本讲内容 prometheus命令行格式 rate函数使用 increase函数使用 sum函数使用 (一)prometheus命令行格式 我们选一个新的key来做讲解 count_netstat_wait_connections #TCP wait_connect数 这个key值不少我们熟悉的no 阅读全文
posted @ 2020-07-23 17:47 minseo 阅读(2002) 评论(0) 推荐(0) 编辑
摘要:上篇留下一个比较难的计算CPU使用率的公式 (1-((sum(increase(node_cpu{mode="idle"}[1m]))by(instance))/(sum(increase(node_cpu[1m]))by(instance))))*100 拆分并解释这个公式 举一反三计算CPU其他 阅读全文
posted @ 2020-07-23 11:07 minseo 阅读(749) 评论(0) 推荐(0) 编辑
摘要:prometheus官网下载 prometheus开始安装 prometheus启动运行 prometheus基本配置文件讲解 安装第一个个exporter -》node_exporter prometheus连接exporter获取数据 prometheus命令行入门 时间同步 ntpdate t 阅读全文
posted @ 2020-07-22 13:44 minseo 阅读(562) 评论(0) 推荐(0) 编辑
摘要:prometheus监控中,对于采集过来的数据统一称为metrics数据 metrics是一种对采样数据的总称(metrics并不代表某一种具体的数据格式 是一种对于度量计算单位的抽象) metrics数据类型 Gauges 最简单的度量指标,只有一个简单的返回值,或者叫瞬时状态,例如我们度量一个待 阅读全文
posted @ 2020-07-22 08:24 minseo 阅读(1125) 评论(0) 推荐(0) 编辑
摘要:1)prometheus是什么 prometheus是一个开源系统监控和报警的工具集合,由SoundCloud创建,自从2012年诞生之后,至今已经有许多公司和组织开始使用它,这个开源项目拥有大量积极参与开发和建设的研发人员。目前已经是一个独立运行的,开源的 由各公司自行维护的监控项目。为了让项目更 阅读全文
posted @ 2020-07-21 11:19 minseo 阅读(573) 评论(0) 推荐(0) 编辑
摘要:1)介绍企业目前在监控上的各个发展阶段 早期无监控 全部都是人工盯着 服务器操作系统网络等 中前期 半自动脚本监控 利用shell脚本这种类似的形式,做最简单的监控脚本 循环登录机器 查看一些状态 之后人工记录 无报警 无自动化 无监控图形 中期企业 自动化程序/脚本/软件/监控 脚本更新换代,开始 阅读全文
posted @ 2020-07-21 10:13 minseo 阅读(340) 评论(0) 推荐(0) 编辑
摘要:Prometheus构架图 监控和报警 Prometheus优势 •监控数据的精细程度 绝对的第⼀ 可以精确到 1~5秒的采集精度 4 5分钟 理想的状态 我们来算算采集精度 (存储 性能)• 集群部署的速度 监控脚本的制作 (指的是熟练之后) ⾮常快速 ⼤⼤缩短监控的搭建时间成本• 周边插件很丰富 阅读全文
posted @ 2020-04-03 17:05 minseo 阅读(364) 评论(0) 推荐(0) 编辑