会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
IT运维监控/可观测性
运维监控、运维自动化、Prometheus、Nightingale、Categraf
博客园
首页
新随笔
联系
订阅
管理
2025年10月28日
夜莺监控设计思考(三)时序库、agent 的一些设计考量
摘要: 这将是一个系列,讲解 夜莺监控 的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。 本系列其他文章: 夜莺监控设计思考(一)项目定位、组件思考、单进程多进程选择、高可用设计 夜莺监控设计思考(二)边缘架构的缘起和设计 本篇主要回答: 夜莺和时序库对接的设计逻辑 夜莺和 agent 对接的设
阅读全文
posted @ 2025-10-28 20:20 IT运维监控
阅读(0)
评论(0)
推荐(0)
2025年10月16日
夜莺监控设计思考(二)边缘机房架构思考
摘要: 这将是一个系列,讲解 夜莺监控 的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。 本系列其他文章: 夜莺监控设计思考(一)项目定位、组件思考、单进程多进程选择、高可用设计 下面开始第2篇。 上一篇我们遗留了一个话题,就是如果贵司有多个数据中心,而且数据中心之间网络链路较差,此时应该怎么办
阅读全文
posted @ 2025-10-16 19:48 IT运维监控
阅读(187)
评论(0)
推荐(1)
2025年10月14日
利用 OpenTelemetry 集成 JMX 监控
摘要: JMX 是什么? JMX 是 “Java Management Extensions” 的缩写,中文通常称为 “Java 管理扩展”。它是 Java 平台提供的一套标准框架,用于对 Java 应用程序、设备、系统资源进行监控和管理。 JMX 的核心作用包括: 监控 Java 程序运行状态(如内存使用
阅读全文
posted @ 2025-10-14 15:50 IT运维监控
阅读(192)
评论(0)
推荐(2)
夜莺监控设计思考(一)整体定位、架构设计、单进程多进程选择、高可用设计
摘要: 这将是一个系列,讲解 夜莺监控 的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。 整体定位 了解一个开源项目,最应该了解的就是其定位,或者说它要解决的问题域。 夜莺的定位就是四个字:告警引擎。夜莺对接多种数据源(比如 Prometheus、VictoriaMetrics、MySQL、Cl
阅读全文
posted @ 2025-10-14 09:33 IT运维监控
阅读(310)
评论(0)
推荐(2)
2025年9月1日
夜莺监控新版表格配置图文讲解
摘要: 夜莺监控从 8.3 版本开始引入了新版的表格,力争对齐 Grafana(Grafana 积累了多年,确实太强了),本文图文并茂手把手教你配置一个 Table 仪表盘出来,用于展示机器列表,当然了,交换机、MySQL 实例等其他监控对象,也可以通过这个方式展示。 先看效果 JSON 文件:https:
阅读全文
posted @ 2025-09-01 15:42 IT运维监控
阅读(376)
评论(0)
推荐(0)
2025年8月26日
利用 OpenTelemetry 建设尾部采样
摘要: 可观测性已成为维护系统健康和性能的关键要素。虽然传统的采样方法曾发挥过作用,但尾部采样的出现代表了我们处理追踪数据收集与分析方式的范式转变。这种智能采样策略正在彻底改变各组织处理遥测数据的方式,在优化存储成本和系统性能的同时,以前所未有的精度捕获最有价值的追踪数据。 理解采样格局 在深入研究尾部采样
阅读全文
posted @ 2025-08-26 16:20 IT运维监控
阅读(71)
评论(0)
推荐(0)
2025年8月25日
开源夜莺里如何引用标签和注解变量
摘要: 今天遇到开源社区咨询:夜莺里如何引用标签和注解变量?这个问题如果通读文档,其实也能找到答案,不过相关知识是散落在各处的,这里就集中说一下,方便大家查阅。 哪里可以引用标签和注解变量 主要有两个地方引用标签和注解变量: 告警规则 告警规则的备注、附加信息,可以引用标签变量。对于不同的告警规则生成的告警
阅读全文
posted @ 2025-08-25 12:04 IT运维监控
阅读(189)
评论(0)
推荐(0)
2025年8月21日
Grafana侧重可视化,那多数据源告警呢?
摘要: 在监控、可观测性领域,Grafana 应该是使用最为广泛的开源项目了,Grafana 可以对接多种数据源,对其中的数据做可视化分析。 实际上,Grafana 也可以配置告警规则,只是设计上相对拧巴,用户用的比较少。因为大部分情况下,告警都是使用 Prometheus,所以用户就直接在 Prometh
阅读全文
posted @ 2025-08-21 15:35 IT运维监控
阅读(96)
评论(0)
推荐(0)
2025年8月18日
可观测性体系建设五步心法:明业务、立规范、采数据、显特征、获洞见
摘要: 笔者做监控 11 年,在可观测性领域创业 4 年,与各类客户沟通较多,发现很多企业想要建设可观测性体系,但是不得章法,我把整个建设过程做了一个简单总结,梳理一下其中的脉络,希望对你有所启发。 整个可观测性体系建设,我总结为五个步骤: 明业务 立规范 采数据 显特征 获洞见 下面挨个说明,可观测性体系
阅读全文
posted @ 2025-08-18 08:48 IT运维监控
阅读(76)
评论(0)
推荐(0)
2025年8月15日
Prometheus 监控 Kubernetes Cluster 最新极简教程
摘要: Kubernetes 是在生产中运行容器化工作负载的最流行的编排器。它为您提供了一套完整的工具,用于部署、扩展和管理容器。 不过,仅靠 Kubernetes 不足以运维应用程序。您还需要了解集群利用率、性能和发生的任何错误。 Prometheus 是一个开源监控系统,它收集时序指标到 TSDB,让您
阅读全文
posted @ 2025-08-15 15:29 IT运维监控
阅读(291)
评论(0)
推荐(0)
下一页
公告