随笔分类 -  夜莺监控

摘要:这将是一个系列,讲解 夜莺监控 的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。 本系列其他文章: 夜莺监控设计思考(一)项目定位、组件思考、单进程多进程选择、高可用设计 夜莺监控设计思考(二)边缘架构的缘起和设计 夜莺监控设计思考(三)时序库、agent 的一些设计考量 夜莺监控设计思 阅读全文
posted @ 2025-10-31 16:08 IT运维监控 阅读(118) 评论(0) 推荐(0)
摘要:这将是一个系列,讲解 夜莺监控 的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。 本系列其他文章: 夜莺监控设计思考(一)项目定位、组件思考、单进程多进程选择、高可用设计 夜莺监控设计思考(二)边缘架构的缘起和设计 夜莺监控设计思考(三)时序库、agent 的一些设计考量 本篇聊聊夜莺里 阅读全文
posted @ 2025-10-29 11:15 IT运维监控 阅读(210) 评论(0) 推荐(0)
摘要:这将是一个系列,讲解 夜莺监控 的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。 本系列其他文章: 夜莺监控设计思考(一)项目定位、组件思考、单进程多进程选择、高可用设计 夜莺监控设计思考(二)边缘架构的缘起和设计 本篇主要回答: 夜莺和时序库对接的设计逻辑 夜莺和 agent 对接的设 阅读全文
posted @ 2025-10-28 20:20 IT运维监控 阅读(178) 评论(0) 推荐(1)
摘要:这将是一个系列,讲解 夜莺监控 的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。 本系列其他文章: 夜莺监控设计思考(一)项目定位、组件思考、单进程多进程选择、高可用设计 下面开始第2篇。 上一篇我们遗留了一个话题,就是如果贵司有多个数据中心,而且数据中心之间网络链路较差,此时应该怎么办 阅读全文
posted @ 2025-10-16 19:48 IT运维监控 阅读(215) 评论(0) 推荐(1)
摘要:这将是一个系列,讲解 夜莺监控 的设计思考,可以理解为原理+最佳实践+产品设计时的折中取舍。 整体定位 了解一个开源项目,最应该了解的就是其定位,或者说它要解决的问题域。 夜莺的定位就是四个字:告警引擎。夜莺对接多种数据源(比如 Prometheus、VictoriaMetrics、MySQL、Cl 阅读全文
posted @ 2025-10-14 09:33 IT运维监控 阅读(368) 评论(0) 推荐(2)
摘要:夜莺监控从 8.3 版本开始引入了新版的表格,力争对齐 Grafana(Grafana 积累了多年,确实太强了),本文图文并茂手把手教你配置一个 Table 仪表盘出来,用于展示机器列表,当然了,交换机、MySQL 实例等其他监控对象,也可以通过这个方式展示。 先看效果 JSON 文件:https: 阅读全文
posted @ 2025-09-01 15:42 IT运维监控 阅读(497) 评论(0) 推荐(0)
摘要:今天遇到开源社区咨询:夜莺里如何引用标签和注解变量?这个问题如果通读文档,其实也能找到答案,不过相关知识是散落在各处的,这里就集中说一下,方便大家查阅。 哪里可以引用标签和注解变量 主要有两个地方引用标签和注解变量: 告警规则 告警规则的备注、附加信息,可以引用标签变量。对于不同的告警规则生成的告警 阅读全文
posted @ 2025-08-25 12:04 IT运维监控 阅读(224) 评论(0) 推荐(0)
摘要:对于 IT 的稳定性保障,越来越受到重视,据国外数据统计,监控、可观测性相关的支出大概占总体 IT 支出的 5%~8% 左右。CNCF 作为知名基金会,旗下最有名的项目当属 Kubernetes,其次两个重点项目 OpenTelemetry 和 Prometheus 都与监控、可观测性相关。 可观测 阅读全文
posted @ 2025-08-14 19:26 IT运维监控 阅读(512) 评论(0) 推荐(2)
摘要:Prometheus 体系貌似已经成为新时代的监控标准,运维出去找工作,很多公司都要求掌握 Prometheus 相关知识。 但是,Prometheus 实际在应用时,通常会遇到一个典型问题:告警规则管理问题。体现为: 想要把 Prometheus 能力开放给全公司各个团队自助服务。但是告警规则需要 阅读全文
posted @ 2025-08-10 11:04 IT运维监控 阅读(327) 评论(0) 推荐(0)
摘要:有朋友问:我是业务应用的 DEV 或 SRE,我的应用依赖了底层服务和基础设施,比如依赖基础网络、Kubernetes、MySQL、收银台服务,那这些基础服务如果出问题,我应该收告警吗?夜莺里有个订阅规则,是不是就是为此设计的? 本文讲讲笔者的个人理解,欢迎大家留言一起探讨实践经验。 首先,请大家看 阅读全文
posted @ 2025-07-24 15:27 IT运维监控 阅读(412) 评论(0) 推荐(0)
摘要:今天在北京举办了 第三届CCF·夜莺开源创新论坛 的线下大会,正式发布夜莺 V8 版本,一直在等待正式版再上生产的小伙伴们,可以升级啦! 先给大家贴几张照片,感受一下大会的盛况,再给大家介绍一下 V8 版本的主要更新 😎 首先由尊敬的 中国计算机学会开源发展委员会主任王怀民,为大会做了致辞。夜莺项 阅读全文
posted @ 2025-07-07 10:01 IT运维监控 阅读(365) 评论(0) 推荐(0)
摘要:夜莺监控发布了 v8.beta14 版本,这个版本是可以上生产的,强烈建议升级。正式版会在每年夜莺大会上发布,今年预计是 7.4 号。 下面快速介绍一下 v8.beta14 的主要更新。 beta14 重点更新 支持 Postgres 告警 又支持了一个新的告警数据源:Postgres,可以对 Po 阅读全文
posted @ 2025-06-24 08:21 IT运维监控 阅读(315) 评论(0) 推荐(0)
摘要:夜莺监控项目最核心的定位,是做一个告警引擎,支持多种数据源的告警。这个版本的更新主要是增加了对 MySQL 数据源的支持,进一步增强了夜莺在业务指标监控方面的能力。 之前版本的夜莺主要聚焦在 Prometheus、VictoriaMetrics、ElasticSearch 等传统监控数据源上,从上个 阅读全文
posted @ 2025-06-11 09:29 IT运维监控 阅读(141) 评论(0) 推荐(0)
摘要:这个版本来得迟了一些,主要是新功能加的多,下面简单介绍一下新功能,下下周也计划做一次直播讲解。 支持 ClickHouse 告警 夜莺最重要的定位是告警引擎,所以会持续增加各类数据源的告警支持,ClickHouse 之后还有 Doris、MySQL、Postgres 等。 开源版主要是支持告警,不会 阅读全文
posted @ 2025-06-04 08:55 IT运维监控 阅读(169) 评论(0) 推荐(0)
摘要:以防读者不了解夜莺,开头先做个介绍: 夜莺监控,英文名字 Nightingale,是一款侧重告警的监控类开源项目。类似 Grafana 的数据源集成方式,夜莺也是对接多种既有的数据源,不过 Grafana 侧重在可视化,夜莺是侧重在告警引擎。比如把 Prometheus、VictoriaMetric 阅读全文
posted @ 2025-03-31 10:33 IT运维监控 阅读(161) 评论(0) 推荐(0)
摘要:新版通知规则的介绍文章:夜莺监控巨大革新:抽象出通知规则,增强告警通知的灵活性 新版通知规则对接钉钉:夜莺监控 v8.0 新版通知规则 | 对接钉钉告警 新版通知规则对接企微:夜莺监控 v8.0 新版通知规则 | 对接企微告警 本文对背景信息不做额外描述了,大家一定要先看看上面的文章,原理类似。本文 阅读全文
posted @ 2025-03-17 10:41 IT运维监控 阅读(446) 评论(0) 推荐(0)
摘要:对新版本通知规则还不太了解的用户可以阅读文章:《夜莺监控巨大革新:抽象出通知规则,增强告警通知的灵活性》。下面我们将以企微通知为例,介绍如何使用新版通知规则来对接企微通知。 上图是通知规则对接企微通知的示意逻辑图。 在告警规则中配置查询语句做阈值判定,同时关联一个通知规则,即这个告警规则生成的所有的 阅读全文
posted @ 2025-03-13 14:32 IT运维监控 阅读(226) 评论(0) 推荐(0)
摘要:夜莺监控 v8 从 beta7 版本开始,抽象了通知规则的概念,极大提高了灵活性,本文介绍如何使用新版通知规则对接钉钉通知 阅读全文
posted @ 2025-03-07 15:48 IT运维监控 阅读(345) 评论(0) 推荐(0)
摘要:以防读者不了解夜莺,开头先做个介绍: 夜莺监控,英文名字 Nightingale,是一款侧重告警的监控类开源项目。类似 Grafana 的数据源集成方式,夜莺也是对接多种既有的数据源,不过 Grafana 侧重在可视化,夜莺是侧重在告警引擎。比如把 Prometheus、VictoriaMetric 阅读全文
posted @ 2025-03-06 10:42 IT运维监控 阅读(180) 评论(0) 推荐(0)
摘要:前言 夜莺类似 Grafana 可以接入多个数据源,查询数据源的数据做告警和展示。但是有些数据源所在的机房和中心机房之间网络链路不好,如果由 n9e 进程去周期性查询数据并判定告警,那在网络链路抖动或拥塞的时候,告警就不稳定了。所以,夜莺引入了边缘告警引擎:n9e-edge。n9e-edge 进程部 阅读全文
posted @ 2025-02-25 11:48 IT运维监控 阅读(270) 评论(0) 推荐(0)