摘要: 夜莺监控项目最核心的定位,是做一个告警引擎,支持多种数据源的告警。这个版本的更新主要是增加了对 MySQL 数据源的支持,进一步增强了夜莺在业务指标监控方面的能力。 之前版本的夜莺主要聚焦在 Prometheus、VictoriaMetrics、ElasticSearch 等传统监控数据源上,从上个 阅读全文
posted @ 2025-06-11 09:29 IT运维监控 阅读(32) 评论(0) 推荐(0)
摘要: 这个版本来得迟了一些,主要是新功能加的多,下面简单介绍一下新功能,下下周也计划做一次直播讲解。 支持 ClickHouse 告警 夜莺最重要的定位是告警引擎,所以会持续增加各类数据源的告警支持,ClickHouse 之后还有 Doris、MySQL、Postgres 等。 开源版主要是支持告警,不会 阅读全文
posted @ 2025-06-04 08:55 IT运维监控 阅读(34) 评论(0) 推荐(0)
摘要: 站点可靠性工程,或 SRE,是一种将运维问题视为软件问题的方法。这一概念最初由 Google 工程师 Ben Treynor Sloss 在 2003 年提出并描述。作为一门学科,站点可靠性工程(SRE)旨在维持特定系统的可用性、性能和效率。 SRE 难以界定。它是一种方法或学科,而不是一套具体的指 阅读全文
posted @ 2025-05-28 08:00 IT运维监控 阅读(32) 评论(0) 推荐(0)
摘要: 2025 年 4 月 16 日,Spotify 经历了一次影响全球用户的中断。以下就是发生了什么以及我们将如何解决它。 背景 我们使用 Envoy Proxy 作为我们的网络外围系统。外围是我们的软件接收用户(您!)网络流量的第一部分。然后,它将流量分发到其他服务。我们使用云区域将流量合理地分布在世 阅读全文
posted @ 2025-05-20 15:41 IT运维监控 阅读(31) 评论(0) 推荐(0)
摘要: 业内经常讲可观测性有三大支柱:指标、日志、链路追踪,本文作者认为,还有第四大支柱:那就是配置类数据。配置类数据的变更也会影响系统的稳定性,也值得被监控,方便我们快速排查问题。 原文链接:https://www.cloudquery.io/blog/fourth-lost-pillar-of-obse 阅读全文
posted @ 2025-05-07 11:30 IT运维监控 阅读(22) 评论(0) 推荐(0)
摘要: Elastic Stack 在日志领域具备无与伦比的地位,各类新兴的开源项目都声称比 Elastic 更节省资源,同时检索速度也不慢,比如 ClickHouse、Loki、OpenObserve、VMLogs,今天我们来看看另一个项目:SigLens。 SigLens 的官网是:https://ww 阅读全文
posted @ 2025-04-21 08:42 IT运维监控 阅读(114) 评论(0) 推荐(0)
摘要: 这一波 AI 浪潮跟以往都不同,各个行业都看到了新的可能性,都想把 AI 引入自己的场景,看看能迸发什么样的助力。笔者所在的监控、可观测性领域,也有各种尝试,比如: 通过 AI 翻译人类语言生成 SQL 或 Promql 把告警事件扔给 AI,让 AI 生成泛泛的建议 把一批日志或 Trace Sp 阅读全文
posted @ 2025-04-17 07:24 IT运维监控 阅读(47) 评论(0) 推荐(0)
摘要: 在监控、可观测性领域,指标的数量与日俱增,各类中间件的指标相对固定,但是很多业务方有时会上报很多稀奇古怪的指标,也不管有用没用反正就是上报了,而且有时是偶发性流量暴增,比如业务方为了做测试,部署了一套新环境之类的。作为平台存储侧,VictoriaMetrics 在突发大流量下如何自保,就非常重要了。 阅读全文
posted @ 2025-04-07 11:29 IT运维监控 阅读(73) 评论(0) 推荐(0)
摘要: 以防读者不了解夜莺,开头先做个介绍: 夜莺监控,英文名字 Nightingale,是一款侧重告警的监控类开源项目。类似 Grafana 的数据源集成方式,夜莺也是对接多种既有的数据源,不过 Grafana 侧重在可视化,夜莺是侧重在告警引擎。比如把 Prometheus、VictoriaMetric 阅读全文
posted @ 2025-03-31 10:33 IT运维监控 阅读(55) 评论(0) 推荐(0)
摘要: 今天聊一下这个很让人扫兴的问题。刷进来的人,大概率至少是总监以上角色,或者有追求、善于思考的运维人员。握个手,幸会。 谁来回答这个问题 普通运维工程师无需回答,因为这是 CTO 最应该回答的问题。CTO 作为运维总监的领导,之所以要搭建运维团队,必然有其理由。如果 CTO 回答不了这个问题,这个 C 阅读全文
posted @ 2025-03-25 17:03 IT运维监控 阅读(40) 评论(0) 推荐(0)