摘要: 越来越多的互联网公司开始尝试 ClickHouse 存储日志,比如映客、快手、携程、唯品会、石墨文档,但是 ClickHouse 存储日志缺少对应的可视化方案,石墨文档开源了 ClickVisual 用于解决这个问题。笔者初步尝试了一下 ClickVisual,一点小小的实践经验,与各位分享。 简介 阅读全文
posted @ 2023-12-01 10:58 IT运维监控 阅读(1099) 评论(0) 推荐(0)
摘要: 大家好,夜莺项目发布 v6.4.0 版本,新增全局宏变量功能,本文为大家简要介绍一下相关更新内容。 全局宏变量功能 像 SMTP 的配置中密码类型的信息,之前都是以明文的方式在页面展示,夜莺支持全局宏变量之后,可以在变量管理配置一个 smtp_password 的密码类型的变量,在 SMTP 配置页 阅读全文
posted @ 2023-11-30 12:12 IT运维监控 阅读(144) 评论(0) 推荐(0)
摘要: FlashDuty:一站式告警响应平台,前往此地址免费体验! 告警路由 什么是告警路由? FlashDuty已经与Zabbix、Prometheus等监控系统实现无缝集成,通过一个简单的webhook就可以把告警系统产生的所有告警事件推送到FlashDuty来管理。每个告警事件的重要性、紧急程度和所 阅读全文
posted @ 2023-11-27 10:31 IT运维监控 阅读(54) 评论(0) 推荐(0)
摘要: 指标、日志、链路是服务可观测性的三大支柱,在服务稳定性保障中,通常指标侧重于发现故障和问题,日志和链路分析侧重于定位和分析问题,其中日志实际上是串联这三大维度的一个良好桥梁。 但日志分析往往面临成本和效果之间的权衡问题,没有完美的方案只有适合的方案,本文将结合实战经验,介绍一种日志分析的实现,分析如 阅读全文
posted @ 2023-11-25 09:51 IT运维监控 阅读(307) 评论(0) 推荐(0)
摘要: categraf支持多种方式进行部署、托管,社区里部署和管理categraf也是五花八门,大家自己使用方便即可。 之前我们觉得大家通过ansible之类的工具批量下发/更新就能很简单地完成任务,最近很多用户咨询我们关于categraf有没有更方便的升级方式,这也促使 我们思考如何让用户更快捷方便地完 阅读全文
posted @ 2023-11-23 19:30 IT运维监控 阅读(295) 评论(0) 推荐(0)
摘要: 稳定性保障,是一切技术工作的出发点和落脚点,也是 IT 工作最核心的价值体现,当然也是技术人员最容易“翻车”的阴沟。8个稳定性保障锦囊,分享给各位技术人员择机使用。 #1 设定可量化的、业务可理解的可用性目标 没有度量就没有改进。Google SRE 曾在其工程实践中,就引入了针对服务可靠性的预算机 阅读全文
posted @ 2023-11-22 10:20 IT运维监控 阅读(295) 评论(0) 推荐(0)
摘要: 原作:Monika Singh & Pradeep Chhetri 这是我们在 Monitorama 2022 上发表的演讲的改编稿。您可以在此处找到包含演讲者笔记的幻灯片和此处的视频。 当 Cloudflare 的请求抛出错误时,信息会记录在我们的 requests_error 管道中。错误日志用 阅读全文
posted @ 2023-11-21 20:15 IT运维监控 阅读(579) 评论(0) 推荐(0)
摘要: 如果企业提供 IT 在线服务,那么可观测性能力是必不可少的。“可观测性” 这个词近来也越发火爆,不懂 “可观测性” 都不好意思出门了。但是可观测性能力的构建却着实不易,每个企业都会用到一堆技术栈来组装建设。比如数据收集,可能来自某个 exporter,可能来自 telegraf,可能来自 OTEL, 阅读全文
posted @ 2023-10-13 14:43 IT运维监控 阅读(1332) 评论(0) 推荐(0)
摘要: 如果大家对时序指标的存储方案有些了解,那大概率会听过 VictoriaMetrics,VictoriaMetrics 号称 Prometheus 的升级版,在性能和成本方面也确实做得很好,如果是夜莺新用户,我都是推荐直接使用 VictoriaMetrics 来作为存储。前几天 Victoria 发布 阅读全文
posted @ 2023-10-13 14:24 IT运维监控 阅读(682) 评论(0) 推荐(0)
摘要: FlashDuty:一站式告警响应平台,前往此地址免费体验! 自定义字段 FlashDuty 已支持接入大部分常见的告警系统,我们将推送内容中的大部分信息放到了 Lables 进行展示。尽管如此,我们用户还是会有一些扩展或定制性的需求,比如人工标记一个故障是否为误报。因此我们提供了自定义字段功能,来 阅读全文
posted @ 2023-10-13 14:09 IT运维监控 阅读(93) 评论(0) 推荐(0)