会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
IT运维监控/可观测性
运维监控、运维自动化、Prometheus、Nightingale、Categraf
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
6
7
8
9
10
11
12
13
14
···
19
下一页
2024年3月26日
别想宰我,怎么查看云厂商是否超卖?详解 cpu steal time
摘要: 据说有些云厂商会超卖,宿主有 96 个核心,结果卖出去 100 多个 vCPU,如果这些虚机负载都不高,大家相安无事,如果这些虚机同时运行一些高负载的任务,相互之间就会抢占 CPU,对应用程序有较大影响,我应该如何查看我的 CPU 是否被抢占了呢? 什么是 cpu steal time? 如果你在物
阅读全文
posted @ 2024-03-26 19:42 IT运维监控
阅读(154)
评论(0)
推荐(0)
2024年3月23日
天天报警值班,老子不干了
摘要: 最近跟一个朋友(化名张三)吃饭,三哥最近想离职,来找我喝酒,说天天 OnCall,出门都带着电脑,连续一年了,要崩溃了。我问:你们组就你一个人么?为啥就你自己 OnCall?三哥一脸苦涩:我们组算上老板 4 个人,老板说另外俩人不靠谱,不让他俩 OnCall,还给我画饼,说 OnCall 能提升我的
阅读全文
posted @ 2024-03-23 16:19 IT运维监控
阅读(86)
评论(0)
推荐(0)
2024年3月19日
使用 nsenter 排查容器网络问题
摘要: 需求 我想进入容器中执行 curl 命令探测某个地址的连通性,但是容器镜像里默认没有 curl 命令。我这里是一个内网环境不太方便使用 yum 或者 apt 安装,怎么办? 这个需求比较典型,这里教大家一个简单的方法,使用 nsenter 进入容器的 net namespace,即可使用宿主机的 c
阅读全文
posted @ 2024-03-19 11:21 IT运维监控
阅读(120)
评论(0)
推荐(0)
2024年3月18日
Zenlayer如何将万台设备监控从Zabbix迁移到Flashcat
摘要: 作为全球首家以超连接为核心的云服务商,Zenlayer 致力于将云计算、内容服务和边缘技术融合,为客户提供全面的解决方案。通过构建可靠的网络架构和高效的数据传输,Zenlayer 帮助客户实现更快速、更可靠的连接,提升用户体验和业务效率。Zenlayer 在全球范围内运营着超过 290 个边缘节点,
阅读全文
posted @ 2024-03-18 20:20 IT运维监控
阅读(309)
评论(0)
推荐(0)
2024年3月16日
5 分钟小工具:使用 dive 分析 docker 镜像
摘要: 需求 拿到一个镜像之后,我想知道: 分层查看镜像里都有哪些文件 各层使用了什么命令构建的这个镜像 镜像里比较大的文件有哪些(可能需要优化) dive 工具介绍 dive 工具可以做这些分析。dive 的 github 地址是 wagoodman/dive,小巧玲珑,MIT 开源协议,42.9k 的
阅读全文
posted @ 2024-03-16 17:38 IT运维监控
阅读(449)
评论(0)
推荐(0)
2024年3月15日
Vector + ClickHouse 收集日志
摘要: 目前业界的日志生态,最常用的是 ELK,其次就是 ClickHouse,本文会演示如何使用 Vector + ClickHouse 来采集 Nginx 日志并做清洗,最终写入 ClickHouse。至于日志的可视化,后面再单独介绍,后面夜莺会把日志可视化能力下放到开源版本,之前跟映客的兄弟们交流准备
阅读全文
posted @ 2024-03-15 14:44 IT运维监控
阅读(1677)
评论(0)
推荐(0)
2024年3月14日
Flashcat与出行科技企业一起实践多云可观测
摘要: 当前架构 某出行科技企业从单个公有云往多云转型,依托于国内领先的公有云提供商,采用多云架构,在可用性、弹性、成本、供应商依赖方面,拥有了显著的优势。 相应的,多云架构也给技术团队带来了一定的复杂度和技术挑战,最显著的就是如何高效的构建跨云的可观测性体系,提升故障发现、问题排查、性能分析等方面的能力。
阅读全文
posted @ 2024-03-14 11:43 IT运维监控
阅读(212)
评论(0)
推荐(0)
2024年3月8日
邮件告警还能这么玩?!
摘要: 引言 在现代的 IT 技术环境中,新的监控系统通常都支持非常丰富的通知媒介,比如电话、短信、钉钉、飞书、Slack 等,非常灵活。但是一些老旧的系统,不提供指标暴露方式,无法和监控系统良好对接,这些老古董通常只内置提供邮件告警这一种方式。这给整个分发和自动化都带来了挑战。通常来讲,邮件告警方式有以下
阅读全文
posted @ 2024-03-08 10:52 IT运维监控
阅读(143)
评论(0)
推荐(0)
2024年3月6日
数据可视化基础篇-图形语法
摘要: 当我们在制作仪表盘或其他数据可视化时离不开对图表的选择,不同的数据信息该怎么选择图表可能是不少人会遇到的问题。 要解决这个问题我们首先需要理解数据可视化的生成规律或者说是“语法”,目前主流的数据可视化理论认为,可视化是由基础标记(Mark)沿着某个或是某些视觉通道(Visual channel)进行
阅读全文
posted @ 2024-03-06 14:09 IT运维监控
阅读(104)
评论(0)
推荐(0)
2024年3月5日
OpenTelemetry Logging 思维导图,收藏
摘要: Log 是最常用、最自然的监控数据类型之一,具有以下的优点: 日志的内容比指标更加丰富,可以提供更多的细节信息,帮助开发人员和运维人员更好地理解应用程序的运行状况,通过日志几乎可以重现、还原系统的完整工作过程。 日志的格式灵活,可以方便的记录多样化的事件,包括错误、异常和警告等,而指标通常只能提供统
阅读全文
posted @ 2024-03-05 11:33 IT运维监控
阅读(174)
评论(0)
推荐(0)
上一页
1
···
6
7
8
9
10
11
12
13
14
···
19
下一页
公告