摘要: 在某些场景下,我们需要通过 API 或直接在 ClickHouse 中执行 SQL 查询,从而将追踪、监控能力集成到自动化脚本或第三方 GUI 中。为了避免重复编写繁琐的查询语句,通常希望复用 DeepFlow Dashboard 面板中已有的过滤逻辑,但直接使用时往往无法执行成功。这是因为 Das 阅读全文
posted @ 2026-02-03 10:35 怎么还在写代码 阅读(4) 评论(0) 推荐(0)
摘要: 前言 本文主要介绍 DeepFlow 的 AutoProfiling(on-cpu)持续性能剖析功能的配置与使用。该能力与 DeepFlow 的部署方式无关。自 v6.6.3 起,deepflow-agent 的配置格式有较大调整,本文使用新版本配置格式,建议使用 v7.0 LTS 或后续 LTS 阅读全文
posted @ 2026-02-03 05:07 怎么还在写代码 阅读(241) 评论(0) 推荐(0)
摘要: Calico Node 启动失败 故障表现 发现请求集群 demo 入口时卡住,并且对应 Pod 没有新的日志输出 root@ce-demo-1:~# kubectl get pods -n deepflow-otel-spring-demo -o wide NAME READY STATUS RE 阅读全文
posted @ 2026-02-02 10:08 怎么还在写代码 阅读(175) 评论(0) 推荐(0)
摘要: 可爱的异常朋友们 还记得这个 500 错误页面吗?似乎是好久以前的事了。那时候的它既可爱又有趣。而现在,我们那只可怜的 Snoo 正被如山的点赞压得喘不过气来。不幸的是,如果你在美国时间 3 月 14 日下午尝试浏览 Reddit,你可能已经在这次 314 分钟的宕机事故 中看到了那只倒霉的 Sno 阅读全文
posted @ 2026-01-30 14:36 怎么还在写代码 阅读(322) 评论(0) 推荐(1)
摘要: 本文基于对 Why Kubernetes Outages Are Usually Human Failures, Not Platform Bugs 这篇文章的翻译。与机翻不同,本文在翻译的基础上进行了大量本土化的润色,使内容更符合中文母语读者的阅读习惯,大大提升了阅读体验。此外,对于一些较为专业或 阅读全文
posted @ 2026-01-28 16:08 怎么还在写代码 阅读(417) 评论(0) 推荐(1)
摘要: 前言 在使用 kubectl get $KIND -o yaml 查看 k8s 资源时,输出结果中包含大量由集群自动生成的元数据(如 managedFields、resourceVersion、uid 等)。这些信息在实际复用 yaml 清单时需要手动清理,增加了额外的工作量。 使用 kubectl 阅读全文
posted @ 2026-01-23 15:16 怎么还在写代码 阅读(392) 评论(0) 推荐(0)
摘要: 前言 本文基于对 Hidden Kubernetes Bad Practices Learned the Hard Way During Incidents 的阅读后,在尊重原文内容的基础上进行了本地化翻译与整理,在语义表达上相较于机翻,更加贴近中文母语者的阅读习惯,提升整体的可读性与理解成本。 在 阅读全文
posted @ 2026-01-22 16:53 怎么还在写代码 阅读(554) 评论(0) 推荐(2)
摘要: 前言 本文仅为 LiteLLM 部署流程,非 LiteLLM 使用教程。 部署环境:阿里云ACK 部署方式:PostgreSQL + Redis + LiteLLM 参考链接:官网文档 LiteLLM 部署流程 Redis 部署 可实现多个 litellm 容器间的负载均衡 本次使用 bitnami 阅读全文
posted @ 2025-12-25 21:20 怎么还在写代码 阅读(389) 评论(0) 推荐(0)