摘要: 本文是 Spring Boot 生产配置实战 系列的第 2 篇 叙事框架:现象 → 排查过程 → 根因 → 修复 → 预防 问题现象 连接池耗尽通常有两种原因:连接不够用或连接泄漏。前者通过增大池大小可以缓解,后者则需要精确定位泄漏点。近日笔者团队遇到一起事故,order-fulfillment 服 阅读全文
posted @ 2026-06-23 22:42 Ai拆代码的曹操 阅读(1) 评论(0) 推荐(0)
摘要: test 阅读全文
posted @ 2026-06-23 19:34 Ai拆代码的曹操 阅读(1) 评论(0) 推荐(0)
摘要: 本文是线上问题实战录系列的第 3 篇 叙事框架:现象 → 排查过程 → 根因 → 修复 → 预防 问题现象 前两天遇到一个线上问题,排查过程比较典型,记录一下。某日下午,收到告警:auth-service CPU 持续 100%,连续 12 分钟没有恢复。伴随症状包括接口响应变慢(p99 从 50m 阅读全文
posted @ 2026-06-23 19:23 Ai拆代码的曹操 阅读(1) 评论(0) 推荐(0)
摘要: 本文是线上问题实战录系列的第 5 篇 叙事框架:现象 → 排查过程 → 根因 → 修复 → 预防 问题现象 在 order-service 从物理机迁移到 K8s 的过程中,遇到了一个典型的监控歧义问题。同时运行的三个监控系统——node exporter、cAdvisor、Spring Boot 阅读全文
posted @ 2026-06-23 17:59 Ai拆代码的曹操 阅读(1) 评论(0) 推荐(0)