摘要: 去年秋天,我在做一个面向海外用户的SaaS项目,注册流程需要短信验证码做身份校验。+86手机号作为测试账号,验证码要么延迟十分钟以上,要么干脆收不到。 这个问题在开发和测试环境没出现过,到了预发布环境才暴露。排查了三天,最后发现不是代码bug,是通道本身的稳定性问题。 第一天:排除代码层面的问题 项 阅读全文
posted @ 2026-06-13 17:12 freedangke 阅读(1) 评论(1) 推荐(0)
摘要: 去年接手了一个.NET 6的Web API项目,部署在K8s上,内存限制设了4GB,结果频繁被OOM杀掉。监控一看,内存占用稳定在3.8GB左右,几乎触顶。 不是内存泄漏,是设计问题。花了三天优化,现在稳定运行在400MB左右。分享排查过程和优化思路。 第一天:定位问题,不是泄漏,是缓存滥用 先用d 阅读全文
posted @ 2026-06-11 17:04 freedangke 阅读(3) 评论(0) 推荐(0)
摘要: 去年秋天,我接手了一个.NET 6的老项目。用户投诉说订单查询慢,我本地一测,两秒多。老板给的目标是两百毫秒以内。 最后优化到了八十毫秒。不是因为我多厉害,是因为原来的代码里藏着太多"显而易见"的问题,而"显而易见"往往是最难发现的。 第一天:定位瓶颈 先用dotnet-counters监控,CPU 阅读全文
posted @ 2026-06-09 21:30 freedangke 阅读(9) 评论(0) 推荐(0)