摘要: 引子 我之前花了不少时间折腾 AI Agent。遇到的核心难题就一个:工具调度。 用户说一句话,你怎么判断该调哪个工具?调完之后结果怎么回传给模型?多个工具之间有依赖关系怎么处理? 这些问题看似简单,写起来都是坑。 最近在用 Strands Agents SDK,发现它的设计思路很干脆——不做意图路 阅读全文
posted @ 2026-03-23 11:07 亚马逊云开发者 阅读(0) 评论(0) 推荐(0)
摘要: 上周五晚上 11 点,手机响了——线上服务 CPU 飙到 95%,用户开始投诉卡顿。 等我打开电脑登上服务器,已经过去 15 分钟了。手动扩了一台实例,又花了 5 分钟。整个故障影响了将近 20 分钟。 后来我花了一个下午搭了一套 CloudWatch 告警 + 自动响应系统。现在 CPU 超过 8 阅读全文
posted @ 2026-03-23 09:03 亚马逊云开发者 阅读(2) 评论(0) 推荐(0)
摘要: 项目背景 在一个用户行为分析系统中,原有架构使用 RDS MySQL (db.r5.large) 存储操作日志。随着业务增长,写入量从每秒几十条增加到每秒数千条,MySQL 方案暴露出几个问题: 高峰期 CPU 持续 90%+,影响查询响应 扩容需要停机或切换,无法平滑应对突发流量 为抗住峰值需要预 阅读全文
posted @ 2026-03-23 08:07 亚马逊云开发者 阅读(2) 评论(0) 推荐(0)