Bedrock AgentCore 优化功能：让生产 Agent 自动找出该调哪句 Prompt

背景

Agent 上线不是终点。模型在变、用户在变、工具在变——你的 system prompt 不变，质量就会降。

4/30 亚马逊云科技发布了 AgentCore 的 Recommendations + Batch Evaluations + A/B Tests（Preview），帮你把 "observe → evaluate → improve" 这个循环自动化。

Recommendations：分析生产 traces，针对你的负载推荐具体的 prompt 和 tool description 改动。

Batch Evaluations：离线跑预定义测试 case，量化对比原版 vs 推荐版。

A/B Tests：线上分流验证，统计显著性达标后提示 promote。

每一步都需要你人工审批。

traces 分析 → 推荐改动 → 离线验证 → 线上 A/B → 审批上线

之前这个流程全手动（分析日志 → 凭经验改 → 直接替换）。现在系统帮你做前三步，最后一步你决定。

AgentCore Evaluations 可用的所有 Region。

来源：亚马逊云科技 2026/4/30 官方公告。

posted @ 2026-05-08 00:39 亚马逊云开发者阅读(14) 评论(0) 收藏举报

刷新页面返回顶部