Bedrock AgentCore 优化功能:让生产 Agent 自动找出该调哪句 Prompt

背景

Agent 上线不是终点。模型在变、用户在变、工具在变——你的 system prompt 不变,质量就会降。

4/30 亚马逊云科技发布了 AgentCore 的 Recommendations + Batch Evaluations + A/B Tests(Preview),帮你把 "observe → evaluate → improve" 这个循环自动化。

三个新能力

Recommendations:分析生产 traces,针对你的负载推荐具体的 prompt 和 tool description 改动。

Batch Evaluations:离线跑预定义测试 case,量化对比原版 vs 推荐版。

A/B Tests:线上分流验证,统计显著性达标后提示 promote。

每一步都需要你人工审批。

核心逻辑

traces 分析 → 推荐改动 → 离线验证 → 线上 A/B → 审批上线

之前这个流程全手动(分析日志 → 凭经验改 → 直接替换)。现在系统帮你做前三步,最后一步你决定。

适用场景

  • 客服 Agent 上线后发现新问题类型覆盖不到
  • RAG Agent 的 tool calling 成功率在降
  • 模型升级后 Agent 行为漂移

区域

AgentCore Evaluations 可用的所有 Region。

文档:https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/optimization.html


来源:亚马逊云科技 2026/4/30 官方公告。

posted @ 2026-05-08 00:39  亚马逊云开发者  阅读(8)  评论(0)    收藏  举报