用 Agent SDK 构建你的第一个 Agent
用 Agent SDK 构建你的第一个 Agent
原文:Building agents with the Claude Agent SDK | Anthropic Engineering Blog
导语
上一篇我们理解了 Agent 的基本架构模式。这一篇,我们动手做。
Claude Agent SDK 是 Anthropic 推出的官方 Agent 开发工具包,它将 Claude Code 的核心能力——理解代码库、编辑文件、运行命令、执行复杂工作流——封装成可编程的 SDK,让开发者能快速构建自主 Agent。
一、Agent SDK 是什么
Claude Agent SDK(原 Claude Code SDK)允许开发者以编程方式构建 AI Agent。它的核心理念是赋予 Claude 与程序员相同的计算机操作能力。
关键特性:
- 文件系统访问:读取、编辑、创建文件
- 命令执行:运行 shell 命令
- 代码理解:深度理解代码库结构和逻辑
- 工作流编排:串联多步骤任务
二、构建 Agent 的三步循环
每个 Agent 的工作本质上都是一个循环:
第一步:收集上下文
Agent 需要理解当前环境。这包括:
- 读取相关文件
- 查看 git 历史
- 搜索代码库
- 了解项目结构
第二步:采取行动
基于收集到的上下文,Agent 做出决策并执行:
- 编辑代码文件
- 运行测试
- 执行部署命令
- 调用外部 API
第三步:验证工作
Agent 需要验证自己的工作是否正确:
- 运行单元测试
- 检查编译是否通过
- 验证功能是否符合预期
- 使用浏览器自动化进行端到端测试
这三步不断循环,直到任务完成。
三、超越编程:多场景应用
Agent SDK 的能力不限于编程,它可以应用于:
| 场景 | 示例 |
|---|---|
| 金融分析 | 自动收集财报数据、生成分析报告 |
| 个人助理 | 管理日程、整理邮件、生成摘要 |
| 客户支持 | 自动处理工单、查询知识库、执行操作 |
| 研究分析 | 搜索文献、提取关键信息、生成综述 |
四、测试与优化
构建 Agent 后,关键是迭代优化:
- 定义评估标准:明确什么是"好"的 Agent 行为
- 收集测试用例:从真实场景中提取代表性任务
- 运行评估:批量测试 Agent 在各种任务上的表现
- 分析失败:找出 Agent 失败的模式,针对性优化
- 优化提示:调整系统提示和工具描述
五、安装与快速上手
# 安装
npm install @anthropic-ai/claude-agent-sdk
# 基本使用
import { Agent } from '@anthropic-ai/claude-agent-sdk';
const agent = new Agent({
model: 'claude-sonnet-4-5',
tools: [/* 你的工具 */],
});
const result = await agent.run('帮我重构这个函数');
六、最佳实践
- 从小处着手:先让 Agent 完成一个简单任务,再逐步扩展
- 提供清晰的上下文:Agent 的表现取决于它能获取到的信息质量
- 设计好工具:工具是 Agent 的手和脚,工具设计好不好直接决定 Agent 能力上限
- 加入验证环节:不要让 Agent "盲目"执行,每一步都应有验证
- 保持人类在环:在关键决策点保留人类审批
读后感
Agent SDK 最大的价值不是它提供了多少 API,而是它传递了一种思维方式:Agent 不是魔法,而是工程。
把"收集上下文 → 采取行动 → 验证结果"这个循环做好,就是一个好 Agent。
本文是 Anthropic AI Agent 系列 第 2 篇,共 15 篇。下一篇:Agent 高级工具调用
关注公众号 coft 获取系列更新。

浙公网安备 33010602011771号