Think Tool:让 Agent 学会"停下来想一想"
Think Tool:让 Agent 学会"停下来想一想"
原文:The "think" tool | Anthropic Engineering Blog | 2025.3.20
导语
在复杂的工具使用场景中,Agent 经常犯一种错误:不假思索就行动。
它收到用户请求,立刻开始调用工具,却没有先想想"我是否已经收集了所有需要的信息?这个操作是否符合所有策略规则?"
Anthropic 发现了一种简单但强大的解决方案:给 Agent 一个"思考"工具——Think Tool。
一、Think Tool 是什么
Think Tool 是一个特殊的工具,它不会获取新信息,也不会改变任何数据库,只是在日志中追加一段思考过程。
{
"name": "think",
"description": "Use the tool to think about something. It will not obtain new information or change the database, but just append the thought to the log. Use it when complex reasoning or some cache memory is needed.",
"input_schema": {
"type": "object",
"properties": {
"thought": {
"type": "string",
"description": "A thought to think about."
}
},
"required": ["thought"]
}
}
二、Think Tool vs 扩展思维
两者听起来相似,但本质不同:
| 特性 | 扩展思维(Extended Thinking) | Think Tool |
|---|---|---|
| 时机 | 生成响应之前 | 生成响应之后,在工具调用链中 |
| 用途 | 深入思考并迭代计划 | 在新信息出现后停下来分析 |
| 最佳场景 | 简单的工具调用、编码、数学 | 复杂工具链、策略密集型场景 |
简单理解: 扩展思维是"想好了再动手",Think Tool 是"做着做着停下来想一想"。
三、性能数据
τ-Bench 评估

τ-bench 是一个测试模型在客户服务场景中工具使用能力的基准测试。
航空领域(复杂策略):
| 配置 | pass^1 | 相对提升 |
|---|---|---|
| 基线 | 0.370 | — |
| 仅扩展思维 | 0.412 | +11% |
| Think Tool + 优化提示 | 0.570 | +54% |
零售领域(较简单策略):

| 配置 | pass^1 |
|---|---|
| 基线 | 0.783 |
| 仅 Think Tool(无提示) | 0.812 |
SWE-bench 评估
Think Tool 为 Claude 3.7 Sonnet 达到 0.623 的最先进分数做出了贡献,平均提高了 1.6% 的性能。
四、何时使用 Think Tool
适合的场景
- 工具输出分析:需要在采取行动前仔细处理先前工具调用的输出
- 策略密集型环境:需要遵循详细的指导原则并验证合规性
- 顺序决策:每个行动都建立在前一个之上,错误代价高昂
不适合的场景
- 非顺序工具调用:只需一次或并行工具调用
- 简单指令遵循:约束少,默认行为已足够好
五、优化提示示例
在系统提示中加入具体的思考示例:
## 使用 think 工具
在采取任何行动之前,使用 think 工具作为草稿本来:
- 列出适用于当前请求的具体规则
- 检查是否收集了所有必需的信息
- 验证计划的操作符合所有策略
- 迭代检查工具结果的正确性
示例:
用户想取消航班 ABC123
- 需要验证:用户 ID、预订 ID、原因
- 检查取消规则:
* 是否在预订后 24 小时内?
* 如果不是,检查票务等级和保险
- 验证没有已飞或过去的航段
- 计划:收集缺失信息,验证规则,获取确认
六、实施建议
- 困难领域,提示至关重要:简单提供 Think Tool 可能有一定提升,但在复杂领域需要配合优化提示
- 复杂指导放在系统提示中:比放在工具描述中更有效
- 负面影响极小:除非 Claude 决定使用它,否则不会改变外部行为
读后感
Think Tool 的设计哲学很打动人:给 Agent 一个"停下来想想"的机会,比让它更快地行动更重要。
这和人类工程师的经验如出一辙——最好的 debug 方法往往不是立刻改代码,而是先在纸上理清思路。
本文是 Anthropic AI Agent 系列 第 5 篇,共 15 篇。下一篇:Agent Skills:让 Agent 具备真实世界能力
关注公众号 coft 获取系列更新。

浙公网安备 33010602011771号