31-day7-Planning 理论
🧠 理论部分:AI Agent 中的 规划(Planning) 能力
一、什么是 Planning(规划)?
在人工智能中,规划(Planning) 是指:
Agent 根据目标(Goal)和环境状态(State),生成一系列有序动作(Actions),以达成目标的过程。
简单说:
“先想清楚怎么做,再动手做。”
这与人类解决问题的方式高度一致——我们不会盲目行动,而是先制定计划。
二、为什么 Agent 需要 Planning?
| 场景 | 无规划(Reactive) | 有规划(Deliberative) |
|---|---|---|
| 任务复杂度 | 只能处理简单、即时响应 | 可处理多步骤、长期目标 |
| 错误率 | 容易陷入局部最优或死循环 | 可全局思考,避免无效操作 |
| 可解释性 | “黑箱”行为 | 每一步都有理由(Plan 可读) |
✅ 结论:
对于 需要多步推理、工具调用、时间跨度长 的任务,Planning 是 Agent 智能的关键体现。
三、Plan-and-Execute 架构
这是当前 LLM-based Agent 最主流的范式之一:
[ User Task ]
↓
[ Planner (LLM) ] → 生成 Plan(步骤列表)
↓
[ Executor ] → 依次执行每个步骤(调用工具)
↓
[ Result ]

🔑 核心特点:
- 解耦设计:Planner 只负责“想”,Executor 只负责“做”;
- 模块化:Executor 可集成多种工具(邮件、搜索、计算等);
- 可扩展:Plan 可长可短,支持动态调整(进阶:RePlan)。
💡 你的实验
day7-plan-2.py正是这一架构的典型实现!
四、LLM 如何做 Planning?
大语言模型(如 Qwen)本身不具备传统规划算法(如 STRIPS),但可通过 提示工程(Prompting) 激发其规划能力:
常用 Prompt 技巧:
你是一个任务规划助手。请将以下任务拆解为 3 个清晰、有序、可执行的步骤。
每个步骤必须以动词开头,简洁明了,不要解释。
只输出:
1. ...
2. ...
3. ...
用户任务:{task}
为什么有效?
- LLM 在训练中见过大量“任务→步骤”的文本(如教程、说明书);
- 通过 结构化输出约束,引导其生成机器可解析的 Plan。
✅ 这就是 “LLM as Planner” 的本质:利用语言模型的常识推理能力进行任务分解。
五、Planning 的挑战与进阶方向
| 挑战 | 解决思路 |
|---|---|
| Plan 不可行(如步骤缺失) | 加入 验证机制(Execution Feedback + RePlan) |
| 工具不支持某步骤 | 设计 Tool Registry,让 Planner 知晓可用工具 |
| 任务太复杂(>10 步) | 分层规划(Hierarchical Planning):先主干,再细节 |
| 环境动态变化 | 引入 Memory 和 Observation,实时更新 Plan |
🚀 进阶架构:ReAct(Reason + Act)、Chain-of-Thought + Tool Use、AutoGen Group Chat
六、教学小结(板书要点)
AI Agent 的 Planning 能力
├── 本质:任务分解(Task Decomposition)
├── 架构:Plan-and-Execute(想 + 做)
├── 实现:LLM + Prompt Engineering
├── 优势:可解释、可扩展、贴近人类思维
└── 应用:自动化办公、智能客服、科研助手...
💬 金句:
“Planning is what separates a script from an Agent.”
(规划,是脚本与智能体的根本区别。)
《论语·为政》:“君子不器。”
孔子的理念中理想的人,不应像器具一样只有单一用途,而应具备通达之智、应变之能与自主之志。
今天,我们编写能“规划”的 AI Agent,正是在践行这一古老智慧——
我们拒绝做只会执行固定指令的“脚本”(器),
而要成为能理解目标、拆解任务、调用工具、动态调整的“智能体”(君子)。
同样,你的职业生涯也不应被限定于某一门语言、某一项技能。
要学会规划,保持学习,跨界融合——
像一个真正的“Agent”那样,主动设计人生路径,灵活应对未来挑战。
愿您:通才达识,立志高远

七、课后思考题
- 如果 LLM 生成的 Plan 中包含“打电话给领导”,但系统没有电话工具,Agent 该怎么办?
- 能否让 Agent 自己判断“是否需要规划”?(简单任务直接执行,复杂任务才规划)
- 规划步骤是否应该包含“检查结果”?如何实现闭环?
浙公网安备 33010602011771号