第五层“Harness(行为缰绳)
如果说第四层Agent是那个聪明但偶尔会冒失的实习生,那第五层Harness就是公司给他制定的《员工手册》+ 工作流审批系统(SOP)。
到了这一层,我们要解决Agent在真实业务中的“不可控”问题。因为Agent是“生成式”的,同样的问题问两次,它可能走两条完全不同的路。在银行转账、医疗诊断等严肃场景中,这种不确定性是不可接受的。Harness就是给AI的“自由发挥”套上“确定性”的笼头。
🎯 Harness的核心使命:从“动态生成”到“确定执行”
Harness不做决策(那是Agent的事),它做的是约束、编排和兜底。它像一个交通指挥系统,确保Agent这辆“自动驾驶汽车”不闯红灯、不逆行、最终安全到达目的地。
它的工作可以拆解为四个核心职能:
| 职能 | 作用 | 通俗理解 |
|---|---|---|
| 1. 流程编排 (Orchestration) | 将Agent的思维过程强行固定为预设的工作流(DAG,有向无环图)。 | 规定“必须先登录 -> 再查库存 -> 最后下单”,绝对不能跳步。 |
| 2. 状态管理 (State Management) | 记录Agent每一步执行后的状态,支持暂停、回滚和人工审批(Human-in-the-loop)。 | 像Git版本管理,随时可以“Ctrl+Z”撤回上一步危险操作。 |
| 3. 结构输出 (Structured Output) | 强制Agent输出严格的JSON或XML格式,而非自然语言。 | 像给实习生填空题模板,不准自由发挥,方便后端程序直接解析。 |
| 4. 安全护栏 (Guardrails) | 对输入(用户的恶意提问)和输出(是否涉及敏感词)进行双重过滤。 | 像杀毒软件,在对话入口和出口进行扫描。 |
⚙️ 落地实战:LangGraph 与 状态机
目前实现第五层最强大的框架是 LangGraph(LangChain的升级版)。
与第四层传统Agent(ReAct)那种“黑盒”循环不同,LangGraph让你把Agent的逻辑构建成一个显式的“图(Graph)”。你可以定义节点(Node)和边(Edge)。
举个常见的“客服工单系统”例子:
-
节点1:意图识别(判断用户是想退货、换货还是咨询)。
-
条件边(Conditional Edge):如果意图是“退货”,强制走节点2;如果是“咨询”,直接跳到节点4。
-
节点2:身份验证(必须调用DB查用户ID)。
-
节点3:库存/订单校验。
-
节点4:生成回复。
对比效果:
第四层(纯Agent):可能自作聪明跳过验证,直接生成退货地址(导致错发)。
第五层(LangGraph):代码逻辑硬性规定,不通过节点2,绝不进入节点3。把大模型的“概率性推理”降维成了“确定性工程”。
🛡️ 两大核心安全机制
1. 人工介入(Human-in-the-Loop)
在自动化流程中设置断点(Breakpoint)。例如,当Agent决定“执行转账操作”时,Harness强制暂停整个进程,不直接执行,而是发一条消息给主管:“请求审批:向尾号1234账户转账5万元,是否同意?” 点击确认后,Harness才允许Agent继续执行。
2. 重试与回退(Retry & Fallback)
Agent调用工具(如查天气API)时,如果超时或报错,Harness不会让Agent愣住,而是执行预设策略:
-
策略A:重试3次。
-
策略B:如果重试失败,切换到备用数据库查历史平均气温。
-
策略C:如果全失败,直接回复用户:“查询服务暂不可用,请稍后再试。”(优雅降级)
🔧 第五层核心工具生态
| 工具/框架 | 擅长领域 | 适用场景 |
|---|---|---|
| LangGraph | 复杂状态流控制、循环、条件分支 | 多步骤企业级应用(财务对账、工单流转) |
| Pydantic / Instructor | 强制结构化输出 | 要求返回JSON数据给前端页面渲染的场景 |
| Guardrails AI | 输入/输出内容安全过滤 | 检测用户输入的“越狱(Jailbreak)”攻击 |
| Temporal / Airflow | 超长周期任务编排(小时/天级) | 每周自动汇总销售数据并发送邮件的定时任务 |
💎 总结:第四层与第五层的分工
第四层(Agent):像一个编剧,负责天马行空地写剧本(生成规划和动作)。
第五层(Harness):像一个导演,负责喊“卡!”(Cut),确保演员按分镜头脚本走,不许擅自加戏。
落地的黄金法则:让Agent做“选择题”和“填空题”,不要让Agent做“自由发挥的论述题”。凡是涉及关键业务数据的地方,必须在Harness层用if...else...写死。
第五层给AI拴上了缰绳,但AI依然无法触达公司内部的数据库、邮件系统等私有资源。第六层“MCP(万能接口)” 正是为了解决“连接”问题而诞生的——它是一个标准化的协议,像“USB-C接口”一样,让AI能即插即用地接入各种外部工具。

浙公网安备 33010602011771号