Agent:搭建任务结构,能精确地引导模型做事
在有明确的 context 和清晰的任务范围时,Agent 已经能处理很复杂的任务了,可一旦任务变得模糊、需要探索环境或迭代开发,Agent 就开始吃力
人类是可以做到在工作中学习的,如果能让模型在真实世界中学习,而不是人类需要花几十亿收集每个具体任务的数据,看起来更符合 bitter lesson 的原则
Trenton 认为我们低估了模型学会一项技能所需的引导数据,而且模型还可能会存在不能泛化的问题
在模型的基础智能上,加一些精心设计的 prompt 或文本引导,是否就已经足够构建 context 了?还是说,必须为具体用例更新模型的参数?
multi agent 系统具备更高的可控性和优化潜力
OpenAI Agents SDK 实现的一个重要设计理念就是将一个任务分拆成多个子任务,分别给多个 agent 处理,每个 agent 专注于完成特定子任务,这样整体工作效率会大大提升。并且,如果一个 agent 同时处理 100 个任务,稍微改动几个 prompt 可能就会导致结果完全不同,但分工之后,每个 agent 的修改和调试就会更加独立。
Agent研发的实际窘境?
大模型的能力没那么强,其不确定性直接导致:
Agent的规划能力依赖于prompt工程能力,它比想象中更重要、执行起来也更琐碎;
不要让Agent一次性做复杂的推理性规划工作,而是把复杂任务人工拆解后再教给Agent
Agent的Action能力强烈依赖于基座模型的 functioncalling能力。在规划Agent之前,对模型的functioncalling能力要充分调研

Agent开发的最稳妥路线-低代码平台Agent?
既然大模型能力不行,那么就直接把大模型当啥子好了,不让它做规划,只让他做一个单点的执行,但这种做法做出来的,与Agent的初衷背道而驰。
最稳妥的Agent开发范式,就是人工定义好实现流程,低代码平台开发,例如,Dify应用开发平台,多模型支持、可视化工作流设计、检索增强生成(RAG)、API 接口与 SDK、数据与监控等核心功能,适用于企业知识管理、智能客服与问答系统、代码助手、自动化办公等场景。
4、Agent开发的次稳妥路线-交互型平台Agent?
最稳妥的Agent开发范式,就是人工定义好实现流程,低代码平台开发。但这个太慢,是否可以做个折中?
其实是可以的,这个也是一个趋势,
实现方式:每一步出llm结果,人工编辑确认执行。对于用户不清楚的问题,llm以多轮追问的方式进行引导->用户确认,迭代至意图信息完整,然后再最终生成结果,例如如下天工智能体的人工接入补充信息的中间过程:
5、Agent开发的激进路线-纯自动平台Agent?
激进路线,就是全放开让大模型去做Agent,但这块容易受到通用性的挑战,也需要做大量的prompt工程或者流程设计,例如manus等为代表。
这个不是很可控,并且很容易陷入死循环,或者耗费大量token。
资料信息不全:
缺少为什么要做这个命令,有哪些功能,和什么相关,依赖于水,对谁有影响等,进而才能生成靠谱的测试用例
数据治理不够:
数据变化迅速,最新信息没有放入资料中(规格、型号)
AI边界:
哪些是AI能做的,哪些是做不到的
这个需求人无法梳理/总结
为什么要用开源Agent框架?如果大家学会开源框架是不是就没人用自研的了?
我们一定不能站在开源的对立面,要做增量,而不是对抗。
用开源Agent框架有三种结果,一种是业务场景跑通了,那就不用自研了,开源项目已经满足需求,自研也卖不出去;第二种是开源跑不通,对应的问题我们有解决方案,这样我们就有了Agent框架的工作重点,在复制开源的基础上,重点完成问题的解决方案;如果开源的问题我们也没有解决方案,那可能技术还不成熟,可以先不做这个框架
资料 Agent应用 知道缺少什么知识,能够询问,专家回答
壁垒:
大家都在聊Agent的落地场景,Agent的框架也是层出不穷地出。
看仔细想过去,Agent本身的护城河相对比较低。
打开一个开源项目,不过是一系列的prompts,叠加一些思考模式罢了,而且随着模型本身越发聪明,这个小技巧其实变得可有可无。
早年,所谓的prompt提醒LLM去设定人设,现在似乎就不太重要。
现在,最大的prompt技巧应该是“few shot”吧。
那智能体应用的扩城河在哪呢,一是场景里,其实在模型之外的业务流程;二是基于对场景理解,数据驱动的模型定制。
后者更重要,因为业务流程容易模拟,而数据闭环一旦启动,就具备复利效应。
比起卷大模型的高大上,数据标注看起来一直是脏活,累活,都是属于被外包的业务。在传统机器学习时代即是如此,需要一些数据了,给出一个标准,然后找外包团队。
Scale AI起步时也是如此,只不过他通过全球人力成本套利,获得不错的利润率。
不过后来的核心关键是,在理解数据如何驱动模型更智能的基础上,构建自动化的数据生产线,形成闭环。
这一点非常关键。就是数据驱动模型的“know-how”,这是核心竞争力。
这个能力可以驱动金融,医疗等需要高精度的场景。
浙公网安备 33010602011771号