multi-agnet 的摘录

babyagi 主张使用一些工具来解决复杂的任务,代表是react,reasoning and act, 框架是早期多智能体系统的一个代表方法,他通过代理使用工具来解决复杂任务。 随着多智能体的不断发展,react 也被用于指导其他代理系统的设计,尤其是在需要协作和策略指定的场景中。

multi-agent 现现在更多是通过角色扮演(通过写prompt 给agent 赋予一个角色,并约定一些行为)和agent 之间的协同。Multi-Agent像是一个团队,团队里面的Agent更像是不同的工种,通过不同的Agent之间的分工协作,(有的做规划,有的执行,执行的时候可以调用工具,也可以利用LLM本身的代码,总结能力等)

1.多智能体的每个Agent只需要关注自己的立场,与自己相关的信息即可。不需要cover所有的历史信息,而单智能体,比如AutoGPT,是需要记住所有的历史信息,意味着单智能体在面临长历史的复杂任务时,对记忆容量(大模型支持的序列长度)要求比较高。多智能体在这方面有很明显的优势。

2.通过角色扮演的机制可以排除一些其他视角的观点,让大模型的表现更稳定,单智能体由于混杂了很多任务,无法做到这一点。

3.可拓展性更好,单智能体的拓展性依赖于memory的一些节省token的策略,对于更复杂的任务,每次输入给大模型的context会变长,会产生性能下降的风险(大模型处理长序列会存在丢失关键信息的情况等等)。多智能体分工协作则没有这个问题,因为每个智能体只完成特定的子任务,子任务一般不会造成很长的context。

MetaGPT
在软件工程中,SOP促进不同角色之间的协作。MetaGPT展示了其将复杂任务分解为分配给不同角色的特定可操作过程的能力(例如Product Manager, Architect, Engineer等等)。

MetaGPT要求agent生成结构化输出,如高质量的需求文档、设计工件、流程图和接口规范。中间结构化输出的使用显著提高了目标代码生成的成功率

AutoGen的一个核心设计原则是精简和使用多智能体对话来整合多智能体工作流。这种方法还旨在最大限度地提高实现的可重用性agents。
AutoGen的两个关键概念:conversable agents和conversation programming。

conversable agents是一个具有特定角色的实体,可以传递要发送和向其他conversable agents接收信息以及从其他conversable agents接收信息

agent与agent之间的交互的通讯协议衔接agent与agent之间的交互方式。agent可以与agent 之间进行交互,agent 也可以和agent 域进行交互,agent 域 内部有更多的 agent 通过协作完成响应的概念,协作可以是串行的,也可以是并行的。

agent 作为基本单元,还是通过 prompt 定义其角色,功能,以及交互内容。

posted @ 2025-06-18 18:05  wsl-hitsz  阅读(22)  评论(0)    收藏  举报