大模型之智能体

1 智能体

智能体可以被定义为一种应用程序，它通过观察环境并利用其可用的工具对环境采取行动以尝试实现预设目标。智能体具有自主性，可以在没有人类干预的情况下独立行动，尤其是当它们被赋予了明确的目标或任务时。智能体的构成如下：

添加图片注释，不超过 140 字（可选）

1.1 模型（Model）

在智能体的范畴内，模型指的是作为智能体流程的核心决策者的语言模型（LM）。这些模型能够遵循基于指令的推理和逻辑框架，例如 ReAct、Chain-of-Thought（思维链）或 Tree-ofThoughts（思维树），这是三种不同的方法或框架，旨在增强大语言模型（LLMs）在复杂推理任务中的表现。

Chain-of-Thought (CoT, 思维链)：将复杂的任务为一系列较小的问题和步骤，并逐步解决它们。最后再把较小步骤串起来，形成思维链。增强了解决问题能力，模型输出的可解释性。

Tree-of-Thoughts (ToT, 思维树)：ToT 不仅仅关注线性的推理路径，而是构建了一棵树形结构，其中每个节点代表一个问题的部分解决方案，树枝则代表到达该节点的操作。ToT 鼓励模型探索多个分支路径，并利用搜索算法（如广度优先搜索或深度优先搜索）寻找最优解。

ReAct：ReAct 可以理解为是一种结合了反应性控制（reactive control）和主动规划（proactive planning）的方法

1.2 工具

使智能体能够与外部数据和服务进行交互，并解锁超出基础模型自身能力范围的更广泛行动。工具可以有多种形式，通常是一些http接口；工具，如扩展（Extensions）、函数（Functions）和数据存储（Data Stores），作为智能体通往外部世界的桥梁，允许它们与外部系统交互并获取超出其训练数据的知识。扩展在智能体和外部 API 之间架设桥梁，使 API 调用的执行和实时信息的检索成为可能。函数为开发者提供了更细致的控制，允许智能体生成可以在客户端执行的函数参数。数据存储为智能体提供对结构化或非结构化数据的访问权限，使得数据驱动的应用成为可能。

1.2.1 扩展

视为一种标准化工具，例如航班，地图，天气扩展等；扩展是智能体和API之间的桥梁，作用是将智能体查询转换为API调用；智能体在运行时使用模型和示例来决定哪个扩展（如果有的话）最适合解决用户的查询。类似于程序员解析协议参数，然后调用接口的过程；如果航班查询中少了出发地，该怎么处理；

添加图片注释，不超过 140 字（可选）

1.2.2 函数

完成特定任务的自包含代码模块，模型能够识别一组已知函数，并基于其规范决定何时使用每个函数及所需的输入参数和输出结果。客户端发起查询，智能将查询和一些示例发给模型，模型根据提示和示例输出调用什么函数和输入参数，客户端解析json中的函数名称和参数，客户端负责根据函数提供的指令来调用相应的 API 端点。

添加图片注释，不超过 140 字（可选）

函数是在客户端执行的，而扩展和数据存储则是在智能体端执行。它们旨在为开发人员提供更多的控制权。

添加图片注释，不超过 140 字（可选）

使用函数而非扩展的原因可能：

•架构限制：API 调用需要在应用程序堆栈的不同层进行，

超出直接通过智能体架构流程的能力（例如中间件系统或前端框

架）。

• 安全考量：由于安全或身份验证限制，阻止智能体直接调

用 API（例如 API 未暴露给互联网，或者智能体基础设施无法访

问）。

• 操作顺序：定时或操作顺序限制导致智能体不能实时进行

API 调用（例如批处理操作或人工审核）。

• 数据转换需求：需要对 API 响应应用额外的数据转换逻辑，

而智能体无法执行。例如，如果 API 端点没有提供结果数量的过

滤机制，在客户端使用函数可以实现这样的转换。

• 迭代开发便利性：开发人员希望在不部署额外的 API 端点

基础设施的情况下迭代智能体开发（即函数调用可以作为 API 的

“模拟”）。

1.2.3 数据存储

数据存储通过将传入的原始数据：电子表格或 PDF 文件文档转换为一组向量数据库；让模型访问各种格式的数据，如网站内容、PDF、Word 文档、CSV 文件等，来扩展模型知识的广度和深度。无需进行耗时的数据转换、模型重新训练或微调的过程。智能体响应步骤如下：

1.用户查询首先被发送到一个嵌入模型，以生成查询的嵌入。

2. 这些查询嵌入随后使用匹配算法（例如 SCaNN）与向量数

据库中的内容进行匹配。

3. 匹配到的内容从向量数据库中以文本格式检索，并返回给

智能体。

4. 智能体接收用户查询以及检索到的内容，然后制定相应的

响应或行动。

5. 最终响应被发送给用户。

添加图片注释，不超过 140 字（可选）

情境学习（In-context learning）：固定的工具和知识，这种方法在推理时为通用模型提供提示、工具和少量示例，使模型能够“即时”学习如何及何时使用这些工具来完成特定任务。ReAct 框架就是这种方法在自然语言处理中的一个例子。

• 基于检索的情境学习（Retrieval-based in-context learning，）：有外部数据库可以查询更多工具，这种技术通过从外部记忆中动态检索最相关的信息、工具和相关示例，来填充模型提示。例如，Vertex AI 扩展中的

“示例存储”或基于 RAG 架构的数据存储都是这一方法的应用实例。

• 基于微调的学习（Fine-tuning based learning）：能够训练学习，这种方法涉及在推理前使用特定领域的大数据集对模型进行进一步训练。这有助于模型在接收任何用户查询之前理解何时以及如何应用某些工具。

1.3 编排层

编排层描述了一个循环过程，它决定了智能体如何接收信息、进行内部推理，并利用这些推理来指导其下一步行动或决策。一般来说，这个循环会持续进行，直到智能体达到其目标或一个停止点。有些循环可能是简单的计算和决策规则，而另一些可能包含链式逻辑、涉及额外的机器学习算法，或者实现其他概率推理技术。循环的信息收集、规划、执行和调整，维护记忆、状态、推理和规划，它利用快速发展的提示工程技术及相关框架指导推理和规划，使智能体能够更有效地与其环境互动并完成任务。

添加图片注释，不超过 140 字（可选）

posted @ 2025-04-10 19:34 一字千金阅读(275) 评论(0) 收藏举报

刷新页面返回顶部

一字千金

大模型之智能体

公告