后端开发者快速上手AI Agent：基于Astron的极简概念、架构与部署教程

目录
1、先搞清楚一个问题：什么是 Agent？
2、LLM 和 Agent
3、Agent（智能体）核心概念
3.1 Agent 定义
3.2 Agent 能力
4、Agent 原理
5、Astron Agent（星辰 Agent）是什么
6、Astron Agent 核心组件与架构设计
6.1 企业级云服务的基础设置
6.2 Agent的大脑 -- 模型底座
6.3 Agent为什么能干活 -- 企业级核心能力
6.4 Agent 的创建 -- 智能体开发
6.5 Agent 的优化 -- 智能体调优
6.6 企业级开发与管控
6.7 Astron 开放生态 -- 开放的生态平台
7、Astron 产品功能特性
7.1 产品功能特性
7.2 关键技术特性
8、Astron 服务架构
8.1 外部集成服务
8.2 控制层后端层
8.3 核心微服务层
8.4 插件系统
9、Docker Desktop 容器化部署效果

1、先搞清楚一个问题：什么是 Agent？

话不多说，咱们直接开始~

在开始讲 Astron Agent 智能体之前，我们先统一一个认知。

LLM（大语言模型）
更像一个“聪明的问答系统”，负责思考和回答问题
Agent（智能体）
不只是回答问题，而是可以：
拆解任务
调用工具
执行动作
记住上下文
不断优化结果

一句话区别：LLM 负责“想”，Agent 负责“把事情做完”。

2、LLM 和 Agent

LLM 是接收输入、理解语义、生成内容、输出文本的被动响应式语言模型

Agent 是能够感知环境、理解指令、制定步骤并执行任务的智能体

我们熟悉并常常使用 LLM 大模型，但可能很少用到 Agent。

我们都知道 LLM 是大语言模型，市场上最好的大语言模型有GPT(OpenAI)、Gemini(Google)、ChatGLM(智谱清言)、通义千问(阿里巴巴)、讯飞星火(科大讯飞)等。

我们常打开网页版对话窗口，将大模型作为技术顾问，主动问一些问题，大模型在很短的思考时间后给出我们解决问题的建议。我们采纳这些建议就按照建议去处理问题，认为回答内容没有解决问题，可以继续追问大模型。

假设你下班后很累，想吃一顿外卖，但你不知道该怎么点、点什么。

（1）你去问 LLM（大语言模型）

LLM 的角色更像一个顾问，它只负责告诉你应该怎么做，真正的操作（打开 App、下单、支付）全部需要你自己完成

LLM 会思考、会回答，但不行动

你对 LLM 说：

“我想点一份外卖，不知道该怎么点、点什么。”

LLM 会回答你类似这样的话：

打开外卖 App

注册或登录账号

搜索你想吃的菜品

选择商家并下单

支付并等待配送

（2）你去问 Agent（智能体）

Agent 不只是告诉你怎么做，而是直接帮你把事情做完。

Agent 会思考、会规划、还能调用工具并真正执行行动

你对 Agent 说：

“我想点一份外卖。”

Agent 会这样做：

理解你的目标：解决吃饭问题

主动思考方案：是点外卖、做饭还是去附近吃

调用工具：打开外卖平台

执行步骤：

搜索你常点的餐厅

选择合适的套餐

下单并支付

完成任务：把外卖点好，并告诉你“已下单，预计 30 分钟送达”

3、Agent（智能体）核心概念

3.1 Agent 定义

Agent 是能够感知环境、理解指令、指定步骤、执行任务的自主"执行人"，不依靠固定流程，能在不确定场景中，自主选择步骤，调整策略。

3.2 Agent 能力

具备感知环境、认知能力、行动、闭环的能力。

感知环境
感知环境指Agent具备读取外部数据的能力
支持多模态输入，比如文本、文档、图片、音频、视频等数据可以作为Agent的外部输入，Agent接收输入后，对输入内容进行意图识别并输出符合预期的结果。
认知能力
指 Agent 能够理解用户的指令，分析用户的意图，并制定合适的目标，形成执行步骤
行动
Agent 能够用接口、工具或直接生成内容来完成既定的执行步骤。观察结果再调整下一步
闭环
Agent 能够形成自我闭环。
比如某个API调用失效，Agent会切换策略，切换执行计划；某个采集的数据集是不齐全的，会再次从网络抓取；如果执行结果有问题，会尝试其他策略来达成计划目标。

4、Agent 原理

Agent 基本框架大概分为记忆、规划、工具、行动4个模块。

（1）记忆模块

短期记忆：
维持对话的连贯性，用于临时保存当前对话的上下文

    长期记忆：
    类似于知识库，用于存储智能体学到的经验，重要事实，用户偏好等持久化信息。
    记忆模块使Agent 能够拥有连续性和个性化

（2）规划

这是智能体思考的过程，面对复杂目标时，智能体会将目标分解为可执行的子任务序列。

反思与自我反思：这是Agent的关键，指智能体能够评估自身行动结果，修正错误，优化后续计划，实现持续改进。

（3）工具

智能体扩展工具，自身能力外的插件，可以调用这些工具，突破纯文本处理的瓶颈，与现实世界（比如获取实时信息、操作外部系统）进行交互

（4）行动

智能体执行步骤的执行环节。

智能体根据规划，综合运用记忆和工具，执行具体的操作（比如生成回答，调用API，修改文件等）。

5、Astron Agent（星辰 Agent）是什么

讯飞星辰Agent平台是科大讯飞自研，面向国内的企业级Agent开发平台。Astron 是科大讯飞推出的一款开源共建智能体平台。

Astron Agent 平台搭建了一套从基础设置、模型底座开始，具备AI能力、RAG知识库、RPA、记忆能力、测评工具、MCP、代码解释器等核心组件的智能体开发平台。并且能规模化管控，支持企业级高可用部署。

Astron 能帮助你不用从零写 AI 系统，就能搭建高可用、企业级的商用 AI Agent。

6、Astron Agent 核心组件与架构设计

从整体上看，Astron Agent 平台可以拆成 7 个层次：

企业级云服务基础设施
模型底座
核心能力组件
智能体开发
智能体调优
企业级开发与管控
开放的生态平台

6.1 企业级云服务的`基础设置`

基础设置提供了算力、存储、网络、安全、稳定性等服务。

比如阿里云、华为云等公有云服务。我们可以把服务部署到这些云服务器，当然也可以本地部署。Astron 提供了 Docker Compose、Helm两种部署方式，满足不同的场景需求。

6.2 Agent的大脑 -- `模型底座`

支持本地部署的模型、支持OpenAI Link API、支持讯飞星辰Maas

这里 Astron 不限制单一模型，支持私有化模型，支持国内/海外模型灵活切换。企业或个人完全可以基于实际场景选择不同的大模型底座。

6.3 Agent为什么能干活 -- `企业级核心能力`

Agent 不只能回答用户的问题（传统的聊天机器人），还能查资料、算数据、操作系统、执行流程。

核心能力包括插拔式知识库、AI能力、RPA、记忆、MCP、测评工具、代码解释器。

6.4 Agent 的创建 -- `智能体开发`

支持多种交互形态，文本、图片、语音、虚拟人、实时语音通话

支持多种智能体形态，单智能体、多智能体、工作流驱动

这里的智能体形态可以理解为，1个智能体单独干活，多个智能体组合干活，工作流驱动指的是可按照流程自动的执行任务。

6.5 Agent 的优化 -- `智能体调优`

实际场景中搭建的智能体，不会是一次搭建就能解决业务中的问题，往往会遇到各种现实问题，使得企业很难落地。

搭建智能体后，需要持续调优，具体措施包括Prompt开发、多维度评测、全链路观测、效果优化。

需要开发者看清 Agent 每一步在想什么、做什么，然后不断调优。

6.6 `企业级开发与管控`

Astron 提供的企业级开发管控能力是 Agent 从个人Demo到企业化生产力工具的关键。

Astron 提供了低代码开发、场景模板、组织架构、权限管控、授权管理、安全审核、监控运营、团队空间等能力，使得企业级开发管控得以实现。

6.7 Astron 开放生态 -- `开放的生态平台`

Astron 不是封闭的开发平台，允许对接讯飞开放平台 AI 能力、Astron RPA 平台、虚拟人平台、AIUI 超拟人交互平台、Zapier等，来和外部进行交互。

Agent 可以真正进入企业系统、第三方工具和真实业务流程。

7、Astron 产品功能特性

7.1 产品功能特性

多类型智能体开发
简易版 -- 提示词驱动的智能体
进阶版 -- 工作流驱动的智能体
专业版 -- 集成RPA、语音交互虚拟人智能体
多类型模型接入
提供云API接入、本地部署、企业级私有化部署方案
满足企业私有化、高并发，高可用的业务场景
全流程智能体优化
提供开发、调试、评测、优化全流程闭环能力。支持实时干预、变量追踪、多维性能分析
企业级开发管控
支持灵活的权限管控，内置数据看板实时呈现关键指标，助理敏捷优化Agent构建策略

7.2 关键技术特性

流式多模态引擎
支持多模态输入，包括文本、文档、图像、音频、视频
支持多模态输出，包括文本、文档、图像、音频、视频
使用了复杂流程编排引擎，上下文管理机制，丰富的能力节点来驱动工作流Agent。
Astron RPA "最强双手"
支持Windows桌面软件与浏览器，实现跨应用，端到端的自动化。
内置300+原子能力，支持图形化编排，自定义扩展
深度集成Astron Agent。支持RPA与AI的双向调用。
企业级评测能力
功规驱动的端到端效果评测体系
丰富的评测能力Agent
全维度复刻人工评测

8、Astron 服务架构

Astron 采用微服务架构，由十个核心服务组成，每个服务专注于特定的业务领域，并通过容器化方式独立部署。

Astron 还集成了Casdoor、Ragflow、RPA开源框架来实现单点登录、知识增强检索、流程自动化能力。

8.1 外部集成服务

Casdoor
Casdoor 是一个基于OAuth 2.0的开源的身份认证平台。Astron 基于Casdoor实现的单点登录。
Ragflow
Ragflow 是一款开源的知识库平台，将RAG技术和Workflow深度融合，提供了一个精准可控的自动化的企业级知识管理解决方案。
RPA
AstronRPA 是一款企业级机器人流程自动化桌面应用。通过可视化设计器支持低代码开发，快速构建工作流，实现桌面软件与浏览器页面自动化。
用户可以在 Astron Agent 中直接调用RPA流程节点，实现RPA与Agent的高效协同。

8.2 控制层后端层

用户认证和权限管理

模型管理和配置接口

文件上传下载服务

数据统计分析

core服务接口

8.3 核心微服务层

Agent Service 智能体服务
Agent 核心执行引擎
Agent 生命周期管理
工具调用和插件集成
会话管理和上下文持久化
Workflow Service 工作流服务
工作流编排和执行引擎
多步骤流程自动化
工作流版本管理
事件驱动的异步处理
工作流可视化运行时调试
Knowledge Service 知识库服务
知识库管理
多种文档格式解析
RAG支持星火知识库和Ragflow
Memory DB Service 内存数据库服务
对话历史存储和检索
上下文管理，调用长期记忆和短期记忆
会话数据持久化
Tenant Service 租户服务
多租户管理
空间隔离与权限控制
组织结构管理
资源配额管理
Common Service 公共模块
提供公共服务和工具类
认证和审计服务
可观测性支持
基础设置组件数据库（MySQL、PGSQL）、缓存（Redis）、消息队列（kafka）
统一的日志系统
OSS（MinIO）对象存储集成

8.4 插件系统

AI Tools
集成讯飞AI工具，通过iFLYTEK API集成
第三方AI工具集成
工具调用管理和结果缓存
RPA
RPA流程自动化
流程录制和回放
自动化脚本执行
与外部RPA执行器集成
LINK
外部链接资源集成
URL内容抓取处理
链接验证和元数据提取

9、Docker Desktop 容器化部署效果

部署过程可以参考下一篇博客：企业级AI Agent本地化部署实战：基于讯飞星辰与Astron的实战详解（附避坑清单）

Powered By niaonao
https://github.com/iflytek/astron-agent
企业级AI Agent本地化部署实战：基于讯飞星辰与Astron的实战详解（附避坑清单）

posted @ 2026-01-15 10:43 niaonao 阅读(0) 评论(0) 收藏举报

刷新页面返回顶部

niaonao

认真你就赢了