大模型基础知识-coze的应用工作流实践
- Coze智能体:
- ⚠️ 要注意,Coze智能体是类似GPTs的狭义的智能体,而不是我们可能在实际落地项目中常听到的智能体系统
- Coze智能体可控制的主要内容包括:
- 应答行为设定
- 可用工具
- 可用知识库
- 欢迎语和初始问题推荐
- 一些模块启停开关(如记忆模块、推荐下一个问题开关)
- 语音输入输出(相对方便)
- 多模态输入(如上传文件、音频、视频)
- Coze智能体不可控制的主要内容包括:
- 用户与智能体的交互方式(必须为对话形式,用户对话触发)
- 智能体具体行为选择(开发者不可干预智能体在工具选择和调用的决策、知识库调用的决策)
- 随着对话进行而可能需要变化的Prompt提示(提示词是静态不可变的)
- 进阶的补救控制方法:
- 通过撰写更强制的行为提示指令+自定义工作流(可以面向特定场景编排复杂的处理过程或是工具调用组合),但依然不具有绝对可控性
- 适用场景:
- 以对话交互为主的应用场景(Coze智能体在语音输入&输出交互上封装较好)
- 对模型决策行为可控性要求不高,可以接受模型自主决策
- 快速搭建,快速验证
- 例如:
- 角色扮演
- 知识库问答
- Coze应用(工作流):
- Coze应用可控制的主要内容包括:
- 输入、输出信息(可以输入和输出多个参数和复杂数据结构)
- 工具、插件、知识库调用行为及结果后续消费方式(直接消费、加工、混合处理)
- 以工作流为单位,对每一个工作流内部流程进行编排控制(包括条件、循环)
- 能够对运行数据进行存取、加工
- 支持工作流嵌套(可以构造洋葱式层级嵌套架构)
- 支持灵活调整、调度单次模型请求所使用的信息,支持动态变化
- Coze应用问题:
- 没有高度封装的自主决策(所有决策流程都需要构建)
- 没有高度封装的工具、插件调用和结果消费逻辑(例如工作流中使用搜索插件要考虑的问题,比仅仅为智能体添加搜索插件要考虑的问题多)
- 没有高度封装的交互界面(不过你可以在交互界面中找到高度封装的对话组件)
- 适用场景:
- 没有高度封装,灵活度高,所以适用于更复杂的交互界面
- 对特定场景下任务处理的流程性控制要求较高
- 对处理过程中的数据存储、缓存、加工有要求
- 例如:
- 需要进行多步处理的任务,如:长文本生成、分块-解读-汇总工作流程等
- 需要进行过程数据交互的任务,如:用例生成后保存到数据库
- ℹ️ 实际上,Coze应用可以完全覆盖Coze智能体场景,只是存在构建复杂度差异
- Coze应用可控制的主要内容包括:
2.2 怎么设计应用方案?
- 关键认知:
- 业务先行!业务先行!业务先行!(重要的事说三遍!)
- 模型擅长什么?
- 模糊信息理解
- 决策和行动推理
- 非结构化信息的关键信息抓取和结构化
- 自由创作、仿写
- 模型不擅长什么?
- 准确的数值计算
- 确定性强的执行逻辑
- 准确度极高的抄写
- 复杂任务要会拆解,不要指望在一次模型请求里执行多个复杂任务
- 思考顺序:
- 先梳理业务逻辑,确定关键功能块和交互形式
- 再梳理关键功能块的业务动作和关键数据(过程数据+需要持久化的数据)
- 最后确定哪些业务动作需要通过模型处理,哪些业务动作由编排逻辑、插件、工具或是代码完成
2.3 怎么校验和保证AI应用运行稳定性和质量?
3.1 coze可视化编排与AI应用开发框架的对比
3.1 coze可视化编排的优势和问题
-
优势:
- 界面直观,操作便捷,使用门槛低
- 具备一定复杂度的编排能力
- 使用Coze的应用模式,能够快速完成模型-逻辑-界面的端到端搭建
- 学习曲线平缓,易于面向非技术人员的推广
-
问题:
- 交互以正向逻辑为主,容错和异常处理能力弱(如数据模型、参数校验和修正、异常捕获和处理)
- 复杂度、组件嵌套复用层级过高时,难以管理
- 在需要大量使用变量或是基于输入参数灵活调整行为(如上节课的接口请求方案)时笨重难以操作
- 和系统中其他模块的衔接不便,难以使用公开库、私有库,也不容易集成到现有的业务逻辑或是DevOps流程中
3.2 AI应用框架的代码开发的优势和问题
-
案例可参考:大模型的基础知识--使用langgrap工作流自定义function calling
- 优势:
- 代码级别的表达能力灵活度高,可塑性强
- 成熟的软件工程实践范式,支持从各种颗粒度融入大型信息系统和DevOps流程
- 完善的生态支持工程落地时,能解决需处理的各种问题,包括但不限于格式转换、抽象封装、异常截获、服务通讯、缓存和持久化存储方案等
- 支持更复杂的编程方法(如递归、库类封装、异步并发、多线程等),而不仅仅是简单的单向流程+分支、循环
- 具备真正对外提供服务的能力(可视化工作流搭建只考虑逻辑跑通,但离线上可用还有一定距离)
- 问题:
- 对专业性有要求(入门只要有基础的编程能力即可)
- 比可视化工作流更底层,意味着需要考虑的问题更多,便利性不足(需要找到适当的工具库辅助开发)



浙公网安备 33010602011771号