原文链接:https://mp.weixin.qq.com/s/e5vk4x4LqR05N8Tk0HbIAw

前面的文章中,我曾提出限制AI Agent落地的三大挑战,分别是:用户业务场景、用户使用习惯,以及Agent的效率和精度。

其中,Agent的效率和精度是纯粹的技术问题,假以时日就可以解决;用户使用习惯,需要长时间的培养和潜移默化的影响;唯独用户业务场景是最大的难点,不解决这个问题,就很难在企业内落地AI。

技术层面目前来看主要有五点需要攻坚,分别是大模型、提示词、信息检索增强生成、工作流编排、多模态交互。这几项技术,每一个都会影响Agent的效率和精度,即成本、性能和可靠性。如下图所示:

图片

 

1、大模型层面,短期内技术很难得到跨越式提升,更多的是挤牙膏式的更新优化。

比如最近DeepSeek V3模型的更新,号称各项能力全面进阶,但实际上仅仅是成本进一步降低、搜索能力优化,以及性能的进一步提升,大家期待的DeepSeek R2版本仍未出现。

 

2、提示词工程,其实是被很多人忽略的部分,或者说是被很多普通人忽略。因为提示词看似简单,是个人就能用起来,但也仅限于用起来。真要用好提示词,需要系统化的学习,才能让AI沿着我们预期的目标给出我们想要的结果。

为什么掌握提示词工程能力这么重要?原因在于:只有掌握正确的使用提示词,才能让AI沿着我们预期的目标给出我们想要的结果,这也是大模型训练过程很重要的一步(训练集、测试集)。

 

3、信息检索增强生成(RAG),本质上是技术和业务结合后的落地实践。要建立企业级知识库,需要丰富的业务经验和精准的高质量数据结合,才能训练出适配企业自身的大模型。

PS:很多公司存在该痛点,即数据量不够多、数据质量不够高、行业经验不匹配。

知识库最应该解决的其实是数据治理的难题。当前很多公司面临的问题是,各种各样的数据散落在各处,又缺乏行之有效的数据采集、分类、向量化和检索增强能力。大模型是靠数据喂出来的,不可能一堆杂乱无章的脏数据喂出一个很好用的大模型。

数据为业务服务,和业务不相关的知识及数据,对于大模型和知识库来说就是垃圾。且不同行业的数据具有独特的结构、格式和语义特征。例如医疗行业数据涉及患者病历、影像等多模态信息,金融行业则强调交易记录的精确性与安全合规性。

如果缺乏对行业数据特征的深入理解(Know-How),直接用外部数据,会导致数据与模型需求不匹配。

未经治理的数据输入知识库,就如同给法拉利安装单缸柴油发动机,车子上路很可能出各种各样的故障。

 

4、工作流对技术同学来说反而很好理解,类似IT技术领域的CICD流水线。

对工作流进行粗略划分,可以将其分为前端工作流和后端工作流,即Frontend Workflow和Backend Workflow。在AI领域,它们的协作关系大致如下图所示:

图片

 

5、多模态交互能力其实很好解决,现在很多大模型都具备这种能力。

正如我在文章开头展示的那张图所示,未来对大部分公司来说,底层大模型(多模态交互能力)直接调用即可,没必要自己研发。企业端要做的重点,是在用户业务场景整合自己的业务数据和行业经验,搭建适配自己的企业级RAG知识库。

 

6、第六点核心能力,其实就是行业的Know-How经验和精准的数据。大模型、提示词、知识库、工作流、多模态交互能力,甚至最近很火的MCP等等,都是为Know How服务。

什么业务场景适合AI来执行,需要哪些业务知识,涉及哪些关键节点和决策,都是落地智能体落地需要考虑的。

当前大模型在真正的用户业务场景面前,就是一个会经常犯错的实习生,与其花费大量时间投入大量资源去做预训练,还不如找个业务专家给出业务链路,让大模型跟着学就行。

行业的Know-How经验,可以理解为真正懂业务的专家角色。只有基于这个角色的经验和认知,才能设计出真正的企业内能够落地的智能体,且业务应用场景一定要极度收敛,找到具体的应用场景。

在信息幻觉未被彻底解决之前,技术实践一定要有确定性。在场景选择方面,尽可能贴近标准化或者更易于标准化的场景。

想要让智能体真正产生业务价值,需要从业务模块、流程规则、需求细节一步一步去教大模型,帮大模型去学习并掌握真正的专业知识和技能。