RAG是什么

RAG

RAG 检索增强生成(Retrieval Augmented Generation),已经成为当下最火热的LLM应用方案和打开方式了。

理解起来不难,就是通过自有垂域数据库检索相关信息,然后合并成为提示模板,给大模型润色生成回答。

每当将大模型应用于实际业务场景时发现,通用的基础大模型基本无法满足实际业务需求,主要有以下几方面原因:

  • 知识的局限性:大模型自身的知识完全源于训练数据,而现有的主流大模型(deepseek、文心一言、通义千问…)的训练集基本都是构建于网络公开的数据,对于一些实时性的、非公开的或私域的数据是没有。

  • 幻觉问题:所有的深度学习模型的底层原理都是基于数学概率,模型输出实质上是一系列数值运算,大模型也不例外,所以它经常会一本正经地胡说八道,尤其是在大模型自身不具备某一方面的知识或不擅长的任务场景。

  • 数据安全性:对于企业来说,数据安全至关重要,没有企业愿意承担数据泄露的风险,尤其是大公司,没有人将私域数据上传第三方平台进行训练会推理。这也导致完全依赖通用大模型自身能力的应用方案不得不在数据安全和效果方面进行取舍。

一句话总结:

RAG(中文为检索增强生成) = 检索技术 + LLM 提示。

posted @ 2026-03-09 22:26  deemon2004  阅读(11)  评论(0)    收藏  举报