初探大模型-4-RAG和LangChain框架
RAG
RAG:检索增强生成( Retrieval-Augmented Generation),从庞大知识库中检索到的相关信息,并以此为基础,指导大型语言模型生成更为精准的答案。
要解决的问题:
大模型幻觉
时效性查
专业能力欠缺
面对复杂问题推理能力有限
长文本处理能力较弱
RAG工作流程
文本处理、向量检索、数据增强、数据生成。将文本载入后分块,使用词嵌入模型将其向量化,存入向量数据库,解析用户问题,使用相同的词嵌入模型向量化,检索相似的知识库文本,叠加prompt带入LLM,生成answer

-
数据处理阶段
-
对原始数据进行清洗和处理。
-
将处理后的数据转化为检索模型可以使用的格式。
-
将处理后的数据存储在对应的数据库中。
-
-
检索阶段
- 将用户的问题输入到检索系统中,从数据库中检索相关信息。
-
增强阶段
- 对检索到的信息进行处理和增强,以便生成模型可以更好地理解和使用。
-
生成阶段
- 将增强后的信息输入到生成模型中,生成模型根据这些信息生成答案。
LangChain
LangChain:大语言模型开发框架,用于快速构建基于大型语言模型的端到端应用程序或工作流程。将LLM、向量数据库、Prompt、知识库等整合。
核心组件:
- 模型输入输出模块:用于与LLM实现交互接口
- 数据连接:与特定应用程序的数据进行骄傲胡的接口
- 链(Chains):将组件组合,实现流程
- 记忆(Memory):实现链的多次运行之间持久化的应用程序,例如带长记忆的会话
- 代理(Agents):扩展模型的而推理能力,用于复杂的应用的调用序列
- 回调(Callbacks):扩展模型的推理能力,用于复杂的应用的调用序列

浙公网安备 33010602011771号