初探大模型-4-RAG和LangChain框架

RAG

RAG检索增强生成( Retrieval-Augmented Generation),从庞大知识库中检索到的相关信息,并以此为基础,指导大型语言模型生成更为精准的答案。

要解决的问题

大模型幻觉

时效性查

专业能力欠缺

面对复杂问题推理能力有限

长文本处理能力较弱

RAG工作流程

文本处理、向量检索、数据增强、数据生成。将文本载入后分块,使用词嵌入模型将其向量化,存入向量数据库,解析用户问题,使用相同的词嵌入模型向量化,检索相似的知识库文本,叠加prompt带入LLM,生成answer

  1. 数据处理阶段

    • 对原始数据进行清洗和处理。

    • 将处理后的数据转化为检索模型可以使用的格式。

    • 将处理后的数据存储在对应的数据库中。

  2. 检索阶段

    • 将用户的问题输入到检索系统中,从数据库中检索相关信息。
  3. 增强阶段

    • 对检索到的信息进行处理和增强,以便生成模型可以更好地理解和使用。
  4. 生成阶段

    • 将增强后的信息输入到生成模型中,生成模型根据这些信息生成答案。

LangChain

LangChain:大语言模型开发框架,用于快速构建基于大型语言模型的端到端应用程序或工作流程。将LLM、向量数据库、Prompt、知识库等整合。

核心组件:

  • 模型输入输出模块:用于与LLM实现交互接口
  • 数据连接:与特定应用程序的数据进行骄傲胡的接口
  • 链(Chains):将组件组合,实现流程
  • 记忆(Memory):实现链的多次运行之间持久化的应用程序,例如带长记忆的会话
  • 代理(Agents):扩展模型的而推理能力,用于复杂的应用的调用序列
  • 回调(Callbacks):扩展模型的推理能力,用于复杂的应用的调用序列
posted @ 2025-05-30 17:41  AfroNicky  阅读(91)  评论(0)    收藏  举报