RAG学习

RAG

大模型面临的问题

  1. 易出现幻觉
  2. 利用文档减少幻觉但文档内容太多、大模型寻找答案变难

什么是RAG

RAG,全称Retrieval Augmented Generation,检索增强生成。RAG旨在解决从文档中抽取与用户问题相关的文字片段。

Embedding模型————RAG的基础

将一句话、一段话抽象为一个向量

Chunking(切块)

文档 --> chunking --> embedding

向量数据库

用于存储chunking、embedding后的结果的数据库,利用该数据库寻找与问题向量接近的向量
image

  • 常见的数据库有pinecone、chromaDB、PostgreSQL+pgvector

利用RAG的大模型全流程

image
image

RAG的困境

  1. 分块可能会将关键信息切割
  2. RAG缺乏全局的视角

参考链接:
https://www.bilibili.com/video/BV19RJhzyEWN/?spm_id_from=333.337.search-card.all.click&vd_source=da04a3e481cb89d708a02f23b60e19a4

posted @ 2025-07-08 14:23  zheng019  阅读(16)  评论(0)    收藏  举报