上手RAG笔记 - yi-sheng

RAG定义

RAG（Retrieval-Augmented Generation）

RAG核心
是将大模型内部学到的“参数化知识”（模型权重中固化的、模糊的“记忆”），与来自外部知识库的“非参数化知识”（精准、可随时更新的外部数据）相结合。

运作逻辑

运作逻辑就是在 LLM 生成文本前，先通过检索机制从外部知识库中动态获取相关信息，并将这些“参考资料”融入生成过程，从而提升输出的准确性和时效性。

RAG优势

RAG 最核心的价值
准确性与可信度的双重提升：突破了模型预训练知识的限制。它不仅能补充专业领域的知识盲区，还能通过提供具体的参考材料，有效抑制“一本正经胡说八道”的幻觉现象。
RAG 具备可溯源性——每一条回答都能找到对应的原始文档出处，这种“有据可查”的特性极大提高了内容在法律、医疗等严肃场景下的可信度。

时效性保障：
在知识更新方面，RAG 解决了 LLM模型不知道训练截止日期之后发生的事。RAG 允许知识库动态更新。

语义检索的基础

维度	向量数据库	传统数据库 (RDBMS)
核心数据类型	高维向量 (Embeddings)	结构化数据 (文本、数字、日期)
查询方式	相似性搜索 (ANN)	精确匹配
索引机制	HNSW, IVF, LSH 等 ANN 索引	B-Tree, Hash Index
主要应用场景	AI 应用、RAG、推荐系统、图像/语音识别	业务系统 (ERP, CRM)、金融交易、数据报表
数据规模	轻松应对千亿级向量	通常在千万到亿级行数据，更大规模需复杂分库分表
性能特点	高维数据检索性能极高，计算密集型	结构化数据查询快，高维数据查询性能呈指数级下降
一致性	通常为最终一致性	强一致性 (ACID 事务)

维度

向量数据库

传统数据库 (RDBMS)

核心数据类型

高维向量 (Embeddings)

结构化数据 (文本、数字、日期)

查询方式

相似性搜索 (ANN)

精确匹配

索引机制

HNSW, IVF, LSH 等 ANN 索引

B-Tree, Hash Index

主要应用场景

AI 应用、RAG、推荐系统、图像/语音识别

业务系统 (ERP, CRM)、金融交易、数据报表

数据规模

轻松应对千亿级向量

通常在千万到亿级行数据，更大规模需复杂分库分表

性能特点

高维数据检索性能极高，计算密集型

结构化数据查询快，高维数据查询性能呈指数级下降

一致性

通常为最终一致性

强一致性 (ACID 事务)