RAG技术浅学习
@
概要
之前有尝试自己搭建本地ollama跑个qwen小模型然后切片数据库做个简单的问答,但是也仅仅只是停留在demo阶段,没有更加深入了解,看了视频,这边记录了解了下RAG运行原理。
整体架构流程
- 精细化预处理(垃圾进,垃圾出,保留数据质量)
- 上下文保持(父子块和重叠机制确保语义完整性)
- 工程化闭环(混合检索和重排序,保证精度)
技术细节
-
转成标准的文本:包括ocr识别、去广告及其他杂质;使用unstructured、layout analysis算法;可以提取标题、时间、分类作为元数据为以后检索做准备
-
切片:递归切分,滑窗重叠;使用small-to-big架构,小块用于检索,大块用于提供给大模型做上下文
-
向量化:双塔模型(通用),m3e可以用于特定行业黑话
-
向量存储和索引构建:可以使用HNSW构建索引,向量入库时候做批处理优化
-
检索增强和验证:混合检索和重排序提升召回质量
小结
先有个印象,后面真要用到的时候可以回顾这些再进行深一步的学习,掌握

浙公网安备 33010602011771号