RAG技术浅学习

@

概要

参考:https://www.douyin.com/user/self?from_tab_name=main&modal_id=7609618485493141093&showTab=favorite_collection

之前有尝试自己搭建本地ollama跑个qwen小模型然后切片数据库做个简单的问答,但是也仅仅只是停留在demo阶段,没有更加深入了解,看了视频,这边记录了解了下RAG运行原理。

整体架构流程

  • 精细化预处理(垃圾进,垃圾出,保留数据质量)
  • 上下文保持(父子块和重叠机制确保语义完整性)
  • 工程化闭环(混合检索和重排序,保证精度)

技术细节

  1. 转成标准的文本:包括ocr识别、去广告及其他杂质;使用unstructured、layout analysis算法;可以提取标题、时间、分类作为元数据为以后检索做准备

  2. 切片:递归切分,滑窗重叠;使用small-to-big架构,小块用于检索,大块用于提供给大模型做上下文

  3. 向量化:双塔模型(通用),m3e可以用于特定行业黑话

  4. 向量存储和索引构建:可以使用HNSW构建索引,向量入库时候做批处理优化

  5. 检索增强和验证:混合检索和重排序提升召回质量

小结

先有个印象,后面真要用到的时候可以回顾这些再进行深一步的学习,掌握

posted @ 2026-04-11 13:01  蜗牛使劲冲  阅读(2)  评论(0)    收藏  举报