摘要: 本文是 refine-rag 系列教程的第八篇,我们来学习向量存储的核心技术和 Milvus 数据库的使用。 本文所有代码都在:https://github.com/zonezoen/refine-rag 往期系列文章 007:RAG 入门-向量嵌入与检索 006:RAG 入门-面试官问你,RAG 阅读全文
posted @ 2026-03-18 14:23 zone7 阅读(313) 评论(0) 推荐(2)
摘要: 本文是 refine-rag 系列教程的第七篇,我们来学习一下什么是向量嵌入?有哪些检索方法? 本文所有代码都在:https://github.com/zonezoen/refine-rag 目录 前言 什么是向量嵌入?为什么需要它? 检索方法对比 BM25 检索(关键词匹配) BGE-M3(多功能 阅读全文
posted @ 2026-03-17 15:04 zone7 阅读(290) 评论(0) 推荐(2)
摘要: 本文是 refine-rag 系列教程的第六篇,我们来学习一下什么是切块,应该怎么样去切块? 本文所有代码都在:https://github.com/zonezoen/refine-rag 前言 前面花费了挺多时间去学习怎么读取数据的,那么在读取数据之后,我们要做的操作就是切块,那么什么是切块?为什 阅读全文
posted @ 2026-03-10 17:11 zone7 阅读(258) 评论(1) 推荐(0)
摘要: LangChain 读取表格数据 本文是 refine-rag 系列教程的第五篇,全面讲解如何处理 CSV、PDF 表格等结构化数据。 目录 前言 环境准备 方案一:读取 CSV 文件 方案二:Camelot 提取 PDF 表格 方案三:pdfplumber 提取 PDF 表格 方案四:Unstru 阅读全文
posted @ 2026-03-06 11:27 zone7 阅读(53) 评论(0) 推荐(0)
摘要: LangChain 读取 PDF 文档 本文是 refine-rag 系列教程的第四篇,深入讲解如何使用多种方案处理 PDF 文档。 目录 前言 环境准备 方案一:PyPDF(轻量快速) 方案二:PyMuPDF(功能强大) 方案三:Unstructured(智能解析) 方案四:父子文档结构解析 方案 阅读全文
posted @ 2026-03-06 11:20 zone7 阅读(199) 评论(0) 推荐(0)
摘要: LangChain 读取图片数据 本文是 refine-rag 系列教程的第三篇,教你如何使用 LangChain 处理图片和 PPT 等多媒体数据。 目录 前言 环境准备 读取图片中的文字(OCR) 读取 PPT 文档 多模态 RAG 的应用场景 常见问题 下一步学习 前言 在前面的文章中,我们学 阅读全文
posted @ 2026-03-05 11:27 zone7 阅读(66) 评论(0) 推荐(0)
摘要: LangChain 读取文本数据 本文是 refine-rag 系列教程的第二篇,带你掌握 LangChain 的各种文本数据加载方式。 本文所有代码都在:https://github.com/zonezoen/refine-rag 目录 前言 环境准备 读取 TXT 文本 读取目录文件 读取 JS 阅读全文
posted @ 2026-03-05 11:18 zone7 阅读(225) 评论(0) 推荐(0)
摘要: 本文是 refine-rag 系列教程的第二篇,带你体验一下LangChain 的 LCEL 语法。 本文所有代码都在:https://github.com/zonezoen/refine-rag 前言 LCEL (LangChain Expression Language),语言链表达式语言,是L 阅读全文
posted @ 2026-03-04 11:11 zone7 阅读(66) 评论(0) 推荐(0)
摘要: 简单 RAG 入门 本文是 refine-rag 系列教程的第一篇,带你体验一下 RAG 的简单流程。 本文所有代码都在:https://github.com/zonezoen/refine-rag 前言 在学习 RAG 之前,我们先来对比一下 RAG 和 AI Agent 的概念,只有先了解这些概 阅读全文
posted @ 2026-03-04 11:05 zone7 阅读(410) 评论(2) 推荐(2)