RAG几种技术组合 向量检索 GraphRAG PageIndex ES
核心思想:向量检索(Vector)擅长找“包含某个意思的文本块”,但它不知道这个文本块在整个世界观里的位置。
知识图谱(Graph)擅长表达“谁和谁有什么关系”,但它缺乏大段的文本细节。两者结合,就是用 Vector 找入口,用 Graph 扩充背景知识。
这是一个非常经典的架构选型问题。在构建企业级大模型应用时,这三种检索方式分别对应了“精准匹配”、“语义理解”和“全局关系推理”三个不同的维度。
它们不仅不冲突,在真正的生产环境中,它们几乎总是搭配使用的(即 Hybrid RAG / 混合检索)。
下面我为你详细拆解它们各自的使用场景,以及如何将它们组合起来。
一、 三种 RAG 技术的对比与使用场景
1. 传统检索(如 BM25、Elasticsearch)
- 核心原理:基于倒排索引、关键词匹配(TF-IDF / BM25)。它不理解句子的意思,只看“字词”是否出现。
- 优势:对专有名词、编号、特定术语的召回率极高(100% 匹配);速度极快,成本极低。
- 劣势:不懂同义词(搜“苹果手机”搜不到“iPhone”);无法理解自然语言问句。
- 适用场景(大海捞针):
- 精确查询:用户搜索特定的产品型号(如 "RX-78-2")、订单号、法律条款编号。
- 特定人名/地名:比如在你当前打开的
medtech_ecosystem.txt中,如果用户精确搜索某个医疗器械公司的名字,用这种方式最准。
2. 标准 RAG(向量召回 Vector Retrieval)
- 核心原理:将文本转化为高维向量(Embedding),通过计算向量的余弦相似度来寻找内容。
- 优势:具备语义理解能力,支持模糊搜索和同义词;用户可以用大白话提问。
- 劣势:
- 缺乏全局视野:它只能召回“局部”的文本块(Chunk),无法回答“总结一下整本书讲了什么”这种宏观问题。
- 容易丢失实体细节:对于生僻词或特定编号,向量化后特征可能被稀释,导致召回失败。
- 适用场景(语义问答):
- 知识库问答(FAQ):用户问“如何办理离职?”,文档里写的是“员工解约流程”,向量检索能完美识别它们是同一个意思。
- 客服机器人:根据用户的自然语言描述,匹配最相关的帮助文档段落。
3. GraphRAG(知识图谱 RAG)
- 核心原理:利用 LLM 从文档中抽取“实体(Entity)”和“关系(Relationship)”,构建成知识图谱。检索时,不仅找节点,还找节点之间的连线。
- 优势:
- 多跳推理(Multi-hop Reasoning):能回答 A 导致 B,B 导致 C 的复杂关联问题。
- 全局总结(Global Sensemaking):微软的 GraphRAG 提出了 Community(社区)概念,非常擅长回答“这个数据集的核心主题是什么?”这种宏观问题。
- 劣势:构建成本极高(需要大量消耗 LLM Token 来抽取图谱);构建速度慢;不适合简单的事实性问答(杀鸡用牛刀)。
- 适用场景(复杂推理与全局洞察):
- 生态/产业链分析:结合你正在看的
medtech_ecosystem.txt,如果问“A公司和B公司之间通过哪些中间商产生了联系?”,只有 GraphRAG 能顺着图谱的边找出来。 - 金融风控/反欺诈:挖掘隐藏的股权穿透关系或资金流向。
- 长文本/全书总结:提炼几百万字文档的核心脉络。
- 生态/产业链分析:结合你正在看的
二、 不同技术之间是否可以搭配使用?(绝对可以,且必须搭配)
在真实的工业界架构中,单一的检索方式已经无法满足需求。目前最前沿的做法是构建混合检索路由(Hybrid Routing & Retrieval)。
结合你正在测试的医疗科技(MedTech)场景,我们可以这样搭配:
搭配方案 1:向量检索 + 关键词检索(最常见的 Hybrid Search)
这是目前大多数向量数据库(如 Milvus, Qdrant, Elasticsearch)的标配。
- 怎么搭配:当用户提问时,系统同时进行向量检索(找语义相关的 Chunk)和 BM25 关键词检索(找包含特定术语的 Chunk)。然后使用 RRF(倒数秩融合)算法将两边的结果重新排序(Rerank)。
- 效果:既懂语义,又不会漏掉特定的医疗器械型号或专有名词。
搭配方案 2:向量检索 + GraphRAG(局部与全局的完美结合)
微软的 GraphRAG 论文中明确指出了这种搭配(Local Search + Global Search)。
- 怎么搭配:
- 第一步(意图识别):用一个轻量级 LLM 判断用户的问题是“局部事实”还是“全局总结/复杂关系”。
- 第二步(分流):
- 如果问:“X光机的操作步骤是什么?” -> 走标准向量 RAG(便宜、快速、精准)。
- 如果问:“医疗科技生态中,影像设备制造商和 AI 软件供应商之间存在怎样的竞争与合作关系?” -> 走 GraphRAG(顺着图谱节点进行推理和总结)。
搭配方案 3:Graph + 向量召回
非常抱歉,我之前的回答确实把 pageIndex(无向量化 RAG)和传统的全文检索引擎(如 ES/BM25)混淆了。你指出的非常对,它们背后的核心理念是完全不同的。
让我们重新梳理 pageIndex(无向量化 RAG) 的真实原理、使用场景,以及如何与其他技术结合。然后我再为你举一个 Graph-Augmented Vector RAG 的具体案例。
一、 重新认识 pageIndex(无向量化 RAG)
在现代 RAG 架构(如 LlamaIndex 等框架)中,pageIndex(或 Document Summary Index / Tree Index) 是一种不依赖 Embedding 模型和向量距离的检索方式。
1. 背后原理:大模型驱动的“目录与摘要”
它的核心思想是模拟人类看书的方式:先看目录和章节摘要,再翻到具体页码。
- 构建阶段:系统按物理结构(如 Page、Section、Document)对文档进行切分。然后,调用 LLM 为每一页(或每个 Chunk)生成一段高度凝练的摘要(Summary)。
- 检索阶段:当用户提问时,系统不计算向量相似度,而是把所有页的“摘要”拼接起来发给 LLM,让 LLM 自己判断:“为了回答这个问题,我需要去读哪几页(哪个 Chunk)的原文?”
- 提取阶段:LLM 选出目标页码后,系统将这几页的完整原文提取出来,再让 LLM 生成最终答案。
2. 为什么需要它?(使用场景)
- 跨页/跨文档的对比与总结:比如问“2023年财报和2024年财报在营收策略上有什么不同?” 向量检索很容易只召回包含“营收”的碎片,导致上下文丢失。而 pageIndex 会让 LLM 先看两份财报的摘要,然后精准定位到两份财报的“战略篇”进行完整对比。
- 规避向量模型的语义盲区:有时候 Embedding 模型对某些特定行业的黑话、代号理解极差,导致向量距离算不准。pageIndex 直接用 LLM 的推理能力去读摘要,绕过了向量化这一步的误差。
3. 如何与其他 RAG 技术结合?
- pageIndex 作为“路由(Router)”:面对海量文档库,先用 pageIndex(看摘要)确定目标文档或章节,把搜索范围从 10000 页缩小到 10 页;然后在这 10 页里,使用 Vector RAG(向量检索) 精准定位到具体的段落。这被称为 Summary-to-Chunk 级联检索。
二、 案例解析:Graph 作为 Vector 的“导航仪”(Graph-Augmented Vector RAG)
结合你项目中正在测试的 medtech_ecosystem.txt(医疗科技生态),我们来看这个搭配方案是如何工作的。
核心思想:向量检索(Vector)擅长找“包含某个意思的文本块”,但它不知道这个文本块在整个世界观里的位置。知识图谱(Graph)擅长表达“谁和谁有什么关系”,但它缺乏大段的文本细节。两者结合,就是用 Vector 找入口,用 Graph 扩充背景知识。
案例场景:
用户提问:“分析一下 A 公司(一家生产心脏起搏器的初创企业)最近的合规风险,并给出建议。”
纯 Vector RAG 的处理过程(容易翻车):
- 向量检索去库里搜“A公司”、“心脏起搏器”、“合规风险”。
- 召回了几个 Chunk:“A公司上个月发布了新款起搏器”、“A公司正在申请 FDA 认证”。
- LLM 生成答案:“A公司正在申请 FDA 认证,建议关注审批进度。”
- 缺陷:答案非常单薄,缺乏深度,因为向量检索只看到了表面文字。
Graph-Augmented Vector RAG 的处理过程(降维打击):
Step 1: Vector 检索找“入口节点”
- 系统先用向量检索,找到了最相关的文本块,并从中提取出核心实体:[A公司]、[FDA认证]。
Step 2: Graph 导航仪介入(扩充上下文)
- 系统拿着 [A公司] 这个节点,去底层的医疗科技知识图谱(Graph)里查询它的“邻居关系”(一度和二度连接)。
- 图谱返回了这些隐藏关系:
[A公司] --(依赖供应商)--> [B芯片厂][B芯片厂] --(近期面临)--> [欧盟出口管制审查][A公司] --(竞争对手)--> [C巨头][C巨头] --(刚刚因为合规问题被罚)--> [FDA数据隐私罚单]
Step 3: 融合与生成(Augmentation)
- 系统将 Step 1 的原文文本块 + Step 2 的图谱关系路径,一起打包作为 Context 喂给大模型。
Step 4: LLM 生成最终答案
- “关于 A 公司的合规风险分析如下:
- 直接风险:根据文档,A 公司正在申请 FDA 认证,需关注常规审批进度。
- 供应链隐性风险(来自图谱):A 公司的核心部件依赖 B 芯片厂,而 B 厂正面临欧盟出口管制,这可能导致 A 公司产品难产,引发违约风险。
- 行业合规风向(来自图谱):竞争对手 C 巨头刚因数据隐私被 FDA 重罚,建议 A 公司在起搏器的数据回传功能上提前做好隐私合规审查。”
总结
在这个案例中,Vector 就像是空降兵,精准落到了“A公司”这个坐标;而 Graph 就像是雷达地图,把 A 公司周围的敌情、补给线(供应链、竞争对手)全部点亮了。这就是 Graph-Augmented Vector RAG 的强大之处。

浙公网安备 33010602011771号