无 Embedding、无向量数据库的 RAG 方法：PageIndex 技术解析

PageIndex 是一种无向量、基于推理的检索增强生成（RAG）方法，无需 Embedding、分块或向量数据库即可从长文档中检索答案。

它不依赖语义相似度搜索，而是从文档中构建一棵层次化的目录树（TOC），再由大语言模型对该结构进行推理。模型先借助文档的层级结构定位最相关的章节，然后导航至该章节，生成精确且带引用的答案。

传统 RAG 通过相似度进行检索。PageIndex 通过对结构的推理进行检索。

财务报告、法律合同、监管文件、政策文档、学术论文这种结构清晰的长文档都是它的优势领域。

多数 RAG 系统依赖 Embedding 和向量数据库：把文档拆成块，转成向量，用余弦相似度找答案。但相似度不是推理。PageIndex 采用了另一个方法，通过文档结构的推理而非语义搜索来检索信息。文档不再是一堆扁平文本，而是一个带层级的结构体系，类似于一本附有目录的教科书。

下面用经典电影《Sholay》来演示其工作原理。

posted @ 2026-04-14 21:51 deephub 阅读(38) 评论(0) 收藏举报

刷新页面返回顶部

deephub