RAG 文本分块:七种主流策略的原理与适用场景

检索是 RAG 系统的搜索引擎,分块则是这个搜索引擎的基础。分块太长、太短、有噪声、切错了位置——随便犯哪个错LLM 都会有问题。行业里有句话流传很广:"分块决定了 RAG 质量的 70%。"

这个说法不夸张:好的分块让检索器拿到完整、有上下文、真正相关的信息;差的分块把文档打成碎片,上下文断裂,LLM 只能靠"编"来填补空白。

 

https://avoid.overfit.cn/post/e6520bd283254415ae61cfa28fb2ef32

posted @ 2026-02-13 21:38  deephub  阅读(6)  评论(0)    收藏  举报