高级 RAG 技术：查询转换与查询分解

检索增强生成（RAG）的基础流程是用户查询转换为向量嵌入，从向量数据库中取回相似文档，再将这些文档作为上下文送入大语言模型（LLM）生成答案。

基础 RAG 的准确性受制于查询质量，查询模糊、表述不当，或者用户对问题的抽象层次把握不准，检索结果就会出偏差，LLM 拿到的上下文也跟着失真。垃圾输入，垃圾输出，这个规律在 RAG 场景里同样成立。

所以有两类改进方向逐渐成型：查询转换（Query Translation）与查询分解（Query Decomposition）。前者在查询送入向量数据库之前对其进行变形和扩展，后者则把复杂查询拆解成更易处理的子问题。具体技术包括：并行查询检索（FAN-OUT 架构）、倒数排名融合（RRF）、HyDE（假设文档嵌入），以及基于思维链的低抽象分解和基于后退提示的高抽象分解。