2025 年 6月 7 日随笔档案 - pDJJq

2025年6月7日

摘要：这篇文章探讨了Embedding与Rerank在RAG系统中的关键作用： 1. **Embedding**（语义召回阶段） - 功能：将文本转化为稠密向量，实现语义相似度搜索 - 特点：速度快、覆盖广（高召回率），支持毫秒级海量检索 - 流程：先离线建立向量索引，再在线查询匹配Top-K结果 2. **Rerank**（精排阶段） - 功能：对初筛结果进行精准重排序 - 特点：计算慢但精度高（高准确率），采用交叉编码分析query-document关系 - 价值：过滤噪声文档，提升LLM输入质量 3. **参数区别** - TopK：控制召回阶段的候选量（较大值，如50） - TopN：决定最终输入LLM的文档数（较小值，如3） 4. **评估标准** - 通过MTEB等基准测试衡量模型能力 - 关键指标：检索准确率（Hit Rate）、排序质量（NDCG） - 开源模型（如Qwen/BGE）已接近商业模型性能文章通过对比分析，阐明了两个技术环节的协同关系：Embedding确保"不遗漏"，Rerank实现"精准投喂"。阅读全文

posted @ 2025-06-07 01:18 pDJJq 阅读(616) 评论(0) 推荐(0)

pDJJq

公告