摘要: 目录背景示例一:产品版本和型号的细粒度区分示例二:不同产品线的相似功能示例三:售后政策的版本/时间漂移如何解决?1. 混合检索(Hybrid Search)的强化2. 引入重排器(Re-Ranker)进行细粒度区分3. 增强文档与块(Chunk)的结构性4. 优化向量模型 背景 针对手机销售和售后的 阅读全文
posted @ 2025-12-04 23:02 向着朝阳 阅读(17) 评论(0) 推荐(0)
摘要: RAG 缓存方案专为高并发低延迟设计,分为两级拦截: 检索阶段缓存 (Retrieval Cache): 采用 L1 进程内存(精确 Hash 匹配)和 L2 向量索引(相似度匹配)。目标是吸收 70% 左右的重复或相似查询流量,将 L3 向量数据库的查询延迟从 $10-30\text{ms}$ 降 阅读全文
posted @ 2025-12-04 20:54 向着朝阳 阅读(14) 评论(0) 推荐(0)