摘要:
目录背景示例一:产品版本和型号的细粒度区分示例二:不同产品线的相似功能示例三:售后政策的版本/时间漂移如何解决?1. 混合检索(Hybrid Search)的强化2. 引入重排器(Re-Ranker)进行细粒度区分3. 增强文档与块(Chunk)的结构性4. 优化向量模型 背景 针对手机销售和售后的 阅读全文
posted @ 2025-12-04 23:02
向着朝阳
阅读(17)
评论(0)
推荐(0)
摘要:
RAG 缓存方案专为高并发低延迟设计,分为两级拦截: 检索阶段缓存 (Retrieval Cache): 采用 L1 进程内存(精确 Hash 匹配)和 L2 向量索引(相似度匹配)。目标是吸收 70% 左右的重复或相似查询流量,将 L3 向量数据库的查询延迟从 $10-30\text{ms}$ 降 阅读全文
posted @ 2025-12-04 20:54
向着朝阳
阅读(14)
评论(0)
推荐(0)

浙公网安备 33010602011771号