摘要:
在上一节里,我们讨论了怎么让语义缓存层对于业务等价更加敏感。接下来,我们来讨论一下第二个问题:怎么充分利用QA知识库? 在第三节中,我已经指出:QA层的知识也非常宝贵,需要在RAG的全流程中被充分利用。换而言之,QA层不仅仅是缓存,它也是一个知识库,只不过它的问题和答案都更碎片化、更短。 我重新思考 阅读全文
posted @ 2026-06-08 01:11
SegaLee
阅读(3)
评论(0)
推荐(0)
摘要:
在上一节里,我们讨论了简单的语义缓存存在的几个缺陷。其中,“答不对”的问题是需要最优先处理的,因为用户还没有对系统建立起信心,正确率的降低是致命的。 我们来回顾一下先前的语义缓存架构: 图1:简单的语义缓存架构(图由Gemini生成,小修) 这个架构能够以极短的时间返回缓存命中的答案,但是评测结果显 阅读全文
posted @ 2026-06-07 22:31
SegaLee
阅读(5)
评论(0)
推荐(0)
摘要:
在上一节里,我们介绍了现在的语义缓存层是怎么做的。它的逻辑很简单: 把用户的问题转成向量 在向量数据库里匹配最接近的问题 最相似的问题相似度是否 >=0.9 ? 如果是,就直接返回这个问题的答案 否则走完整个RAG流程 博主的配置如下: 项 配置 备注 成本 向量数据库 milvus-lite 本地 阅读全文
posted @ 2026-06-01 19:55
SegaLee
阅读(11)
评论(0)
推荐(0)
浙公网安备 33010602011771号