摘要: 在上一节里,我们讨论了怎么让语义缓存层对于业务等价更加敏感。接下来,我们来讨论一下第二个问题:怎么充分利用QA知识库? 在第三节中,我已经指出:QA层的知识也非常宝贵,需要在RAG的全流程中被充分利用。换而言之,QA层不仅仅是缓存,它也是一个知识库,只不过它的问题和答案都更碎片化、更短。 我重新思考 阅读全文
posted @ 2026-06-08 01:11 SegaLee 阅读(3) 评论(0) 推荐(0)
摘要: 在上一节里,我们讨论了简单的语义缓存存在的几个缺陷。其中,“答不对”的问题是需要最优先处理的,因为用户还没有对系统建立起信心,正确率的降低是致命的。 我们来回顾一下先前的语义缓存架构: 图1:简单的语义缓存架构(图由Gemini生成,小修) 这个架构能够以极短的时间返回缓存命中的答案,但是评测结果显 阅读全文
posted @ 2026-06-07 22:31 SegaLee 阅读(5) 评论(0) 推荐(0)
摘要: 在上一节里,我们介绍了现在的语义缓存层是怎么做的。它的逻辑很简单: 把用户的问题转成向量 在向量数据库里匹配最接近的问题 最相似的问题相似度是否 >=0.9 ? 如果是,就直接返回这个问题的答案 否则走完整个RAG流程 博主的配置如下: 项 配置 备注 成本 向量数据库 milvus-lite 本地 阅读全文
posted @ 2026-06-01 19:55 SegaLee 阅读(11) 评论(0) 推荐(0)
摘要: 在上一篇文章里,我介绍了我在构建机器人MVP时处理数据时的发现。本章中,我会介绍一下近来的一些存在做法,以及把这个逻辑运用到我的系统中时出现的问题。 一、方案调研 我在五月初完成我的智能体构建和评估。demo通过之后,我开始着手研究有什么办法来处理这种问答对类型的知识。显然我并不是第一个注意到这种问 阅读全文
posted @ 2026-05-31 15:07 SegaLee 阅读(14) 评论(0) 推荐(0)
摘要: 最近给一个大规模代码仓库构建了一个问答智能体,知识库的范围包括大概18个子仓库,数据大概包括三类: 历史问答对(后面我会把它们叫做QA),来自开源共建答疑群,大约50条; 开发文档,主要是设计文档,包括各个板块,加起来大约七八十个doc文档; 开源代码仓库,二十多个.md文档,还有源代码; 整个过程 阅读全文
posted @ 2026-05-30 21:37 SegaLee 阅读(5) 评论(0) 推荐(0)