SegaLee - 博客园

2026年6月

摘要：在上一节里，我们讨论了怎么让语义缓存层对于业务等价更加敏感。接下来，我们来讨论一下第二个问题：怎么充分利用QA知识库？在第三节中，我已经指出：QA层的知识也非常宝贵，需要在RAG的全流程中被充分利用。换而言之，QA层不仅仅是缓存，它也是一个知识库，只不过它的问题和答案都更碎片化、更短。我重新思考阅读全文

posted @ 2026-06-08 01:11 SegaLee 阅读(3) 评论(0) 推荐(0)

浅谈RAG前的语义缓存层（4）—— LLM后置判等设计

摘要：在上一节里，我们讨论了简单的语义缓存存在的几个缺陷。其中，“答不对”的问题是需要最优先处理的，因为用户还没有对系统建立起信心，正确率的降低是致命的。我们来回顾一下先前的语义缓存架构：图1：简单的语义缓存架构(图由Gemini生成，小修) 这个架构能够以极短的时间返回缓存命中的答案，但是评测结果显阅读全文

posted @ 2026-06-07 22:31 SegaLee 阅读(5) 评论(0) 推荐(0)

浅谈RAG前的语义缓存层（3） —— QA只是"缓存"吗？

摘要：在上一节里，我们介绍了现在的语义缓存层是怎么做的。它的逻辑很简单：把用户的问题转成向量在向量数据库里匹配最接近的问题最相似的问题相似度是否 >=0.9 ？如果是，就直接返回这个问题的答案否则走完整个RAG流程博主的配置如下：项配置备注成本向量数据库 milvus-lite 本地阅读全文

posted @ 2026-06-01 19:55 SegaLee 阅读(11) 评论(0) 推荐(0)

2026年5月

浅谈RAG前的语义缓存层（2） —— 通过语义匹配找到相似问题

摘要：在上一篇文章里，我介绍了我在构建机器人MVP时处理数据时的发现。本章中，我会介绍一下近来的一些存在做法，以及把这个逻辑运用到我的系统中时出现的问题。一、方案调研我在五月初完成我的智能体构建和评估。demo通过之后，我开始着手研究有什么办法来处理这种问答对类型的知识。显然我并不是第一个注意到这种问阅读全文

posted @ 2026-05-31 15:07 SegaLee 阅读(14) 评论(0) 推荐(0)

浅谈RAG前的语义缓存层（1） —— 历史问答对适合直接丢知识库吗？

摘要：最近给一个大规模代码仓库构建了一个问答智能体，知识库的范围包括大概18个子仓库，数据大概包括三类：历史问答对（后面我会把它们叫做QA），来自开源共建答疑群，大约50条；开发文档，主要是设计文档，包括各个板块，加起来大约七八十个doc文档；开源代码仓库，二十多个.md文档，还有源代码；整个过程阅读全文

posted @ 2026-05-30 21:37 SegaLee 阅读(5) 评论(0) 推荐(0)

公告