RAG-06-RAG语义缓存
价值:提升效率,减少一个LLM处理,节约成本。
为什么是RAG的语义缓存? 如果直接针对用户的query,因为不同的人的权限不同,可能缓存的结果不对。跟传统业务架构一样,缓存一般是在存储层之上。
RAG语义缓存

向量库1:存储的是入Redis缓存的问题(query)
Redis:query+answer

优化后主要耗时
embeding,向量库1查询,
价值:提升效率,减少一个LLM处理,节约成本。
为什么是RAG的语义缓存? 如果直接针对用户的query,因为不同的人的权限不同,可能缓存的结果不对。跟传统业务架构一样,缓存一般是在存储层之上。

向量库1:存储的是入Redis缓存的问题(query)
Redis:query+answer

优化后主要耗时
embeding,向量库1查询,