2026 年 1月 7 日随笔档案 - 数据库知识分享者小北

2026年1月7日

摘要：导读在大模型推理迈向“智能体时代”的今天，KVCache 已从性能优化手段升级为系统级基础设施，“显存内缓存”模式在长上下文、多轮交互等场景下难以为继，而“以存代算”的多级 KVCache 架构虽突破了容量瓶颈，却引入了一个由模型结构、硬件平台、推理引擎与缓存策略等因素交织而成的高维配置空间。如何阅读全文

posted @ 2026-01-07 15:56 数据库知识分享者小北阅读(3) 评论(0) 推荐(0)

公告