2025 年 2月 15 日随笔档案 - LexLuc

2025年2月15日

摘要： 1. KV 缓存是什么？ KV 缓存（KV Cache）是一种优化大语言模型（LLM, Large Language Models）推理速度的关键技术。最近爆火的DeepSeek，其首创的MLA技术，使得KV Cache降低了93%，在大语言模型的训练和推理上有效降低了对高性能GPU的性能要求（比如阅读全文

posted @ 2025-02-15 02:18 LexLuc 阅读(3100) 评论(0) 推荐(0)

Lex个人随想乡

Attention before pay attention