会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
anluo8
博客园
首页
新随笔
联系
订阅
管理
2025年7月11日
模型算法-MHA-MQA-GQA(1)
摘要: 1. 介绍: 基于最近对大模型 KV_cache,及 Attention 变种学习中遇到的问题和理解记录下来,帮助大家解决一点疑惑。 2. kv_cache 显存对比: 参数说明 batch_size:B seq_len:L head_num:H head_dim:D layer_num:N gro
阅读全文
posted @ 2025-07-11 16:33 安洛8
阅读(35)
评论(0)
推荐(0)
公告