会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Beanmoon
博客园
首页
新随笔
联系
订阅
管理
2025年5月31日
算子融合[模型性能调优系列2]
摘要: 对于深度学习来说,其模型计算量往往很大(训练尤甚),但在训练时经常看到GPU利用率打不满的情况,这说明瓶颈在GPU算力以外的其他地方,其中一个最重要的影响因素便是显存带宽 下表列举了几个常用显卡的常规参数 Model Memory (GB) Memory Bandwidth (GB/sec) FP3
阅读全文
posted @ 2025-05-31 23:40 beanmoon
阅读(85)
评论(0)
推荐(0)
公告