摘要: 对于深度学习来说,其模型计算量往往很大(训练尤甚),但在训练时经常看到GPU利用率打不满的情况,这说明瓶颈在GPU算力以外的其他地方,其中一个最重要的影响因素便是显存带宽 下表列举了几个常用显卡的常规参数 Model Memory (GB) Memory Bandwidth (GB/sec) FP3 阅读全文
posted @ 2025-05-31 23:40 beanmoon 阅读(85) 评论(0) 推荐(0)