摘要: 给定一个模型架构、数据类型、输入形状和优化器,你能否计算出前向传播和反向传播所需的GPU内存量?要回答这个问题,我们需要将流程分解为基本组件,并从底层理解内存需求。以下实验(可以在Google Colab上运行)将帮助你理解核心概念。 数据类型 float32 需要4字节的内存, bfloat16 阅读全文
posted @ 2024-08-27 10:55 deephub 阅读(45) 评论(0) 推荐(0)