2022 年 1月 8 日随笔档案 - ZOMI酱酱

2022年1月

摘要：

在深度学习训练的时候，数据的batch size大小受到GPU内存限制，batch size大小会影响模型最终的准确性和训练过程的性能。在GPU内存不变的情况下，模型越来越大，那么这就意味着数据的batch size智能缩小，这个时候，梯度累积（Gradient Accumulation）可以作为一种简单的解决方案来解决这个问题。阅读全文

posted @ 2022-01-08 21:28 ZOMI酱酱阅读(740) 评论(0) 推荐(1)

公告