摘要: 需求 对基于pytorch的深度学习模型进行多卡训练以加速训练过程 由于显卡版本过于老旧,安装配置NCCL工程量过于庞大,希望使用简单的pytorch代码实现单机多卡训练,不考虑多机多卡的显卡通信 训练完成后保存的checkpoint需要能够在任何设备上进行加载、推理 实现 训练 pytorch提供 阅读全文
posted @ 2021-08-17 09:45 Chaosun 阅读(1399) 评论(0) 推荐(0)