摘要:
目录1. 参考2. 概述3. 目标4. 模型并行4.流水线并行4.1 切分micro-batch4.2 re-materialization(active checkpoint)5. 实验效果5.1 GPU数量 VS 模型大小5.2 GPU数量 VS 训练速度5.3 Gpipe下时间消耗分布 1. 阅读全文
posted @ 2024-11-08 11:33
jack-chen666
阅读(501)
评论(0)
推荐(0)
摘要:
目录1. 论文2. 代码 1. 论文 https://arxiv.org/pdf/2012.00364 2. 代码 Code is available at https://github.com/huawei-noah/Pretrained-IPT and https:gitee.com/minds 阅读全文
posted @ 2024-11-08 09:54
jack-chen666
阅读(49)
评论(0)
推荐(0)

浙公网安备 33010602011771号