AI-1

数据 ---》 算法(模型)---》 预训练

单个GPU无法完成训练的任务,需要多个GPU 

把训练任务做切分,然后并行运行

模型不大,数据很大时,把数据做切分 , 每个GPU处理切分的一个分片的数据 ; 数据并行

模型很大,则用模型并行, 方式有: tensor, 流水线,专家并行

17

18

 

精度: 参数

19

 

精度: 模型参数的数值表示形式

20

 

posted @ 2025-12-29 16:54  lavida2000  阅读(2)  评论(0)    收藏  举报