摘要:
预防 胜于检查 审计: 看过程 检查: 看结果 测试: 发现问题 阅读全文
posted @ 2025-12-29 20:46
lavida2000
阅读(0)
评论(0)
推荐(0)
摘要:
数据 》 算法(模型) 》 预训练 单个GPU无法完成训练的任务,需要多个GPU 把训练任务做切分,然后并行运行 模型不大,数据很大时,把数据做切分 , 每个GPU处理切分的一个分片的数据 ; 数据并行 模型很大,则用模型并行, 方式有: tensor, 流水线,专家并行 精度: 参数 精度: 模型 阅读全文
posted @ 2025-12-29 16:54
lavida2000
阅读(2)
评论(0)
推荐(0)
浙公网安备 33010602011771号