摘要:
微调:好像是用新数据训练旧模型的管道。 微调的参数有: 图形大小:image_size 数据批次:batch_size 为减轻显卡压力,将数据批次再切分为2(n)倍,num_epochs 相对应的,权重更新频率也乘2(n)倍,grad_accumulation_steps 总感觉对模型影响不大捏? 阅读全文
posted @ 2023-10-25 18:23
windiest
阅读(115)
评论(0)
推荐(0)
浙公网安备 33010602011771号