摘要: L2G4-InternVL 多模态模型部署微调实践 数据集样本数量 = batch_size * accumulative_counts * step 由于显存有限,不能将数据集一次投入到模型中进行前向传播、计算损失、反向传播和参数更新,而是将数据分成若干个小批次(batch)。每个批次会通过前向传 阅读全文
posted @ 2025-02-25 19:56 sakuraLGGM 阅读(116) 评论(0) 推荐(0)