【深度学习】关于训练过程中的epoch和iter

在深度学习训练过程中，epoch和iter（iteration） 是描述训练进度的两个基本概念，它们的定义和区别如下：

定义：一个 epoch 指的是将整个训练数据集完整地过一遍的过程。
例如，若训练集有 10,000 张图像，当模型处理完这 10,000 张图像并完成一次参数更新循环时，即完成了 1 个 epoch。
作用：用于衡量训练的完整度。通常需要多个 epoch 才能让模型充分学习数据中的模式。

定义：一个 iteration 指的是模型处理一个 batch（批次） 数据并完成一次前向传播和反向传播的过程。
例如，若训练集有 10,000 张图像，设置 batch size 为 32，则每个 epoch 包含 10,000 / 32 ≈ 313 个 iterations（向下取整时可能需补全最后一个不完整 batch）。
作用：用于描述训练的单次更新粒度。较小的 batch size 会增加 iterations 数量，但可能提升训练稳定性。

概念	Epoch	Iteration
数据范围	处理整个训练集一次	处理一个 batch 的数据
计算量	较大，取决于数据集大小和 batch size	较小，仅涉及一个 batch 的计算
更新频率	每完成一个 epoch 更新一次全局进度	每完成一个 iteration 更新一次参数
公式关系	[ \text{iterations per epoch} = \left\lceil \frac{\text{数据集大小}}{\text{batch size}} \right\rceil ]

假设训练集有 50,000 张图像，设置 batch size = 64：

每个 iteration 中，模型处理 64 张图像，计算损失并更新参数；每完成 781 个 iterations，即完成一个 epoch，此时可记录全局训练进度并进行验证。

posted @ 2025-06-17 20:13 SaTsuki26681534 阅读(291) 评论(0) 收藏举报

刷新页面返回顶部

Loading