摘要:
数据预处理(data preprocessing) 在将数据输入到神经网络前, 我们希望先进行一些预处理,使其更适合高效训练。 标准化 简单的数据预处理就是让数据以 0 为中心(zero-centered)或标准化。 下面这张图片中,坐标轴为数据的两个特征(如RGB图像的两个颜色通道),每个点代表一 阅读全文
posted @ 2026-02-05 15:16
CauchyPt
阅读(1)
评论(0)
推荐(0)
摘要:
学习率调度 学习率(learning rate)可能是大多数深度学习模型中是最重要的超参数。如果learning rate太大,则损失会迅速增大,模型无法收敛;如果learning rate太小,则训练过程会非常缓慢,甚至可能陷入局部最优解。我们希望learning rate能先大后小,有助于模型收 阅读全文
posted @ 2026-02-05 15:13
CauchyPt
阅读(3)
评论(0)
推荐(0)

浙公网安备 33010602011771号