摘要: 深度学习中最核心的三种优化算法或优化策略:SGD (随机梯度下降)、Momentum (动量) 策略,以及 Adam (自适应矩估计) 优化器。 下面是它们的核心原理、优势和关系总结: 优化器/策略总结对比 名称 类型 核心机制 主要解决的问题 SGD 基础优化器 仅依赖当前小批量数据的梯度来更新参 阅读全文
posted @ 2025-11-22 18:05 李大嘟嘟 阅读(143) 评论(0) 推荐(0)