摘要: 机器学习的优化目标 梯度下降 三维示意 batch 和 mini-batch 梯度下降 梯度下降SGD 病态条件 局部最小 vs 全局最小 鞍点 平台 梯度爆炸与悬崖 动量法 Nesterov 动量法 受 Nesterov 加速梯度算法 NAG(Nesterov, 1983, 2004) 的启发 梯 阅读全文
posted @ 2021-02-01 18:16 谜语+ 阅读(107) 评论(0) 推荐(0) 编辑