摘要: 收敛速度 这里首先需要给收敛速度做一个诠释。模型的最优解即是模型参数的最优解。通过逐轮迭代,模型参数会被更新到接近其最优解。这一过程中,迭代轮次多,则我们说模型收敛速度慢;反之,迭代轮次少,则我们说模型收敛速度快。 参数更新 深度学习一般的学习方法是反向传播。简单来说,就是通过链式法则,求解全局损失 阅读全文
posted @ 2021-07-31 23:40 多发Paper哈 阅读(156) 评论(0) 推荐(0) 编辑
Live2D