摘要:
这篇文章还不错,有一些值得继续思考的地方。 《周志华教授:关于深度学习的一点思考》 https://mp.weixin.qq.com/s/DlJZII9yKtgskcjTBfZCtQ Hinton 等通过“逐层训练后联合微调”来缓解梯度消失,使人们看到训练深层神经网络是可能的,由此激发了后来的研究, 阅读全文
posted @ 2022-02-16 16:03
blcblc
阅读(112)
评论(0)
推荐(0)
摘要:
整体回答得都比较简略,可以起到提纲挈领的作用,但是还需要继续深化。 解释Adam优化器的概念。 答:Adam结合了两个想法来改善收敛性:每个参数更新可加快收敛速度;动量可避免卡在鞍点上。 为什么必须在神经网络中引入非线性? 答:否则,我们将获得一个由多个线性函数组成的线性函数,那么就成了线性模型。线 阅读全文
posted @ 2022-02-16 15:21
blcblc
阅读(99)
评论(0)
推荐(0)

浙公网安备 33010602011771号