摘要:
架构设计: 1、存在一些函数族,当深度大于等于d时可以被高效地近似,而当深度被限制在小于d的时候,需要一个远大于之前的模型; 2、可以从层i跳到层i+2,这样甚至有利于反馈的进行,梯度更容易从输出层流向接近输入的层; 3、 疑问: 1、上面知识点1的直觉理解; 2、 阅读全文
posted @ 2018-08-15 21:34
loooffeeeey
阅读(82)
评论(0)
推荐(0)
摘要:
隐藏单元: 1、整流线性单元是隐藏单元极好的默认选择; 2、在实践中,可以放心地忽略掉隐藏层激活函数的不可微性; 3、sigmoid饱和区域过大使得基于梯度的学习变得非常困难,所以现在隐藏单元的激活函数不推荐使用sigmoid; 4、在很多情况下,更深的模型能够减少表示期望函数所需要的单元的数量。 阅读全文
posted @ 2018-08-15 17:41
loooffeeeey
阅读(90)
评论(0)
推荐(0)

浙公网安备 33010602011771号