五
架构设计:
1、存在一些函数族,当深度大于等于d时可以被高效地近似,而当深度被限制在小于d的时候,需要一个远大于之前的模型;
2、可以从层i跳到层i+2,这样甚至有利于反馈的进行,梯度更容易从输出层流向接近输入的层;
3、
疑问:
1、上面知识点1的直觉理解;
2、
架构设计:
1、存在一些函数族,当深度大于等于d时可以被高效地近似,而当深度被限制在小于d的时候,需要一个远大于之前的模型;
2、可以从层i跳到层i+2,这样甚至有利于反馈的进行,梯度更容易从输出层流向接近输入的层;
3、
疑问:
1、上面知识点1的直觉理解;
2、