摘要: AlexNet 上图是论文的网络的结构图,包括5个卷积层和3个全连接层,作者还特别强调,depth的重要性,少一层结果就会变差,所以这种超参数的调节可真是不简单. 激活函数 首先讨论的是激活函数,作者选择的不是$f(x)=\mathrm{tanh}(x)=(1+e^{-x})^{-1}$,而是ReL 阅读全文
posted @ 2019-07-19 12:08 馒头and花卷 阅读(731) 评论(0) 推荐(0)