摘要: 现在几乎所有的神经网络都在使用批量归一化这个层。 但是沐神讲的不太懂,可以看看对源paper的理解:https://blog.csdn.net/hjimce/article/details/50866313 背景: 在网络上,数据一般都在输入层,也就是在最下面,但是损失函数在最上面,所以上面的层训练 阅读全文
posted @ 2022-02-15 17:55 爱和九九 阅读(782) 评论(0) 推荐(0)