摘要: BN的作用。 可以看到,如果不使用gamma和beta,激活值基本上会在[0.1 0.9]这个近似线性的区域中,这与深度神经网络所要求的“多层非线性函数逼近任意函数”的要求不符,所以引入gamma和beta还是有必要的,深度网络会自动决定使用哪一段函数(这是我自己想的,其具体作用欢迎讨论)。 对于R 阅读全文
posted @ 2020-04-15 17:11 dario0558 阅读(262) 评论(0) 推荐(0)