摘要: 原本以为:Drop out和BN在train和eval的模式下计算方式会有差异,从而会导致输出结果会有差异。 测试过程不管是一个数据还是一批数据 用到的均值和方差是全量训练数据的均值和方差吗?也就是说网络训练好以后保存的bn层的均值和方差的参数就是全量训练数据的 后来发现是推理的时候多了一个数据增强 阅读全文
posted @ 2022-11-17 11:15 Tomorrow1126 阅读(163) 评论(0) 推荐(0) 编辑