随笔分类 - 深度学习基本知识
摘要:model.train()与model.eval()的用法 在深度学习的训练和测试代码中,总会有model.train()和model.eval()这两句,那么这两条语句的作用是什么? 通过查阅发现: 如果模型中有BN层(Batch Normalization)和Dropout,需要在训练时添加mo
        阅读全文
                
摘要:现在假设卷积前的特征图宽度为N,卷积后输出的特征图宽度为M,那么它们和上述设置的参数之间的关系是怎样的呢?首先可以确定的是padding之后的矩阵宽度等于N+2 x padding。另一方面,卷积核滑动次数等于M-1 根据上图的关系,可以建立下面的等式 于是输出矩阵的宽度就等于 特别地,如果需要卷积
        阅读全文
                
摘要:本文转载于https://blog.csdn.net/zhaojc1995/article/details/80572098。此处仅作学习记录用! RNN(Recurrent Neural Network)是一类用于处理序列数据的神经网络。首先我们要明确什么是序列数据,摘自百度百科词条:时间序列数据
        阅读全文
                
摘要:1.原文来自于:https://blog.csdn.net/qq_36570733/article/details/83444245?depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLear
        阅读全文
                
摘要:原文:https://blog.csdn.net/qq_18668137/article/details/80883350 此处谨作学习记录之用。 深度学习的优化算法,说白了就是梯度下降。每次的参数更新有两种方式。 第一种,遍历全部数据集算一次损失函数,然后计算函数对各个参数的梯度,更新梯度。这种方
        阅读全文
                
 
                    
                
 浙公网安备 33010602011771号
浙公网安备 33010602011771号