随笔分类 -  深度学习基本知识

摘要:model.train()与model.eval()的用法 在深度学习的训练和测试代码中,总会有model.train()和model.eval()这两句,那么这两条语句的作用是什么? 通过查阅发现: 如果模型中有BN层(Batch Normalization)和Dropout,需要在训练时添加mo 阅读全文
posted @ 2021-11-10 10:54 重大的小鸿 阅读(3590) 评论(0) 推荐(0)
摘要:现在假设卷积前的特征图宽度为N,卷积后输出的特征图宽度为M,那么它们和上述设置的参数之间的关系是怎样的呢?首先可以确定的是padding之后的矩阵宽度等于N+2 x padding。另一方面,卷积核滑动次数等于M-1 根据上图的关系,可以建立下面的等式 于是输出矩阵的宽度就等于 特别地,如果需要卷积 阅读全文
posted @ 2021-09-08 11:08 重大的小鸿 阅读(862) 评论(0) 推荐(0)
摘要:本文转载于https://blog.csdn.net/zhaojc1995/article/details/80572098。此处仅作学习记录用! RNN(Recurrent Neural Network)是一类用于处理序列数据的神经网络。首先我们要明确什么是序列数据,摘自百度百科词条:时间序列数据 阅读全文
posted @ 2020-05-04 15:44 重大的小鸿 阅读(501) 评论(0) 推荐(0)
摘要:1.原文来自于:https://blog.csdn.net/qq_36570733/article/details/83444245?depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLear 阅读全文
posted @ 2020-04-16 17:45 重大的小鸿 阅读(2978) 评论(0) 推荐(1)
摘要:原文:https://blog.csdn.net/qq_18668137/article/details/80883350 此处谨作学习记录之用。 深度学习的优化算法,说白了就是梯度下降。每次的参数更新有两种方式。 第一种,遍历全部数据集算一次损失函数,然后计算函数对各个参数的梯度,更新梯度。这种方 阅读全文
posted @ 2020-04-12 23:11 重大的小鸿 阅读(1203) 评论(0) 推荐(0)