摘要:
步长 步长是指卷积核(或池化窗口)在输入数据的宽度和高度方向上每次滑动的像素数(对于二维数据,如图像).通常用整数表示,例如步长为 1,2 等. 比如我们给出这两个图像 对于一个收敛的过程,总归是要走的,已经到了最低点后,对于这个点的均方误差就是0了,所以在这之后我们无论怎么走,loss一定会增加, 阅读全文
posted @ 2025-06-10 22:03
Merlin·Lee
阅读(85)
评论(0)
推荐(0)
摘要:
仿射变换 仿射变换 两种简单变换的叠加:线性变换和平移变换 包括:缩放,平移,旋转,反射,错切 直线仿射变换后还是直线,平行线仿射变换后还是平行线 性质保持不变: 1.凸凹性 2.共线性:若几个点变换前在一条线上,仿射变换后仍然在一条线上 3.平行性:平行线仿射变换后还是平行线 4.共线比例不变 一 阅读全文
posted @ 2025-06-10 13:46
Merlin·Lee
阅读(32)
评论(0)
推荐(0)
摘要:
梯度消失与梯度爆炸 梯度及其更新 深层次的神经网络要比浅层次的神经网络有更好的处理数据的效果,目前优化神经网络的方法都是基于反向传播的思想,即根据损失函数计算的误差通过梯度反向传播的方式,来对更深的层次进行更新优化. 所以,我们可以把一个神经网络看作是一个复合的多元的非线性函数.而我们最终的目的是要 阅读全文
posted @ 2025-06-10 06:37
Merlin·Lee
阅读(11)
评论(0)
推荐(0)