卷积神经网络读书报告
本次学习,我深入理解了卷积神经网络中卷积操作的具体步骤与计算过程。
-
初始化定位:
一个尺寸为k×k(如3x3)的卷积核被放置在输入图像或输入特征图的左上角,与其覆盖的初始区域对齐。 -
执行乘积累加运算:
卷积核的每个权重参数与其所覆盖区域内的对应像素值进行逐元素相乘。随后,将所有k×k 个乘积结果求和,并加上一个偏置项(如果存在),最终生成一个单一的标量数值。 -
输出与存储:
这个计算得到的标量数值,构成了输出特征图在对应位置上的第一个像素点。 -
滑动与重复计算:
根据预设的步长,卷积核向右移动一个或多个像素单位(步长=1或更大),覆盖新的图像区域。随后,重复执行第2步的乘积累加运算,生成输出特征图的下一个数值。当卷积核扫描完第一行后,便复位至最左侧,并向下移动一个步长,开始新一行的扫描计算。 -
遍历与特征图生成:
上述“定位-计算-滑动”的过程将持续进行,直到卷积核遍历完输入数据的整个有效区域。最终,所有输出的标量数值共同构成了一张完整的输出特征图,它系统地记录了输入数据中与卷积核权重模式相匹配的空间特征。
此过程可并行使用多个不同的卷积核,以同时提取多种类型的特征,构成网络的深度基础。