0、图像语义分割的问题定义
语义分割是在像素级别上,自动理解或预测图像中的每个像素所属的物体类别
语义分割
1、全卷积网络FCN
没有全连接层,只有卷积层,且在进行卷积后,需将特征图恢复到原始图像的大小
通道数和特征保持一致

算法原理


神经网络结构

损失函数


2、U-Net
U-Net将浅层网络中的输出和深层网络的合并输出
同样需要将特征图恢复到原始图像的大小
第一阶段:长度表示尺寸,宽度表示通道数,每一层进行一次池化(尺寸是上一层的1/2),卷积时都是3×3的卷积核;
第二阶段:长度表示尺寸,宽度表示通道数,每一层进行一次反卷积(尺寸是上一层的2倍,通道数是上一层的1/2),再与第一阶段中相同尺寸通道的特征图像进行Concatenate,卷积时都是3×3的卷积核;
第三阶段:最后进行一次卷积,使得通道数与分割类别数量保持一致。

3、U-Net++
引入中间层的卷积,以实现逐渐过渡,逐渐融合

知识产权声明: 本博文中的ppt素材及相关内容和知识产权,均属于河南大学张重生老师所讲授的《深度学习》课程及张重生老师在2025年出版的著作《新一代人工智能 从深度学习到大模型》(机械工业出版社)。特此声明。
真挚地感谢张重生老师在本人于河南大学学习期间的教导。
浙公网安备 33010602011771号