一、整体流程介绍

二、数据准备
根据目标大小不同,考虑3种图像划分尺度,大中小;
而对锚框本身,有正、长、宽3种形态;
Po有无中心坐标(0、1)、Bx、By、Bw、Bh,这里是5个特征值,再加上COCO数据集本身自带的80个类别;
故对于每个图像块均构造一个对应的标签列向量y,(5+80)* 3 = 255;
C1、C2、C3是指分类类别;
13*13个图像块,共构造13*13个标签列向量 13*13*255。

二、神经网络结构


三、损失函数
指导优化神经网络权值


四、算法的整体设计



知识产权声明: 本博文中的ppt素材及相关内容和知识产权,均属于河南大学张重生老师所讲授的《深度学习》课程及张重生老师在2025年出版的著作《新一代人工智能 从深度学习到大模型》(机械工业出版社)。特此声明。
真挚地感谢张重生老师在本人于河南大学学习期间的教导。
浙公网安备 33010602011771号