YOLOv3目标检测原理(下)
从锚框到预测框

初始的时候每个锚框都在格子的左上角,于是我们便基于格子的左上角对其进行一个调整
- 先做一个中心点的偏移,把锚框的中心点偏移到与真实框一样
.左上角的坐标即为网格坐标(Cx,Cy)
.再对其做一个tx,ty的偏移
.可以做到中心点偏移到和真实框一样了
.对预测框的长度和宽度进行一个拉伸,达到与真实框一样 - 对为什么xy上要取sigmoid,hw上取exp的解答
![]()
. 不管tx取多少,取了sigmoid以后他肯定在0~1之间
. 对于预测框的宽度和高度我们期望是一个正值 - 锚框只给出了框的宽度和高度,怎么去表示图像中物体真实框?
有多少个真实框?分别在图像的哪个位置?
. 划分网格,“框海”战术
. 网格粗定位 + 中心点偏移精定位 - 锚框的宽度和高度是固定的,物体真实框的宽度和高度各种各样,怎么去表示?
. 宽高拉伸
为什么要有锚框

YOLOv3网络的输入输出(复习)

YOLOv3检测流程

YOLOv3的检测流程

- class代表物体的类别
- 将真实框进行一个‘整容’,然他变得和输出一样,这样才好去算LOSS
- YOLOv3的输出H和W,就相当于把图像划分成H*W个网格,真实框落到那个网格我们就填到哪个网格里面去
真实框的匹配

在YOLOv3中,后一个真实框会覆盖掉前一个真实框这会导致前一个真实框的丢失,这也是为什么YOLOv3不适合检测考的比较近的、有遮挡的物体的原因(又可能落在同一个网格)
由真实框得到监督信息


得到监督信息之后,他们就变得一摸一样了,我们就可以按照通道算各自的损失
损失函数


YOLOv3预测流程

计算预测框

NMS

- 按照类别进行分组,在计算的时候互不干扰
- 按照预测框的评分进行降序排序,后面的预测框他的IOU大于阈值的情况下就认为他们是一样的让Score高的预测框代表Score低的预测框后再依次比较,保证最后留下来的都是意见不一样的

浙公网安备 33010602011771号