YOLOv3目标检测原理(下)

从锚框到预测框


初始的时候每个锚框都在格子的左上角,于是我们便基于格子的左上角对其进行一个调整

  • 先做一个中心点的偏移,把锚框的中心点偏移到与真实框一样
    .左上角的坐标即为网格坐标(Cx,Cy)
    .再对其做一个tx,ty的偏移
    .可以做到中心点偏移到和真实框一样了
    .对预测框的长度和宽度进行一个拉伸,达到与真实框一样
  • 对为什么xy上要取sigmoid,hw上取exp的解答

    . 不管tx取多少,取了sigmoid以后他肯定在0~1之间
    . 对于预测框的宽度和高度我们期望是一个正值
  • 锚框只给出了框的宽度和高度,怎么去表示图像中物体真实框?
    有多少个真实框?分别在图像的哪个位置?
    . 划分网格,“框海”战术
    . 网格粗定位 + 中心点偏移精定位
  • 锚框的宽度和高度是固定的,物体真实框的宽度和高度各种各样,怎么去表示?
    . 宽高拉伸

为什么要有锚框

YOLOv3网络的输入输出(复习)

YOLOv3检测流程

YOLOv3的检测流程

  • class代表物体的类别
  • 将真实框进行一个‘整容’,然他变得和输出一样,这样才好去算LOSS
  • YOLOv3的输出H和W,就相当于把图像划分成H*W个网格,真实框落到那个网格我们就填到哪个网格里面去

真实框的匹配


在YOLOv3中,后一个真实框会覆盖掉前一个真实框这会导致前一个真实框的丢失,这也是为什么YOLOv3不适合检测考的比较近的、有遮挡的物体的原因(又可能落在同一个网格)

由真实框得到监督信息



得到监督信息之后,他们就变得一摸一样了,我们就可以按照通道算各自的损失

损失函数


YOLOv3预测流程

计算预测框

NMS

  • 按照类别进行分组,在计算的时候互不干扰
  • 按照预测框的评分进行降序排序,后面的预测框他的IOU大于阈值的情况下就认为他们是一样的让Score高的预测框代表Score低的预测框后再依次比较,保证最后留下来的都是意见不一样的
posted @ 2025-06-27 00:25  探索笋  阅读(46)  评论(0)    收藏  举报