yolo v3 中的边框公式分析

图为预测boundingbox的公式。

注意：我们网络实际上的学习目标是tx,ty,tw,th，但是可以求得真正需要的bx,by,bw,bh！

1.bx,by,bw,bh

预测边框时cx, cy为相对于左上角的位置，每个小格的长度为1，图中此时cx=1，cy=1；

tx,ty是预测的坐标偏移值（中心点坐标）；

tw,th是尺度缩放，分别经过sigmoid，输出0-1之间的偏移量，与cx, cy相加后得到bounding box中心点的位置。

Pw、Ph是预设的anchor box映射到feature map中的宽和高，是手动设置的anchor宽和高！

tw, th分别与pw, ph作用后得到bounding box的宽和高（bw和bh）。

这样就能得到预测boudingbox的x,y,w,h了，我们的目的是让预测的x,y,w,h和真实的groundtruth接近，于是我们就可以写loss了。

2.tx,ty,tw,th

（1）在faster-rcnn系列文章中，对于训练样本，需要用到ground truth的真实框来求这4个坐标：

Px,Py是预设的anchor box在feature map上的中心点坐标；

Pw、Ph是预设的anchor box的在feature map上的宽和高；

Gx、Gy、Gw、Gh是ground truth在这个feature map的4个坐标；

（2）在yolov3中

在yolov3里，是Gx,Gy减去grid cell左上角坐标Cx,Cy。x,y坐标并没有针对anchon box求偏移量，所以并不需要除以Pw,Ph。

tw和th的公式yolov3和faster-rcnn系列是一样的

posted on 2019-09-17 10:33 Honsia 阅读(1972) 评论(0) 收藏举报

刷新页面返回顶部

Honsia