目标检测论文解读6——SSD

背景

　　R-CNN系列算法检测速度不够快，YOLO v1检测准确率较低，而且无法检测到密集目标。

方法

　　SSD算法跟YOLO类似，都属于one stage的算法，即通过回归算法直接从原图得到预测结果，为了解决YOLO v1检测效果一般的问题，SSD提出了多尺度检测的方法以及在不同尺度上特征点的default box。

　　1.多尺度检测模型

　　如图所示是SSD模型跟YOLO模型的对比，我们可以看到最主要的区别是：

　　YOLO是在Conv层后面加上两个FC层，得到7*7*30的tensor用来回归预测；而SSD是添加金字塔式的Conv层，在不同Scale的feature map上做回归预测。

　　2.Default Box

　　SSD回归的对象是提前设置好的Default Box，有点类似于Faster R-CNN里面的Anchor Box，不过是也是多尺度的，这是为了实现在前面大的特征图上预测小目标，在后面晓得特征图上预测大目标，达到多尺度检测的目的。

　　对于某个feature map的每个特征点，需要预测k个Default Box，类别为c(包括背景类)，以及他们的坐标偏移量(cx,cy,w,h)，所以feature map的通道数是k(c+4)。

　　所有的Default Box加起来：38*38*4+19*19*6+10*10*6+5*5*6+3*3*4+1*1*4=8732个

总结

　　可以看到SSD所做出的改进无非就是引入多尺度检测的思想，相比于YOLO，还增加Anchor Box的数量，然后优化了一下网络结构，取得了非常好的效果。

posted @ 2019-08-19 21:31 汪昕阅读(482) 评论(0) 收藏举报

刷新页面返回顶部

汪昕