目标检测论文解读13——FPN

引言

  对于小目标通常需要用到多尺度检测,作者提出的FPN是一种快速且效果好的多尺度检测方法。

方法

  

  a,b,c是之前的方法,其中a,c用到了多尺度检测的思想,但他们都存在明显的缺点。

  a方法:把每图片都进行缩放,在进行检测,这种做法最大的问题是太慢,因为要多花好几倍的时间;

  c方法:其实就是SSD论文中用到的方法,feature map一层层下采样,然后对不同scale的feature map之间进行预测,这种做法最大的缺点就是底层feature map分辨率高但是语义信息弱,分类不准;

  而作者在论文中提出的新方法——FPN(特征金字塔网络),速度跟c一样快同时比c更准。

  其实原理非常简单:

  我们知道,底层的feature map分辨率高但是语义信息弱,顶层的feature map分辨率低但是语义信息强,因此只用将顶层的语义信息传给底层,就能让其分类更精准。

  

  作者采用的方法,就是将上层的feature map上采样到2倍,然后跟经过1*1 conv的相邻下层feature map直接相加。

总结

  FPN论文的贡献非常大,提出让不同层的feature map信息融合的思想,广为后人借鉴。比如SSD的升级版DSSD,用到的反卷积层就是同样的原理,效果也非常好。

posted @ 2019-08-23 20:53 汪昕 阅读(...) 评论(...) 编辑 收藏