一阶段目标检测(7)-FCOS 全卷积anchor-free目标检测方法
一阶段目标检测(7)-FCOS 全卷积anchor-free目标检测方法
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
论文地址: FCOS: Fully Convolutional One-Stage Object Detection
工程地址:github链接
1. 简介
基于锚框的目标检测器虽然效果很好,但存在以下问题:
-
检测的性能与锚框的尺寸、长宽比和数量有关
-
锚框大小相对固定,对大幅变形的物体的检测精度低
-
为了提高召回率,需要大量锚框,但大多数都被标记为"negative"
-
大量的锚框增加了计算复杂度和内存占用
另一方面,全卷积网络在诸如语义分割、深度估计、关键点检测以及计数方面表现不俗,自然引出这样一个问题:全卷积能够用于目标检测中?
基于上面两方面的内容,该论文提出了一个不需要预定义锚框的一阶段全卷积目标检测方法—FCOS,主要的贡献和优势在于:
-
检测与其他的全卷积网络的应用领域相结合,一些idea可以互相套用
-
目标检测不需要提议和锚框
-
取得了一阶段的SOTA检测性能
-
能够通过微小调整就应用于实例分割、关键点检测等任务中。为基于实例的问题提供了新途径
2. 方法思路
2.1 一阶段全卷积目标检测器的形式化描述
令Fi∈RH×W×CF_i \in R^{H \times W \times C}Fi∈RH×W×C表示主干网络第iii层的特征图,sss表示该层之前总的步长(也就是特征图相比原始图像缩小的倍数),输入图像的GT框定义为{BiB_iBi},其中Bi=(x(i)0,y(i)0,x(i)1,y(i)1,c(i))∈R4×B_i=(x_0^{(i)},y_0^{(i)},x_1^{(i)},y_1^{(i)},c^{(i)}) \in R^4 \timesBi=(x0(i),y0(i),x1(i),y1(i),c(i))∈R4×{1,2,...,