FCOS及其和Faster R-CNN的区别

RetinaNet，SSD，YOLOv3，Faster R-CNN等都是Anchor-based的检测器，即需要预定义的Anchor boxes来进行训练。FCOS是一种Anchor-free和Proposal-free的检测器，即不需要预定义Anchor boxes来进行训练，从而节省了对计算资源的占用。

根据我的理解，FCOS和Faster R-CNN的区别主要表现在：

(1) Faster R-CNN是每个点提出N个Proposal，N一般等于9(预设了3种长宽比例，3种尺寸因此是9个Proposal)，每一个Proposal的类别如何确定呢？就需要计算Proposal和GT Box的IOU了，IOU达到一定的程度，Proposal就算是这个GT Box的类，要求这个Proposal回归到这个GT Box；而FCOS每个点只提出一个Proposal，这个Proposal的类别如何确定？就是这个点在哪一个GT Box里面，它提出的Proposal就属于哪一个GT Box的类，当然也要求这个Proposal回归到这个GT Box。但是感觉Faster R-CNN的分类更好训练一些，毕竟Proposal和GT Box有比较大的IOU，FCOS靠近GT Box中心的点的类还比较好训练，距离中心比较远的点估计不好训练吧。

(2) FCOS多出来一个Center-ness：

这是因为距离目标中心越远的位置预测出的Proposal质量越低，所以FCOS增加了一个分支预测Center-ness，越靠近GT Box的中心，这个Center-ness的值就越接近1。

预测的时候结合对应的分类分数以及Center-ness的值来对Proposal进行排序，从而抑制了距离目标中心越远的位置预测出的Proposal，这种方法是很巧妙的，值得借鉴。

posted @ 2019-10-30 23:15 MSTK 阅读(1267) 评论(0) 收藏举报

刷新页面返回顶部

代码空间

Computer Vision/Machine Learning/Evolutionary Computation...

FCOS及其和Faster R-CNN的区别

公告