R-FCN论文讲解(转载链接)

总结一下一下R-FCN的思想:由于分类网络具有位置的“不敏感性”和检测网络具有“位置的敏感性”这两者之间的矛盾,

而ResNet论文中为了解决这个问题,做出了一点让步,即将RoI Pooling层不再放置在ResNet-101网络的最后一层卷积层之后而是放置在了“卷积层之间”,这样RoI Pooling Layer之前和之后都有卷积层,并且RoI Pooling Layer之后的卷积层不是共享计算的,它们是针对每个RoI进行特征提取的,所以这种网络设计,其RoI Pooling层之后就具有了位置敏感性translation-variance,但是这样做会牺牲测试速度,因为所有的RoIs都需要经过若干层卷积计算,这样会导致测试速度很慢。R-FCN就是针对这个问题提出了自己的解决方案,在速度和精度之间进行折中。

它的创新之处就是:采用映射的思想,利用整个resnet的卷积部分提取特征,但得到的我们称为positive sensitive score map和score maps,然后是两条支路,一条之路和RPN类似,依然产生ROI,但后面这些ROI会直接映射到前面的得分图上,经过一个positive sensitive roi pooling,再进行投票得到这个ROI的类别,而scores maps是为了得到矩形框的回归信息,这样一来,用映射来代替前向传播,使得它的速度比faster rcnn快了三倍,精度在COCO也提升了三个百分点;

其他的工作就是一些ticks的堆叠:hard mining、膨胀卷积(Dilated Convolutions)等等

 

posted @ 2019-01-10 16:12  outthinker  阅读(403)  评论(0编辑  收藏  举报