RCNN, Fast RCNN和Faster RCNN

  RCNN系列是目标检测的two-satge代表,运行速度慢,但检测精度很高,也比较难理解,简单记录下,慢慢啃。。。。。

1. RCNN

   RCNN 是在2013年的论文Rich feature hierarchies for accurate object detection and semantic segmentation中提出,是第一篇目标检测领域的深度学习文章,大幅提升了目标检测的识别精度,在PASCAL VOC2012数据集上将MAP从35.1%提升至53.7%。 这篇文章的创新点有以下几点:将CNN用作目标检测的特征提取器、有监督预训练的方式初始化CNN、在CNN特征上做BoundingBox 回归。

       RCNN的整个流程分为三步,如下图所示:

 

   1.1 Region Proposal(区域选择)

  RCNN首先采用selective search分割算法(selective search参考),分割成许多子图片,从中筛选出2000张子图区域作为候选区域,然后将2000张子图分别resize到224*224大小,送入CNN网络进行特征提取。如下图所示:

 

   1.2 Feature Extraction(特征提取)

  RCNN分别尝试了AlexNet和VGG16两种网络模型来提取特征, AlexNet比较简单,包括五层卷积+三层全连接,输入是224x224的图片。论文中也是提取在 ILSVRC 2012 的模型和权重,然后在 VOC 上进行 fine-tune。(ImageNet 预训练需要预测 1000 个类别, VOC 迁移学习需要识别 21 个类别(20类+背景))

  上述的2000个候选框,会与gt box计算IOU,其中IOU>0.5的算作正样本,IOU<0.5的算作负样本,每128个候选框(32pos+96neg)一个batch进行训练, 如下图所示:

 

   1.3 Classification and detection (分类和检测)

    将上一步CNN提出出来的4096维特征,送入SVM分类器进行分类(每一个类别都有一个SVM分类器,共21个?)

 

https://www.jianshu.com/p/03bab51a90fb

https://zhuanlan.zhihu.com/p/27473413

 

 

Faster_rcnn

https://cloud.tencent.com/developer/article/1441555

 

posted @ 2024-09-21 13:22  silence_cho  阅读(110)  评论(0)    收藏  举报