Fork me on GitHub

第五讲_图像识别之图像检测Image Detection

第五讲_图像识别之图像检测Image Detection

  • 目录

  • 物体检测

  • ILSVRC竞赛200类(每个图片多个标签):输出类别+Bounding Box(x,y,w,h)

  • PASCAL VOC 2012只有20类

  • 模型进化

区域卷积神经网络R-CNN-2014

  • 模型结构
  • selective search+CNN特征+svm+Bounding box regression
  • Regiom proposals
  • 训练流程


  • 测试阶段
  • RCNN性能大幅提升

SPPNet网络-2014

  • R-CNN速度慢的重要原因:卷积特征重复计算量太大
  • spp技术实现了共享计算,适应不同输入尺寸
  • SPP层具体实现
  • sppNet问题

Fast-R-CNN-2015

  • 改进;更高mAP(类似AUC曲线下的面积)
  • 网络结构



  • 训练阶段

Faster-R-CNN-2015

  • 概况,引导CNN关注区域
  • Region Proposal Network
  • 训练过程

区域全卷积神经网络R-FCN

  • 回顾
  • F-RCN的设计过程
  • 分类问题对尺寸,方向等变换不敏感,网络越深,分类效果很好;但是检测对变换敏感

  • 结构图:三部分
  • 理解K2(C+1)个通道,映射到每类K2个score map

人脸检测/行人检测

  • 主流数据库
  • WIDER FACE
  • IJB-A
  • Caltech
posted @ 2017-09-17 00:31  ranjiewen  阅读(1847)  评论(0编辑  收藏  举报