第五讲_图像识别之图像检测Image Detection
第五讲_图像识别之图像检测Image Detection
-
目录

-
物体检测


-
ILSVRC竞赛200类(每个图片多个标签):输出类别+Bounding Box(x,y,w,h)
-
PASCAL VOC 2012只有20类

-
模型进化

区域卷积神经网络R-CNN-2014
- 模型结构

- selective search+CNN特征+svm+Bounding box regression

- Regiom proposals
- 训练流程



- 测试阶段

- RCNN性能大幅提升

SPPNet网络-2014
- R-CNN速度慢的重要原因:卷积特征重复计算量太大

- spp技术实现了共享计算,适应不同输入尺寸

- SPP层具体实现

- sppNet问题

Fast-R-CNN-2015
- 改进;更高mAP(类似AUC曲线下的面积)

- 网络结构




- 训练阶段

Faster-R-CNN-2015
- 概况,引导CNN关注区域

- Region Proposal Network

- 训练过程

区域全卷积神经网络R-FCN
- 回顾

- F-RCN的设计过程
- 分类问题对尺寸,方向等变换不敏感,网络越深,分类效果很好;但是检测对变换敏感


- 结构图:三部分

- 理解K2(C+1)个通道,映射到每类K2个score map


人脸检测/行人检测
- 主流数据库

- WIDER FACE
- IJB-A
- Caltech
C/C++基本语法学习
STL
C++ primer


浙公网安备 33010602011771号