Faster R-CNN原理详解
生成proposals
- 解码生成预测框
- 将预测框的位置限定到图片的范围之内(目前还是保留了全量的预测结果,下面就会对预测框进行过滤)
- 首先过滤掉面积太小的(filter)
- 对分数进行过滤,把分数低的过滤掉(top_k)
- 去掉一些十分接近的目标框(NMS)
- NMS结束后再次对分数进行排序,把分数低的去掉,得到proposals
大概会生成2000+个proposals去进入到后续的网络计算
uploading-image-831351.png
ROI Pooling

ROI Pooling的不足

这会导致检测的信息和最终提取出来的信息是不匹配的,于是这种算法便被改进
ROI Align

- 蓝色网格的图中每个交叉点都可以理解为特征图上点的位置,在ROI Pooling中每一个这样的子区域都可以用这些蓝色交叉点的位置来表示的
那么今天就为大家带来ROI Align的做法
![]()
在完成ROI之后我们便可以进入下一个阶段
BBOX Head

- 经过一些列的卷积和Pooling将14x14的图片压缩到1x1
- 这些特征图再经过两个FC得到分类分支和回归分支
在第二阶段就要对物体的类别进行分类,对候选框的位置进行微调 - 81就是类别数,324就是81x4
- 最后再去计算一个Loss
![]()
BBox Head中的监督信息

BBox Head Loss

Faster R-CNN的效果




浙公网安备 33010602011771号