Faster R-CNN原理详解

生成proposals

  • 解码生成预测框
  • 将预测框的位置限定到图片的范围之内(目前还是保留了全量的预测结果,下面就会对预测框进行过滤)
  • 首先过滤掉面积太小的(filter)
  • 对分数进行过滤,把分数低的过滤掉(top_k)
  • 去掉一些十分接近的目标框(NMS)
  • NMS结束后再次对分数进行排序,把分数低的去掉,得到proposals
    大概会生成2000+个proposals去进入到后续的网络计算
    uploading-image-831351.png

ROI Pooling

ROI Pooling的不足


这会导致检测的信息和最终提取出来的信息是不匹配的,于是这种算法便被改进

ROI Align

  • 蓝色网格的图中每个交叉点都可以理解为特征图上点的位置,在ROI Pooling中每一个这样的子区域都可以用这些蓝色交叉点的位置来表示的
    那么今天就为大家带来ROI Align的做法

    在完成ROI之后我们便可以进入下一个阶段

BBOX Head

  • 经过一些列的卷积和Pooling将14x14的图片压缩到1x1
  • 这些特征图再经过两个FC得到分类分支和回归分支
    在第二阶段就要对物体的类别进行分类,对候选框的位置进行微调
  • 81就是类别数,324就是81x4
  • 最后再去计算一个Loss

BBox Head中的监督信息

BBox Head Loss

Faster R-CNN的效果


posted @ 2025-06-20 20:49  探索笋  阅读(19)  评论(0)    收藏  举报