本文档并不详细地讲解每个算法的实现过程及原理,只简要地介绍算法作用及思想,如想仔细原理及实现请读者自行研究
-
NMS(Non-maximum suppression)
非极大值抑制算法,用于消除多余的框
-
Selective Search算法
根据一系列复杂的规则及图像的纹理颜色…等特征(规则较为复杂,且可当做黑盒),生成一些可能是物体的候选框
这种过程叫Region Proposals
-
IoU(Intersection over Union)
交并比算法
分子是预测框和ground-truth之前的重叠区域,分母是并集区域,是预测框和ground-truth所包含的总区域。重叠区域和并集区域的比值即IoU


-
K anchor boxes
经过了Conv得到的原始feature map中的每一点都可以映射到原始输入图像的一个感受野(有不同比例x不同大小,可以设计,一个点有3x3=9种锚框)
通常用于RPN网络中,feature map产生n个候选框后经过IoU再将k个框经过二分类和坐标回归后可得到6k数据

-
ROI Pooling思想
输入feature map和锚框的向量[label,x_min,y_min,x_max,y_max]
输出max pooling/avg pooling
-
RPN(Region Proposal Network)思想
-
产生n个候选框
-
classification loss(前景/背景)
-
Bounding box regression(对候选框微调)
经过RPN,得到前景区域
-
SPPNet(空间金字塔池化)思想
特点:
CNN不同尺寸输入
仅对原图做一次卷积
经过SPPNet,无论哪种尺寸的feature map,输出(21x c (channel) )的固定输出到FC层

将feature map 分别以4x4、2x2、1x1的尺寸得到特征向量
(经过pooling操作,将1/16、1/4….区域中的数据提取出特征向量)

浙公网安备 33010602011771号