【机器学习】目标检测中涉及的一些算法和思想

本文档并不详细地讲解每个算法的实现过程及原理，只简要地介绍算法作用及思想，如想仔细原理及实现请读者自行研究

非极大值抑制算法，用于消除多余的框

根据一系列复杂的规则及图像的纹理颜色…等特征（规则较为复杂，且可当做黑盒），生成一些可能是物体的候选框

这种过程叫Region Proposals

交并比算法

分子是预测框和ground-truth之前的重叠区域，分母是并集区域，是预测框和ground-truth所包含的总区域。重叠区域和并集区域的比值即IoU

经过了Conv得到的原始feature map中的每一点都可以映射到原始输入图像的一个感受野（有不同比例x不同大小，可以设计，一个点有3x3=9种锚框）

通常用于RPN网络中，feature map产生n个候选框后经过IoU再将k个框经过二分类和坐标回归后可得到6k数据

输入feature map和锚框的向量[label,x_min,y_min,x_max,y_max]

输出max pooling/avg pooling

经过RPN，得到前景区域

特点：

CNN不同尺寸输入

仅对原图做一次卷积

经过SPPNet，无论哪种尺寸的feature map，输出（21x c (channel) ）的固定输出到FC层

将feature map 分别以4x4、2x2、1x1的尺寸得到特征向量

（经过pooling操作，将1/16、1/4….区域中的数据提取出特征向量）

posted on 2022-08-01 22:33 Jolyne123 阅读(98) 评论(0) 收藏举报