目标检测YOLO算法-学习笔记
算法发展及对比:
17年底,mask-R CNN

YOLO
YOLO最大的优势就是快
原论文中流程,可以检测出20类物体.

红色网格-张量,在这样一个1×30的张量中保存的数据

横纵坐标中心点缩放到0-1之间

每一个小网格矩形对应两个不同尺寸比例的物体:竖条,长条;单数是竖着的苗条框,偶数是横着的宽框.
bb1和bb2,两个box 分别保存中心点坐标,宽度,高度,置信度

张量后20为,认为其是某一类的当前概率值,置信

后20:是20个之中的哪一类,打个分.

bb1和bb2中也有个置信度,是其box中是否有物体的置信度.(待定)


循环遍历7*7=49个网格grid cell,每个网格两种矩形去预测bb1和bb2,存是不是物体*物体哪一类,两个值相乘:

共7*7=49,*2=98个

检测过程
 
细节过程
98个box,20类物体
对,是狗的打分
设定阈值是0.2,即如果里面预测类别置信的值小于0.2,令其=0

概率排序(降序)大在前:

对排序后的某些类别...

NMS:非极大值抑制,Non-Maximum Suppression

不同位置的框内,概率不同:



比较,比它小的非0值
 
IOU:两个区域交集和并集的比例

IOU>0.5认为两个框重合的比较多.置为0.之后迭代循环

 

(二)递归,以0.2
 

(三)

后续流程:draw
 

对bb3(20×1)类别的分数,找分数对应最大类别的索引.---->class
bb3(20×1)中最大的分---->score



YOLO很快,tiny更快
端到端的
可以和Fast R-CNN合并
YOLO v.1 v.2
主要应用
智能驾驶
医疗
链接
Arxiv:https://arxiv.org/abs/1506.02640
Blog:http://pjreddie.com/publications/yolo/
Darknet:https://github.com/pjreddie/darknet
Caffe:https://github.com/xingwangsfu/caffe-yolo
Tensorflow:
Test+train:https://github.com/thtrieu/yolotf
Test:https://github.com/gliese581gg/YOLO_tensorflow
 
 
                    
                     
                    
                 
                    
                
 
                
            
         
         浙公网安备 33010602011771号
浙公网安备 33010602011771号