人脸识别和行人判断

图像分割

             根据灰度,颜色,纹理和形状等特征把图像分割成互不交迭的区域。并使这些特征在同一区域内呈现相似性,不同区域内呈现明显的差异性(ps:深度学习根据语义分割)

              数字图像的分割基于:灰度的不连续性和相似性

      基于阈值分割:在颜色直方图内确定一阈值,大于该阈值为前景,小于为背景进行分割(阈值确定:大津法->类之间的方差最大)

      基于边缘分割:找到不同区域的边界点的集合(边缘检测方法)

                               

      基于区域分割:将图像按照相似性准则分成不同的区域(区域生长法、区域分裂合并法、分水岭法)

                               区域生长法:定义一个点为前景或后景,并定义一个阈值;这个点向周围的最小的灰度值延伸出区域,区域内地灰度值平均值将于下一个最小值比较,两者之差不大于阈值

                                     

                               分水岭法:先将彩色图像灰度化,再将灰度图转化成梯度图,再在灰度图上进行分水岭算法(空间位置相近并且灰度值相近的点连起来构成封闭的轮廓)求得边缘线。

       基于图论分割(Graph Cuts):图像的每个像素视为一个普通顶点,每两个普通顶点之间的连线称为一条边;

                                                          图外设两个终端顶点S(前景)和T(背景),两个终端顶点和每个普通顶点的都有连线,称为飞线

                                                          Graph Cuts中的Cuts是指图像中边和飞线的断开将"S"和”T“极其所连顶点分隔开的割的集合,如果Cuts的权值最小,则称为最小割

      基于图论分割:将图像分割与图的最小割相关联。首先将图像映射为带权无向图,每个节点表示原图每个像素点,每条边的权值表示了相邻像素在灰度、颜色、纹理等特征上的非负相似度

                                                                     

 

                                                          公式:                                            

                                                                                                        R(A)代表顶点(p)灰度值属于前景(或后景)的概率,概率越大R越小

                                           B(A)代表相邻顶点(p、q)的连续性,相似性越大,B越大  

                                  

                                  其中当权重为K时是确定(属于前景或后景)不可分割

 

                                                                                                                      

                                   未明确的点继续套用能量公式计算        

 

       GrabCut分割:在图片上加上框,框内包含目标和背景,框外则全为背景,当背景和目标颜色差异比较小的时候,可以添加辅助线注明该区域是目标或是背景

                                高斯混合模型(GMM):一个像素点必属于目标或背景的高斯分量

                                用边界项来体现邻域像素之间不连续的惩罚(引用Graph Cuts),若两邻域像素差别小,则可能属于同一目标或背景,反之可能为边缘

                                Kmeans算法(聚类算法)迭代:(需要事先知道分多少个类,一般在背景选5个,目标也选5个)

                                                            1. 选取K个中心;

                                                            2. 计算每个点和K个中心的距离

                                                            3. 把点分配到距离最近的聚类中心

                                                            4. 根据新加的点重新计算聚类中心(平均值)

                                                            5. 重复2-4步骤,直到所有数据迭代完成

                                                            6. 将框内的属于背景的类(K)也划分到背景,只留下目标的类,即完成提取(Graph Cuts步骤)

人脸识别                

       haar-like特征(15个):            haar模板(SUM白色-SUM黑色)

                                

                               要用到haar-like特征数量:

                               

        Haar级联分类器:

                         级联分类器:将多个强分类器连接在一起操作,每个强分类器是由若干个弱分类器(haar-like特征模板,要求准确率大于50%即可)加权组成。速度快

                                               (PS:分类器对于负例更敏感,所以排出的是负例)

                                               

 

行人检测:

                 梯度(方向导数):方向和梯度值

                         离散点的梯度值(为左右像素的差):

                 方向梯度直方图(HOG):

                                          1.梯度计算:水平和垂直;(ps:彩色图片选择梯度幅值最大的通道)

                                          2.block拆分:16*16的block(包含2*2个cell,每个cell是8*8g个像素点),步长是8,50%重合 (这样划分是为了避免不同光线时保持一致性,重复是为了连续性)

                                                                                     

                                           3.计算CELL的梯度直方图

                                                        a.使用位置高斯加权(平滑,降低光线的影响)

                                                        b.将梯度方向设置为0-180°(方向相反的设为同一个方向),将0-180°分为9个bin(经验值)

                                                                              

                                                        c.相邻bin使用线性插值,(即若85°的梯度幅值,会按照值的大小加权,将1/4放置在70°的bin上,将3/4放置在90°的bin上)

                                                        d.三线性插值(不单是X和Y,还有bin的梯度角度的插值)

                                                        e.串接所有block直方图(ps:维度高,需要SVM分类器)

                                                        f.对比度归一化处理(L2范式比L1好    因为梯度幅值绝对值容易受到目标与背景对比度以及局部光照的影响)

                                                                                把各个cell组成大的,空间上连续的block,再归一,并且一个cell会作用于多个block

                                          HOG 步骤:

                                                      1.将图像进行γ空间,颜色空间的归一化处理  (ps:为了更好识别动物)

                                                      2.计算图像梯度

                                                      3.构建直方图

                                                      4.将cell组成连续的block

                                                      5.收集HOG特征

          

 

 SVM基本模型:

             定义:如图W将正类样本和反类样本完全区分开且距离两边样本距离最大(距离之和最小),称W为最优分界面。经过两类样本且平行于最优分界面的超平面H1和H2,落在H1和H2上的训练样本成为支持向量(若同一种样本距离较远且中间隔着另一种样本,则考虑投射到高维空间,再找最优分界面)

                           

                     HOG+SVM:

                            

 

 DPM:(基于HOG+SVM优化的基于组件的检测算法)

 

                      组成:        

                            8*8的根滤波器                       4*4的组件滤波器            高斯滤波后的2倍空间模型

                        

               

               公式:

                     总得分                                                      根模型相应分数                                  部件模型相应分数                                               不同模型组件的偏移系数(使其和模型对其)

                   

             

              步骤:

                 

 

posted @ 2019-08-01 01:26  远处是风景  阅读(31)  评论(0)    收藏  举报