图像配准-尺度不变特征转换法(Scale-invariant feature transform,SIFT)详解(一)

一、技术发展历程

尺度不变特征转化法(SIFT)是David G. Lowe教授从灵长类动物视觉下颞(IT)皮层神经元的反应中得到灵感在1999年提出[1],并在2004年改进[2],用于图像特征提取、匹配的一种图像识别算法。这种算法从关键点的提取、关键点定位到关键点描述的图像识别的框架设计被广泛接受。另外,本算法基于统计学的关键点描述方法也成为了关键点描述的经典方法。

二、算法原理

1. 关键点定位

该算法先将一幅图像做高斯运算并通过双线性重采样和原图求差分,得到极值点。对于提取到的极值点。将得到极值点的其临近像素再次重采样构建金字塔求差分直至极点消失。

通过构建出的极值点临近像素金字塔,可以计算出其幅值参量$$M_{i j}=\sqrt{(A_{i j}-A_{i+1 j})^2+(A_{i j}-A_{i j+1})^2}$$
和方位参量$$R_{ij}=atan2(A_{i j}-A_{i+1 j},(A_{i j}-A_{i j+1})$$。

在这一步骤中,同时对关键点的方位做了标定。

标定的方法是再次将关键点附近像素做3倍于当前的加权高斯运算并求出梯度。每个像素做加权高斯运算的权重是根据当前位置的幅值\(R_{ij}\)确定,然后再将各个方向的梯度按360度方位统计概率直方图。这个直方图就是关键点的位置参考。

2. 关键点描述

由于3D投影对图像概率直方图的影响很小,使用各关键点周边点(4x4)的梯度概率可以很好的描述各关键点在图像中的位置。同时,为了实现不同分辨率下的描述,还提取了不同尺寸和采样率的周边区域(2x2)。

3. 索引与匹配

提取到大量关键点描述信息后,实现快速图像匹配所面临的最重要的问题就是如何组织信息并利用这些信息对图像进行匹配。

对于第一个问题,Lowe教授使用了他发明的best-bin-first search model组织得到的关键点信息用于快速匹配。

对于第二个问题,它采用了Hough Transform(其实就是把坐标转到极坐标系下)在新图像中寻找与原图关键点的匹配。

三、 参考文献


  1. D. G. Lowe, “Object recognition from local scale-invariant features,” in
    Proc. Int. Conf. Comput. Vis., 1999, pp. 1150–1157. ↩︎

  2. D. G. Lowe, “Distinctive image features from scale-invariant keypoints,”
    Int. J. Comput. Vis., vol. 60, no. 2, pp. 91–110, Nov. 2004. ↩︎

posted @ 2020-12-20 20:56  无线电  阅读(21)  评论(0)    收藏  举报