二视图从运动到结构----对极几何和基础矩阵

本文主要介绍对极几何和基础矩阵。

----------------------------------------------------

对极几何的出现时为了解决什么问题？

-----------------------------------------------------

从一张2D的图像估计3D模型有时十分困难（现在有基于深度学习的深度图估计，不清楚是否可以对这种场景3D还原）

这个时候，双/多摄像头就可以帮助解决3D恢复的问题

立体视觉几何中有以下问题：

1.已知一幅图像中一点，如何寻找另一幅图像中这个点的对应点（根据是否知道相机的相对位置，此问题求解方式不同）

2.已知两幅图像中两点是对应关系，如何求解两相机的相对位置和姿态

3.已知多幅图像中同一3D点的对应点，如何求解该3D点的3D坐标

对极几何/基础矩阵的出现可以解决问题2。

----------------------------------------------------

对极几何是什么？

-----------------------------------------------------

1.基本概念

立体成像的基本几何就是对极几何。下图是最经典的对极几何示意图。

O1和O2为两个相机（也有可能是一个相机在不同时刻的位置）的主点，P为空间中一个物点，两个相对的白色平面是像面(严格按照光路应该是在O1 O2点的后方，与P点相反方向，CV中默认采用这种往前画的方式节省空间)。p1和p2是P点在像面上的对应点，e1 e2为像面和O1 O2的交点。O1O2为基线，也被称作相机的移动方向。

在对极几何中，e1和e2被称作极点，PO1O2平面为极面，p1e1为极线，同理p2e2也为极线。这是对极几何中重要的三个概念。

2. 极点性质

下面介绍极点的性质：

=像平面和的基线O1O2交点

=O2在相机1上的像点为e1

=基线的平行线在各自像面上的消失点

重点阐述一下第3个性质,

A. 如图，两个相机相对放置（会聚视角），相机1面向右边，相机2面向左边，可知极点位于1的右边，2的左边。图中花瓶上标示的横线即为平行于基线的线条。

为什么平行于基线的线条消失点为极点？可以看上图，平行于基线的线条所在极面与像面必交于极点（基线必与像面交于极点），故而这些线条在像面上一定会交于极点。

B. 当两个像面平行时，根据极点的定义，则极点位于无穷远处，极线与基线平行，如下图所示

这个时候，与基线平行的线条的在像面是一系列平行线，消失点在无穷远，和极点重合

C. 当两个相机是前后放置且主点连线和像面垂直时（forward translation）

极点在各自像平面上的位置相同，且平行基线的线条在像面上的位置如上图右边所示。同样消失点为极点。

3.对极约束

p点在像面2上的对应点一定在极线l'上

--------------------------------------

基础矩阵是什么

--------------------------------------

如果已知基础矩阵F，以及一个3D点在一个像面上的像素坐标p，则可以求得在另一个像面上的像素坐标p'。这个是基础矩阵的作用，可以表征两个相机的相对位置及相机内参数。

下面具体介绍基础矩阵与像素坐标p和p'的关系。重点来了~

以O1为原点，光轴方向为z轴，另外两个方向为x, y轴可以得到一个坐标系，在这个坐标系下，可以对P, p1(即图中所标p), p2(即图中所标p')得到三维坐标，同理，对O2也可以得到一个三维坐标，这两个坐标之间的转换矩阵为[R T]，即通过旋转Ｒ和平移Ｔ可以将O1坐标系下的点P1(x1, y1, z1)，转换成O2坐标系下的P2(x2, y2, z2)。

则可知，P2 = R(P1-T) (1)

采用简单的立体几何知识，可以知道

(2)

其中，p, p'分别为P点的像点在两个坐标系下分别得到的坐标（非二维像素坐标）。Rp'为极面上一矢量，T为极面上一矢量，则两矢量一叉乘为极面的法向量，这个法向量与极面上一矢量p一定是垂直的，所以上式一定成立。（这里采用转置是因为p会表示为列向量的形式，此处需要为行向量）

采用一个常用的叉乘转矩阵的方法，

(3)

将我们的叉乘采用上面的转换，会变成

(4)

红框中所标即为本征矩阵E，他描述了三维像点p和p'之间的关系

(5)

有了本征矩阵，我们的基础矩阵也就容易推导了

注意到将p和p'换成P1和P2式(4)也是成立的，且有

q1 = K1P1 (6)

q2 = K2P2 (7)

上式中， K1K2为相机的校准矩阵，描述相机的内参数 q1q2为相机的像素坐标

代入式(4)中，得

(8)

上式中p->q1, p'->q2

这样我们就得到了两个相机上的像素坐标和基础矩阵F之间的关系了

(9)

-------------------------------------

基础矩阵的性质

-------------------------------------

F有什么样的性质呢？简单说来， 3x3的矩阵，理论上9个自由度，但是需要符合以下两个约束

a)如果F为基础矩阵，那么kF也为基础矩阵

b)秩为2

所以减去两个自由度，F有7个自由度

第二条约束是怎么来的？

我们知道，矩阵的秩有这么一个性质，矩阵相乘的秩不大于各矩阵的秩

那么，可以知道F其实是以下这些矩阵相乘的结果

其中，Tx的具体形式在式(3)中有表述

可以知道，第三列A2可以用第一列A0和第二列A1线性表示

A2 = -Ty*A1/Tz-Tx*A0/Tz

所以Tx秩为2

那么F秩为2也得证了

一般采用七点算法或八点算法对F进行求解，得知F后就可以对任意像面1上点找像面2上对应点了。

Reference:

1. Computer vision algo and application

2. learning openCV

3. multiple view geometry in computer vision

4. CV slides of Li Feifei

posted @ 2017-09-11 22:11 sunny,lee 阅读(8671) 评论(5) 收藏举报

刷新页面返回顶部

sunny,lee

图像处理，机器学习，光学原理，GPU硬件

二视图从运动到结构----对极几何和基础矩阵

公告