随笔分类 - 机器视觉

Zdenek Kalal的TLD Tracker
摘要: Kalal是英国萨里大学的一个捷克学生。他演示的是他的神奇的精确定位系统,这个系统几乎可以跟踪镜头里的任何物体,只要你能看见它,并把它选中。它能 做很多神情的事情。在这个视频中,他演示了通过摄像机拍摄他的手指、把他的手指选做目标。系统于是就能精确的跟踪他的手指的动作。更令人惊奇的是,这个系 统能够通过分析物体的运动来完善跟踪算法。你能在很短的时间里教会它跟踪你的手指、面孔或在高速公路上狂颠的轿车。有了这套系统,我们几乎真的可以实 现”Minority Report“那样的人机界面。就像微软Xbox的Kinect那样,而这个效果更好。Kalal有12个视频来演示 他的这套算法都能做什么。只要你有阅读全文

posted @ 2012-03-08 23:33 湘厦人 阅读(1312) | 评论 (0) 编辑

计算机视觉基础5——本质矩阵与基本矩阵(Essential and Fundamental Matrices)
摘要: 回顾本质矩阵的定义本质矩阵的基本性质:结合成像的几何关系 Longuet-Higgins equation注意大小写的区别哦,大小表示物点矢量,小与表示像点矢量。像平面上的一点可以看作:• (u,v) 2D film point(局限于像平面上来考虑)• (u,v,f) 3D point on film plane(相机坐标系中来考虑)• k(u,v,f) viewing ray into the scene(透过像点和原点射线上点的像,相机坐标系中来考虑)• k(X, Y, Z) ray through point P in the scene(在世界坐标系中来考虑)设$l$为像平...阅读全文

posted @ 2011-12-20 15:57 湘厦人 阅读(7886) | 评论 (4) 编辑

计算机视觉基础4——对极几何(Epipolar Geometry)
摘要: 先思考一个问题:用两个相机在不同的位置拍摄同一物体,如果两张照片中的景物有重叠的部分,我们有理由相信,这两张照片之间存在一定的对应关系,本节的任务就是如何描述它们之间的对应关系,描述工具是对极几何 ,它是研究立体视觉的重要数学方法。 要寻找两幅图像之间的对应关系,最直接的方法就是逐点匹配,如果加以一定的约束条件对极约束(epipolar constraint),搜索的范围可以大大减小。 先回顾简单的立体成像系统对极约束的图示更一般的立体成像关系:两个相机的坐标无任何约束关系,相机的内部参数可能不同,甚至是未知的。要刻画这种情况下的两幅图像之间的对应关系,需要引入两个重要的概念——对极矩...阅读全文

posted @ 2011-12-20 12:41 湘厦人 阅读(11058) | 评论 (0) 编辑

共面点成像——planar homography
摘要: 在前面已经讨论了三维物体成像过程,相比之下,还有一种稍简单的情况——平面成像,即所有的物点都处在同一个平面上,我们有理由相信,这种情况下的成像关系是一般立体成像的一种特例。先回顾一下一般的单体成像过程 对于共面的物点,在恰当的世界坐标系中,可以令其中一个坐标值为0,不妨设第三维坐标为0,图示如下:由于物点的第三维坐标为0,整个成像过程的矩阵表示会得到简化。可以简化为一个3X3的矩阵,称之为Homography矩阵,该矩阵是可逆的!!对于正前方的物体平面(垂直于光轴),成像关系将更进一步简化。将共面物点经成像之后,再变换为数字图像(u,v)研究共面点成像有什么意义呢?原来是为了研究两幅图之间..阅读全文

posted @ 2011-12-20 10:40 湘厦人 阅读(3028) | 评论 (0) 编辑

计算机视觉基础3——内部参数描述
摘要: 在上一节中,我们用矩阵描述了外部参数,即物体的坐标到相机坐标的变换。同时还分析了透视投影,即成像的过程,整个过程就是从(U,V,W)->(X,Y,X)->(x,y)。这一节主要讨论如何从像平面(x,y)变换到数字图像(u,v),即从像平面(Film Coords)到像素(Pixel Coords)。对一幅数字图像,我们可以改变它的宽高比,即作尺度变换。将尺度变换与透视投影结合,用矩阵表示为尺度变换是一种仿射变换,因此,将从(X,Y,X)到(u,v)的变换可以写为整个成像过程就是:补充点高等几何的知识:变换1. 平移2. 尺度变换3. 旋转4. 刚体运动5. 刚体+尺度变换6. 仿射阅读全文

posted @ 2011-12-19 23:03 湘厦人 阅读(3135) | 评论 (0) 编辑

计算机视觉基础2——相机成像的几何描述
摘要: 试想像一下,很多游客同时在不同角度拍摄Eiffel Tower(埃菲尔铁塔),该如何用数学的方法来描述这一过程呢?首先要解决的问题就是定位,或者说坐标选定的问题,埃菲尔铁塔只有一座,如果按经、纬度来刻画,它的坐标是唯一确定的,但游客显然不关系这一点,他(她)只按自己的喜好选择角度和位置,因此,物体(景物)有物体的坐标系统,相机有相机的坐标系统,即便同一个相机,当调整参数时,在同样的位置、相同的角度,也可能得到不同的图像。为了统一描述,有必要引入世界坐标(或物体坐标)、相机坐标和像平面坐标。世界坐标用UVW记。相机坐标用XYZ记。中学物理告诉我们,物体与像是倒的关系,但作为数学分析,我们采用虚.阅读全文

posted @ 2011-12-19 22:21 湘厦人 阅读(3974) | 评论 (0) 编辑

计算机视觉基础1——视差与深度信息
摘要: 资料来源:Robert Collins,CSE486, Penn State第8讲Stereo Vision深度信息感知是人类产生立体视觉的前提。生理过程一定是相当复杂,此处,我们只从物理角度,并采用数学的方法来讨论。Inferring depth from images taken at the same time by two or more cameras.基本透视投影透视投影是多对一的关系,投影线上的任何一点对应同一个像点。如果用两个摄像机,则可以消除这种多对一,从而能够确定第三维坐标Z的值,即深度信息。为什么可以感知深度信息呢?我们的左右眼从略微不同的角度观察景物,而这种视差与物体所阅读全文

posted @ 2011-12-19 20:16 湘厦人 阅读(5655) | 评论 (2) 编辑

CV相关研究人员(当前关注...)
摘要: 1、http://www.cmap.polytechnique.fr/~yu/是个中国人?对SIFT提出了不少算法,并进行了改进,关注他的文章,更关键的是提供了算法源码,到目前为止,好像是对SIFT说“不”最狠的一个。下面这个网站给出了许多例子。http://www.cmap.polytechnique.fr/~yu/research/ASIFT/demo.html2、http://www.csc.kth.se/~tony/一个深入研究尺度空间的牛人,写过一本这方面的专著。分类文章网址如下(从总体、综述、基本理论等各方面归类)http://www.csc.kth.se/~tony/earlyv阅读全文

posted @ 2011-11-25 23:53 湘厦人| 编辑

导航

统计

公告