opencv 编程入门

woody’s cabin

I hear and I forget, I see and I remember, I do and I understand.

OpenCV编程入门

美国伊力诺理工学院计算机科学系Gady Adam

翻译：Mensch

2006年11月22日

内容

简介

OpenCV概述
资料链接
OpenCV 命名约定
编译命令
C程序实例

GUI 命令

OpenCV 基础数据结构

图像数据结构
矩阵与向量
其他数据结构

图像处理

矩阵操作

视频序列处理

简介

OpenCV概述

什么是OpenCV

开源C/C++计算机视觉库.
面向实时应用进行优化.
跨操作系统/硬件/窗口管理器.
通用图像/视频载入、存储和获取.
由中、高层API构成.
为Intel®公司的 Integrated Performance Primitives (IPP) 提供了透明接口.

特性:

图像数据操作 (分配,释放, 复制, 设定, 转换).
图像与视频 I/O (基于文件/摄像头输入, 图像/视频文件输出).
矩阵与向量操作与线性代数计算(相乘, 求解, 特征值, 奇异值分解SVD).
各种动态数据结构(列表, 队列, 集, 树, 图).
基本图像处理(滤波, 边缘检测, 角点检测, 采样与插值, 色彩转换, 形态操作, 直方图, 图像金字塔).
结构分析(连接成分, 轮廓处理, 距离转换, 模板匹配, Hough转换, 多边形近似, 线性拟合, 椭圆拟合, Delaunay三角化).
摄像头标定 (寻找并跟踪标定模板, 标定, 基础矩阵估计, homography估计, 立体匹配).
动作分析(光流, 动作分割, 跟踪).
对象辨识 (特征方法, 隐马可夫链模型HMM).
基本GUI(显示图像/视频, 键盘鼠标操作, 滚动条).
图像标识 (直线, 圆锥, 多边形, 文本绘图)

OpenCV 模块:

cv - OpenCV 主要函数.
cvaux - 辅助 (实验性) OpenCV 函数.
cxcore - 数据结构与线性代数算法.
highgui - GUI函数.

资料链接

参考手册:

<opencv-root>/docs/index.htm

网络资源:

官方网页: http://www.intel.com/technology/computing/opencv/
软件下载: http://sourceforge.net/projects/opencvlibrary/

书籍:

Open Source Computer Vision Library by Gary R. Bradski, Vadim Pisarevsky, and Jean-Yves Bouguet, Springer, 1st ed. (June, 2006).

视频处理例程 (位于 <opencv-root>/samples/c/目录中):

色彩跟踪: camshiftdemo
点跟踪: lkdemo
动作分割: motempl
边缘检测: laplace

图像处理例程(位于<opencv-root>/samples/c/目录中):

边缘检测: edge
分割: pyramid_segmentation
形态: morphology
直方图: demhist
距离转换: distrans
椭圆拟合 fitellipse

OpenCV 命名约定

函数命名:

·             cvActionTarget[Mod](...)

·

·             Action = 核心功能(例如 设定set, 创建create)

·             Target = 操作目标 (例如 轮廓contour, 多边形polygon)

    [Mod]  = 可选修饰词 (例如说明参数类型)

矩阵数据类型:

·             CV_<bit_depth>(S|U|F)C<number_of_channels>

·

·             S = 带符号整数

·             U = 无符号整数

·             F = 浮点数

·

·             例:   CV_8UC1 表示一个8位无符号单通道矩阵,

          CV_32FC2 表示一个32位浮点双通道矩阵.

图像数据类型:

·             IPL_DEPTH_<bit_depth>(S|U|F)

·

·             例:   IPL_DEPTH_8U 表示一个8位无符号图像.

          IPL_DEPTH_32F 表示一个32位浮点数图像.

头文件:

·             #include <cv.h>

·             #include <cvaux.h>

·             #include <highgui.h>

    #include <cxcore.h>   // 不必要 - 该头文件已在 cv.h 文件中包含

编译命令

Linux系统:

·         g++ hello-world.cpp -o hello-world \

·             -I /usr/local/include/opencv -L /usr/local/lib  \

    -lm -lcv -lhighgui -lcvaux

Windows系统:

注意在项目属性中设好OpenCV头文件以及库文件的路径.

C程序实例

////////////////////////////////////////////////////////////////////////

//

// hello-world.cpp

//

// 一个简单的OpenCV程序

// 它从一个文件中读取图像，将色彩值颠倒，并显示结果.

//

////////////////////////////////////////////////////////////////////////

#include <stdlib.h>

#include <stdio.h>

#include <math.h>

#include <cv.h>

#include <highgui.h>

int main(int argc, char *argv[])

  IplImage* img = 0;

  int height,width,step,channels;

  uchar *data;

  int i,j,k;

  if(argc<2){

    printf("Usage: main <image-file-name>\n\7");

    exit(0);

  // 载入图像

  img=cvLoadImage(argv[1]);

  if(!img){

    printf("Could not load image file: %s\n",argv[1]);

    exit(0);

  // 获取图像数据

  height    = img->height;

  width     = img->width;

  step      = img->widthStep;

  channels  = img->nChannels;

  data      = (uchar *)img->imageData;

  printf("Processing a %dx%d image with %d channels\n",height,width,channels);

  // 创建窗口

  cvNamedWindow("mainWin", CV_WINDOW_AUTOSIZE);

  cvMoveWindow("mainWin", 100, 100);

  // 反色图像

  for(i=0;i<height;i++) for(j=0;j<width;j++) for(k=0;k<channels;k++)

    data[i*step+j*channels+k]=255-data[i*step+j*channels+k];

  // 显示图像

  cvShowImage("mainWin", img );

  // wait for a key

  cvWaitKey(0);

  // release the image

  cvReleaseImage(&img );

  return 0;

GUI命令

窗口管理

创建并放置一个窗口:

·           cvNamedWindow("win1", CV_WINDOW_AUTOSIZE);

  cvMoveWindow("win1", 100, 100); // 以屏幕左上角为起点的偏移量

读入图像:

·           IplImage* img=0;

·           img=cvLoadImage(fileName);

  if(!img) printf("Could not load image file: %s\n",fileName);

显示图像:

  cvShowImage("win1",img);

可显示彩色或灰度的字节/浮点图像。彩色图像数据认定为BGR顺序.

关闭窗口:

  cvDestroyWindow("win1");

改变窗口尺寸:

  cvResizeWindow("win1",100,100); // 新的宽/高值(象素点)

输入设备

响应鼠标事件:

定义鼠标handler:

o      void mouseHandler(int event, int x, int y, int flags, void* param)

o      {

o        switch(event){

o          case CV_EVENT_LBUTTONDOWN:

o            if(flags & CV_EVENT_FLAG_CTRLKEY)

o              printf("Left button down with CTRL pressed\n");

o            break;

o          case CV_EVENT_LBUTTONUP:

o            printf("Left button up\n");

o            break;

o        }

o      }

o      // x,y:   针对左上角的像点坐标

o      // event: CV_EVENT_LBUTTONDOWN,   CV_EVENT_RBUTTONDOWN,   CV_EVENT_MBUTTONDOWN,

o      //        CV_EVENT_LBUTTONUP,     CV_EVENT_RBUTTONUP,     CV_EVENT_MBUTTONUP,

o      //        CV_EVENT_LBUTTONDBLCLK, CV_EVENT_RBUTTONDBLCLK, CV_EVENT_MBUTTONDBLCLK,

o      //        CV_EVENT_MOUSEMOVE:

o      // flags: CV_EVENT_FLAG_CTRLKEY, CV_EVENT_FLAG_SHIFTKEY, CV_EVENT_FLAG_ALTKEY,

  //        CV_EVENT_FLAG_LBUTTON, CV_EVENT_FLAG_RBUTTON,  CV_EVENT_FLAG_MBUTTON

注册handler:

o      mouseParam=5;

  cvSetMouseCallback("win1",mouseHandler,&mouseParam);

响应键盘事件:

键盘没有事件handler.
直接获取键盘操作:

o      int key;

  key=cvWaitKey(10); // 输入等待10ms

等待按键并获取键盘操作:

o      int key;

  key=cvWaitKey(0); // 无限等待键盘输入

键盘输入循环:

o      while(1){

o        key=cvWaitKey(10);

o        if(key==27) break;

o        switch(key){

o          case 'h':

o            ...

o            break;

o          case 'i':

o            ...

o            break;

o        }

处理滚动条事件:

定义滚动条handler:

o      void trackbarHandler(int pos)

o      {

o        printf("Trackbar position: %d\n",pos);

注册handler:

o      int trackbarVal=25;

o      int maxVal=100;

  cvCreateTrackbar("bar1", "win1", &trackbarVal ,maxVal , trackbarHandler);

获取滚动条当前位置:

  int pos = cvGetTrackbarPos("bar1","win1");

设定滚动条位置:

  cvSetTrackbarPos("bar1", "win1", 25);

OpenCV基础数据结构

图像数据结构

IPL 图像:

·         IplImage

·           |-- int  nChannels;     // 色彩通道数(1,2,3,4)

·           |-- int  depth;         // 象素色深:

·           |                       //   IPL_DEPTH_8U, IPL_DEPTH_8S,

·           |                       //   IPL_DEPTH_16U,IPL_DEPTH_16S,

·           |                       //   IPL_DEPTH_32S,IPL_DEPTH_32F,

·           |                       //   IPL_DEPTH_64F

·           |-- int  width;         // 图像宽度（象素点数）

·           |-- int  height;        // 图像高度（象素点数）

·

·           |-- char* imageData;    // 指针指向成一列排列的图像数据

·           |                       // 注意色彩顺序为BGR

·           |-- int  dataOrder;     // 0 - 彩色通道交叉存取 BGRBGRBGR,

·           |                       // 1 - 彩色通道分隔存取 BBBGGGRRR

·           |                       // 函数cvCreateImage只能创建交叉存取的图像

·           |-- int  origin;        // 0 - 起点为左上角,

·           |                       // 1 - 起点为右下角(Windows位图bitmap格式)

·           |-- int  widthStep;     // 每行图像数据所占字节大小

·           |-- int  imageSize;     // 图像数据所占字节大小 = 高度*每行图像数据字节大小

·           |-- struct _IplROI *roi;// 图像ROI. 若不为NULL则表示需要处理的图像

·           |                       // 区域.

·           |-- char *imageDataOrigin; // 指针指向图像数据原点

·           |                          // (用来校准图像存储单元的重新分配)

·           |

·           |-- int  align;         // 图像行校准: 4或8字节校准

·           |                       // OpenCV不采用它而使用widthStep

  |-- char colorModel[4]; // 图像色彩模型 - 被OpenCV忽略

矩阵与向量

矩阵:

·         CvMat                      // 2维数组

·           |-- int   type;          // 元素类型(uchar,short,int,float,double)

·           |-- int   step;          // 一行所占字节长度

·           |-- int   rows, cols;    // 尺寸大小

·           |-- int   height, width; // 备用尺寸参照

·           |-- union data;

·              |-- uchar*  ptr;     // 针对unsigned char矩阵的数据指针

·               |-- short*  s;       // 针对short矩阵的数据指针

·               |-- int*    i;       // 针对integer矩阵的数据指针

·               |-- float*  fl;      // 针对float矩阵的数据指针

·               |-- double* db;      // 针对double矩阵的数据指针

·

·         CvMatND                    // N-维数组

·           |-- int   type;          // 元素类型(uchar,short,int,float,double)

·           |-- int   dims;          // 数组维数

·           |-- union data;

·           |   |-- uchar*  ptr;     // 针对unsigned char矩阵的数据指针

·           |   |-- short*  s;       // 针对short矩阵的数据指针

·           |   |-- int*    i;       // 针对integer矩阵的数据指针

·           |   |-- float*  fl;      // 针对float矩阵的数据指针

·           |   |-- double* db;      // 针对double矩阵的数据指针

·           |

·           |-- struct dim[];        // 每个维的信息

·               |-- size;            // 该维内元素个数

·               |-- step;            // 该维内元素之间偏移量

·

CvSparseMat // 稀疏N维数组

通用数组:

·         CvArr*     // 仅作为函数参数，说明函数接受多种类型的数组，例如：

·                    //    IplImage*, CvMat* 或者 CvSeq*.

           // 只需通过分析数组头部的前4字节便可确定数组类型

标量:

·         CvScalar

  |-- double val[4]; //4D向量

初始化函数:

CvScalar s = cvScalar(double val0, double val1=0, double val2=0, double val3=0);

举例:

CvScalar s = cvScalar(20.0);

s.val[0]=10.0;

注意：初始化函数与数据结构同名，只是首字母小写. 它不是C++的构造函数.

其他数据结构

点:

·         CvPoint      p = cvPoint(int x, int y);

·         CvPoint2D32f p = cvPoint2D32f(float x, float y);

·         CvPoint3D32f p = cvPoint3D32f(float x, float y, float z);

·         例如:

·         p.x=5.0;

p.y=5.0;

长方形尺寸:

·         CvSize       r = cvSize(int width, int height);

CvSize2D32f  r = cvSize2D32f(float width, float height);

带偏移量的长方形尺寸:

CvRect       r = cvRect(int x, int y, int width, int height);

图像处理

分配与释放图像空间

分配图像空间:

·         IplImage* cvCreateImage(CvSize size, int depth, int channels);

·

·           size:  cvSize(width,height);

·

·           depth: IPL_DEPTH_8U, IPL_DEPTH_8S, IPL_DEPTH_16U,

·                  IPL_DEPTH_16S, IPL_DEPTH_32S, IPL_DEPTH_32F, IPL_DEPTH_64F

·

·           channels: 1, 2, 3 or 4.

    注意数据为交叉存取.彩色图像的数据编排为b0 g0 r0 b1 g1 r1 ...

举例:

// 分配一个单通道字节图像

IplImage* img1=cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,1);

// 分配一个三通道浮点图像

IplImage* img2=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);

释放图像空间:

·         IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,1);

cvReleaseImage(&img);

复制图像:

·         IplImage* img1=cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,1);

·         IplImage* img2;

img2=cvCloneImage(img1);

设定/获取兴趣区域:

·         void  cvSetImageROI(IplImage* image, CvRect rect);

·         void  cvResetImageROI(IplImage* image);

·         vRect cvGetImageROI(const IplImage* image);

·

大部分OpenCV函数都支持ROI.

设定/获取兴趣通道:

·         void cvSetImageCOI(IplImage* image, int coi); // 0=all

·         int cvGetImageCOI(const IplImage* image);

·

大部分OpenCV函数暂不支持COI.

读取存储图像

从文件中载入图像:

·           IplImage* img=0;

·           img=cvLoadImage(fileName);

·           if(!img) printf("Could not load image file: %s\n",fileName);

·

·           Supported image formats: BMP, DIB, JPEG, JPG, JPE, PNG, PBM, PGM, PPM,

                           SR, RAS, TIFF, TIF

载入图像默认转为3通道彩色图像. 如果不是，则需加flag:

  img=cvLoadImage(fileName,flag);

  flag: >0 载入图像转为三通道彩色图像

        =0 载入图像转为单通道灰度图像

        <0 不转换载入图像(通道数与图像文件相同).

图像存储为图像文件:

  if(!cvSaveImage(outFileName,img)) printf("Could not save: %s\n",outFileName);

输入文件格式由文件扩展名决定.

存取图像元素

假设需要读取在i行j列像点的第k通道. 其中, 行数i的范围为[0, height-1], 列数j的范围为[0, width-1], 通道k的范围为[0, nchannels-1].
间接存取: (比较通用, 但效率低, 可读取任一类型图像数据)

对单通道字节图像:

o    IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,1);

o    CvScalar s;

o    s=cvGet2D(img,i,j); // get the (i,j) pixel value

o    printf("intensity=%f\n",s.val[0]);

o    s.val[0]=111;

cvSet2D(img,i,j,s); // set the (i,j) pixel value

对多通道浮点或字节图像:

o    IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);

o    CvScalar s;

o    s=cvGet2D(img,i,j); // get the (i,j) pixel value

o    printf("B=%f, G=%f, R=%f\n",s.val[0],s.val[1],s.val[2]);

o    s.val[0]=111;

o    s.val[1]=111;

o    s.val[2]=111;

cvSet2D(img,i,j,s); // set the (i,j) pixel value

直接存取: (效率高, 但容易出错)

对单通道字节图像:

o    IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,1);

((uchar *)(img->imageData + i*img->widthStep))[j]=111;

对多通道字节图像:

o    IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,3);

o    ((uchar *)(img->imageData + i*img->widthStep))[j*img->nChannels + 0]=111; // B

o    ((uchar *)(img->imageData + i*img->widthStep))[j*img->nChannels + 1]=112; // G

((uchar *)(img->imageData + i*img->widthStep))[j*img->nChannels + 2]=113; // R

对多通道浮点图像:

o    IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);

o    ((float *)(img->imageData + i*img->widthStep))[j*img->nChannels + 0]=111; // B

o    ((float *)(img->imageData + i*img->widthStep))[j*img->nChannels + 1]=112; // G

((float *)(img->imageData + i*img->widthStep))[j*img->nChannels + 2]=113; // R

用指针直接存取 : (在某些情况下简单高效)

对单通道字节图像:

o    IplImage* img  = cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,1);

o    int height     = img->height;

o    int width      = img->width;

o    int step       = img->widthStep/sizeof(uchar);

o    uchar* data    = (uchar *)img->imageData;

data[i*step+j] = 111;

对多通道字节图像:

o    IplImage* img  = cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,3);

o    int height     = img->height;

o    int width      = img->width;

o    int step       = img->widthStep/sizeof(uchar);

o    int channels   = img->nChannels;

o    uchar* data    = (uchar *)img->imageData;

data[i*step+j*channels+k] = 111;

对单通道浮点图像(假设用4字节调整):

o    IplImage* img  = cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);

o    int height     = img->height;

o    int width      = img->width;

o    int step       = img->widthStep/sizeof(float);

o    int channels   = img->nChannels;

o    float * data    = (float *)img->imageData;

data[i*step+j*channels+k] = 111;

使用 c++ wrapper 进行直接存取: (简单高效)

对单/多通道字节图像，多通道浮点图像定义一个 c++ wrapper:

o    template<class T> class Image

o    {

o      private:

o      IplImage* imgp;

o      public:

o      Image(IplImage* img=0) {imgp=img;}

o      ~Image(){imgp=0;}

o      void operator=(IplImage* img) {imgp=img;}

o      inline T* operator[](const int rowIndx) {

o        return ((T *)(imgp->imageData + rowIndx*imgp->widthStep));}

o    };

o    typedef struct{

o      unsigned char b,g,r;

o    } RgbPixel;

o    typedef struct{

o      float b,g,r;

o    } RgbPixelFloat;

o    typedef Image<RgbPixel>       RgbImage;

o    typedef Image<RgbPixelFloat>  RgbImageFloat;

o    typedef Image<unsigned char>  BwImage;

typedef Image<float>          BwImageFloat;

单通道字节图像:

o    IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,1);

o    BwImage imgA(img);

imgA[i][j] = 111;

多通道字节图像:

o    IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,3);

o    RgbImage  imgA(img);

o    imgA[i][j].b = 111;

o    imgA[i][j].g = 111;

imgA[i][j].r = 111;

多通道浮点图像:

o    IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3);

o    RgbImageFloat imgA(img);

o    imgA[i][j].b = 111;

o    imgA[i][j].g = 111;

imgA[i][j].r = 111;

图像转换

转为灰度或彩色字节图像:

·         cvConvertImage(src, dst, flags=0);

·

·           src = float/byte grayscale/color image

·           dst = byte grayscale/color image

·           flags = CV_CVTIMG_FLIP     (flip vertically)

          CV_CVTIMG_SWAP_RB  (swap the R and B channels)

转换彩色图像为灰度图像:
使用OpenCV转换函数:

cvCvtColor(cimg,gimg,CV_BGR2GRAY); // cimg -> gimg

直接转换:

for(i=0;i<cimg->height;i++) for(j=0;j<cimg->width;j++)

  gimgA[i][j]= (uchar)(cimgA[i][j].b*0.114 +

                       cimgA[i][j].g*0.587 +

                       cimgA[i][j].r*0.299);

颜色空间转换:

·         cvCvtColor(src,dst,code); // src -> dst

·

·           code    = CV_<X>2<Y>

·           <X>/<Y> = RGB, BGR, GRAY, HSV, YCrCb, XYZ, Lab, Luv, HLS

·

e.g.: CV_BGR2GRAY, CV_BGR2HSV, CV_BGR2Lab

绘图命令

画长方体:

·         // 用宽度为1的红线在(100,100)与(200,200)之间画一长方体

cvRectangle(img, cvPoint(100,100), cvPoint(200,200), cvScalar(255,0,0), 1);

画圆:

·         // 在(100,100)处画一半径为20的圆,使用宽度为1的绿线

cvCircle(img, cvPoint(100,100), 20, cvScalar(0,255,0), 1);

画线段:

·         // 在(100,100)与(200,200)之间画绿色线段，宽度为1

cvLine(img, cvPoint(100,100), cvPoint(200,200), cvScalar(0,255,0), 1);

画一组线段:

·         CvPoint  curve1[]={10,10,  10,100,  100,100,  100,10};

·         CvPoint  curve2[]={30,30,  30,130,  130,130,  130,30,  150,10};

·         CvPoint* curveArr[2]={curve1, curve2};

·         int      nCurvePts[2]={4,5};

·         int      nCurves=2;

·         int      isCurveClosed=1;

·         int      lineWidth=1;

·

cvPolyLine(img,curveArr,nCurvePts,nCurves,isCurveClosed,cvScalar(0,255,255),lineWidth);

画内填充色的多边形:

cvFillPoly(img,curveArr,nCurvePts,nCurves,cvScalar(0,255,255));

添加文本:

·         CvFont font;

·         double hScale=1.0;

·         double vScale=1.0;

·         int    lineWidth=1;

·         cvInitFont(&font,CV_FONT_HERSHEY_SIMPLEX|CV_FONT_ITALIC, hScale,vScale,0,lineWidth);

·

cvPutText (img,"My comment",cvPoint(200,400), &font, cvScalar(255,255,0));

Other possible fonts:

CV_FONT_HERSHEY_SIMPLEX, CV_FONT_HERSHEY_PLAIN,

CV_FONT_HERSHEY_DUPLEX, CV_FONT_HERSHEY_COMPLEX,

CV_FONT_HERSHEY_TRIPLEX, CV_FONT_HERSHEY_COMPLEX_SMALL,

CV_FONT_HERSHEY_SCRIPT_SIMPLEX, CV_FONT_HERSHEY_SCRIPT_COMPLEX,

矩阵操作

分配释放矩阵空间

综述:

OpenCV有针对矩阵操作的C语言函数. 许多其他方法提供了更加方便的C++接口，其效率与OpenCV一样.
OpenCV将向量作为1维矩阵处理.
矩阵按行存储，每行有4字节的校整.

分配矩阵空间:

·         CvMat* cvCreateMat(int rows, int cols, int type);

·

·           type: 矩阵元素类型. 格式为CV_<bit_depth>(S|U|F)C<number_of_channels>.

·           例如: CV_8UC1 表示8位无符号单通道矩阵, CV_32SC2表示32位有符号双通道矩阵.

·

·           例程:

  CvMat* M = cvCreateMat(4,4,CV_32FC1);

释放矩阵空间:

·         CvMat* M = cvCreateMat(4,4,CV_32FC1);

cvReleaseMat(&M);

复制矩阵:

·         CvMat* M1 = cvCreateMat(4,4,CV_32FC1);

·         CvMat* M2;

M2=cvCloneMat(M1);

初始化矩阵:

·         double a[] = { 1,  2,  3,  4,

·                        5,  6,  7,  8,

·                        9, 10, 11, 12 };

·

CvMat Ma=cvMat(3, 4, CV_64FC1, a);

另一种方法:

CvMat Ma;

cvInitMatHeader(&Ma, 3, 4, CV_64FC1, a);

初始化矩阵为单位阵:

·         CvMat* M = cvCreateMat(4,4,CV_32FC1);

cvSetIdentity(M); // 这里似乎有问题，不成功

存取矩阵元素

假设需要存取一个2维浮点矩阵的第(i,j)个元素.
间接存取矩阵元素:

·         cvmSet(M,i,j,2.0); // Set M(i,j)

t = cvmGet(M,i,j); // Get M(i,j)

直接存取，假设使用4-字节校正:

·         CvMat* M    = cvCreateMat(4,4,CV_32FC1);

·         int n       = M->cols;

·         float *data = M->data.fl;

·

data[i*n+j] = 3.0;

直接存取，校正字节任意:

·         CvMat* M    = cvCreateMat(4,4,CV_32FC1);

·         int   step  = M->step/sizeof(float);

·         float *data = M->data.fl;

·

(data+i*step)[j] = 3.0;

直接存取一个初始化的矩阵元素:

·         double a[16];

·         CvMat Ma = cvMat(3, 4, CV_64FC1, a);

a[i*4+j] = 2.0; // Ma(i,j)=2.0;

矩阵/向量操作

矩阵-矩阵操作:

·         CvMat *Ma, *Mb, *Mc;

·         cvAdd(Ma, Mb, Mc);      // Ma+Mb   -> Mc

·         cvSub(Ma, Mb, Mc);      // Ma-Mb   -> Mc

cvMatMul(Ma, Mb, Mc);   // Ma*Mb   -> Mc

按元素的矩阵操作:

·         CvMat *Ma, *Mb, *Mc;

·         cvMul(Ma, Mb, Mc);      // Ma.*Mb  -> Mc

·         cvDiv(Ma, Mb, Mc);      // Ma./Mb  -> Mc

cvAddS(Ma, cvScalar(-10.0), Mc); // Ma.-10 -> Mc

向量乘积:

·         double va[] = {1, 2, 3};

·         double vb[] = {0, 0, 1};

·         double vc[3];

·

·         CvMat Va=cvMat(3, 1, CV_64FC1, va);

·         CvMat Vb=cvMat(3, 1, CV_64FC1, vb);

·         CvMat Vc=cvMat(3, 1, CV_64FC1, vc);

·

·         double res=cvDotProduct(&Va,&Vb); // 点乘:   Va . Vb -> res

·         cvCrossProduct(&Va, &Vb, &Vc);    // 向量积: Va x Vb -> Vc

end{verbatim}

注意 Va, Vb, Vc 在向量积中向量元素个数须相同.

单矩阵操作:

·         CvMat *Ma, *Mb;

·         cvTranspose(Ma, Mb);      // transpose(Ma) -> Mb (不能对自身进行转置)

·         CvScalar t = cvTrace(Ma); // trace(Ma) -> t.val[0]

·         double d = cvDet(Ma);     // det(Ma) -> d

cvInvert(Ma, Mb);         // inv(Ma) -> Mb

非齐次线性系统求解:

·         CvMat* A  = cvCreateMat(3,3,CV_32FC1);

·         CvMat* x  = cvCreateMat(3,1,CV_32FC1);

·         CvMat* b  = cvCreateMat(3,1,CV_32FC1);

cvSolve(&A, &b, &x);    // solve (Ax=b) for x

特征值分析(针对对称矩阵):

·         CvMat* A  = cvCreateMat(3,3,CV_32FC1);

·         CvMat* E  = cvCreateMat(3,3,CV_32FC1);

·         CvMat* l  = cvCreateMat(3,1,CV_32FC1);

·         cvEigenVV(&A, &E, &l);  // l = A的特征值 (降序排列)

                        // E = 对应的特征向量 (每行)

奇异值分解SVD:

·         CvMat* A  = cvCreateMat(3,3,CV_32FC1);

·         CvMat* U  = cvCreateMat(3,3,CV_32FC1);

·         CvMat* D  = cvCreateMat(3,3,CV_32FC1);

·         CvMat* V  = cvCreateMat(3,3,CV_32FC1);

cvSVD(A, D, U, V, CV_SVD_U_T|CV_SVD_V_T); // A = U D V^T

标号使得 U 和 V 返回时被转置(若没有转置标号，则有问题不成功!!!).

视频序列操作

从视频序列中抓取一帧

OpenCV支持从摄像头或视频文件(AVI)中抓取图像.
从摄像头获取初始化:

CvCapture* capture = cvCaptureFromCAM(0); // capture from video device #0

从视频文件获取初始化:

CvCapture* capture = cvCaptureFromAVI("infile.avi");

抓取帧:

·         IplImage* img = 0;

·         if(!cvGrabFrame(capture)){              // 抓取一帧

·           printf("Could not grab a frame\n\7");

·           exit(0);

·         }

img=cvRetrieveFrame(capture);           // 恢复获取的帧图像

要从多个摄像头同时获取图像, 首先从每个摄像头抓取一帧. 在抓取动作都结束后再恢复帧图像.

释放抓取源:

cvReleaseCapture(&capture);

注意由设备抓取的图像是由capture函数自动分配和释放的. 不要试图自己释放它.

获取/设定帧信息

获取设备特性:

·         cvQueryFrame(capture); // this call is necessary to get correct

·                                // capture properties

·         int frameH    = (int) cvGetCaptureProperty(capture, CV_CAP_PROP_FRAME_HEIGHT);

·         int frameW    = (int) cvGetCaptureProperty(capture, CV_CAP_PROP_FRAME_WIDTH);

·         int fps       = (int) cvGetCaptureProperty(capture, CV_CAP_PROP_FPS);

int numFrames = (int) cvGetCaptureProperty(capture,  CV_CAP_PROP_FRAME_COUNT);

所有帧数似乎只与视频文件有关. 用摄像头时不对，奇怪!!!.

获取帧信息:

·         float posMsec   =       cvGetCaptureProperty(capture, CV_CAP_PROP_POS_MSEC);

·         int posFrames   = (int) cvGetCaptureProperty(capture, CV_CAP_PROP_POS_FRAMES);

float posRatio  =       cvGetCaptureProperty(capture, CV_CAP_PROP_POS_AVI_RATIO);

获取所抓取帧在视频序列中的位置, 从首帧开始按[毫秒]算. 或者从首帧开始从0标号, 获取所抓取帧的标号. 或者取相对位置，首帧为0，末帧为1, 只对视频文件有效.

设定所抓取的第一帧标号:

·         // 从视频文件相对位置0.9处开始抓取

cvSetCaptureProperty(capture, CV_CAP_PROP_POS_AVI_RATIO, (double)0.9);

只对从视频文件抓取有效. 不过似乎也不成功!!!

存储视频文件

初始化视频存储器:

·         CvVideoWriter *writer = 0;

·         int isColor = 1;

·         int fps     = 25;  // or 30

·         int frameW  = 640; // 744 for firewire cameras

·         int frameH  = 480; // 480 for firewire cameras

·         writer=cvCreateVideoWriter("out.avi",CV_FOURCC('P','I','M','1'),

                           fps,cvSize(frameW,frameH),isColor);

其他有效编码:

CV_FOURCC('P','I','M','1')    = MPEG-1 codec

CV_FOURCC('M','J','P','G')    = motion-jpeg codec (does not work well)

CV_FOURCC('M', 'P', '4', '2') = MPEG-4.2 codec

CV_FOURCC('D', 'I', 'V', '3') = MPEG-4.3 codec

CV_FOURCC('D', 'I', 'V', 'X') = MPEG-4 codec

CV_FOURCC('U', '2', '6', '3') = H263 codec

CV_FOURCC('I', '2', '6', '3') = H263I codec

CV_FOURCC('F', 'L', 'V', '1') = FLV1 codec

若把视频编码设为-1则将打开一个编码选择窗口(windows系统下).

存储视频文件:

·         IplImage* img = 0;

·         int nFrames = 50;

·         for(i=0;i<nFrames;i++){

·           cvGrabFrame(capture);          // 抓取帧

·           img=cvRetrieveFrame(capture);  // 恢复图像

·           cvWriteFrame(writer,img);      // 将帧添加入视频文件

若想在抓取中查看抓取图像, 可在循环中加入下列代码:

cvShowImage("mainWin", img);

key=cvWaitKey(20);           // wait 20 ms

若没有20[毫秒]延迟，将无法正确显示视频序列.

释放视频存储器:

cvReleaseVideoWriter(&writer);

posted @ 2011-11-21 09:28 飞逝之痕 Views(8798) Comments(2) 收藏举报

刷新页面返回顶部

飞逝之痕

捕捉那白驹过隙的人生