opencv MAT数据操作

1.存取单个像素值

最通常的方法就是

 

img.at<uchar>(i,j) = 255;
img.at<Vec3b>(i,j)[0] = 255;

2.用指针扫描一幅图像

 

对于一幅图像的扫描,用at就显得不太好了,还是是用指针的操作方法更加推荐。先介绍一种上一讲提到过的

 

for (int j=0; j<nl; j++)
{
        uchar* data= image.ptr<uchar>(j);
        for (int i=0; i<nc; i++)
       {                 
                  data[i] = 255;
        }
}


更高效的扫描连续图像的做法可能是把W*H的衣服图像看成是一个1*(w*h)的一个一维数组,这个想法是不是有点奇葩,这里要利用isContinuous这个函数判断图像内的像素是否填充满,使用方法如下:

 

 

if (img.isContinuous())
{
        nc = img.rows*img.cols*img.channels();
}
uchar* data = img.ptr<uchar>(0);
for (int i=0; i<nc; i++)
{
        data[i] = 255;
}


更低级的指针操作就是使用Mat里的data指针,之前我称之为暴力青年,使用方法如下:

 

 

uchar* data = img.data;
// img.at(i, j)
data = img.data + i * img.step + j * img.elemSize();


 

 

3.用迭代器iterator扫描图像

 

和C++STL里的迭代器类似,Mat的迭代器与之是兼容的。是MatIterator_。声明方法如下:

 

cv::MatIterator_<Vec3b> it;


或者是:

 

 

cv::Mat_<Vec3b>::iterator it;


扫描图像的方法如下:

 

 

Mat_<Vec3b>::iterator it = img.begin<Vec3b>();
Mat_<Vec3b>::iterator itend = img.end<Vec3b>();
for (; it!=itend; it++)
{
         (*it)[0] = 255;
}


 

4.高效的scan image方案总结

要想减少程序运行的时间,必要的优化包括如下几个方面:

(1)内存分配是个耗时的工作,优化之;

(2)在循环中重复计算已经得到的值,是个费时的工作,优化之;举例:

 

int nc = img.cols * img.channels();
for (int i=0; i<nc; i++)
{.......}
//**************************
for (int i=0; i<img.cols * img.channels(); i++)
{......}


后者的速度比前者要慢上好多。

 

(3)使用迭代器也会是速度变慢,但迭代器的使用可以减少程序错误的发生几率,考虑这个因素,可以酌情优化

 

(4)at操作要比指针的操作慢很多,所以对于不连续数据或者单个点处理,可以考虑at操作,对于连续的大量数据,不要使用它

(5)扫描连续图像的做法可能是把W*H的衣服图像看成是一个1*(w*h)的一个一维数组这种办法也可以提高速度。短的循环比长循环更高效,即使他们的操作数是相同的

 

以上的这些优化可能对于大家的程序运行速度提高并不明显,但它们毕竟是个得到速度提升的好的编程策略,希望大家能多采纳。

 

 

我这里测试了三种操作Mat数据的办法,套用流行词,普通青年,文艺青年,为啥第三种我不叫2b青年,大家慢慢往后看咯。

普通青年的操作的办法通常是M.at<float>(i, j)

文艺青年一般会走路线M.ptr<float>( i )[ j ]

暴力青年通常直接强制使用我第40讲提到的M.data这个指针

实验代码如下:

 t = (double)getTickCount();
 Mat img1(1000, 1000, CV_32F);
 
 for (int i=0; i<1000; i++)
 {
  for (int j=0; j<1000; j++)
  {
   img1.at<float>(i,j) = 3.2f;
  }
 }
 t = (double)getTickCount() - t;
 printf("in %gms\n", t*1000/getTickFrequency());
 //***************************************************************
 t = (double)getTickCount();
 Mat img2(1000, 1000, CV_32F);

 for (int i=0; i<1000; i++)
 {
  for (int j=0; j<1000; j++)
  {
   img2.ptr<float>(i)[j] = 3.2f;
  }
 }
 t = (double)getTickCount() - t;
 printf("in %gms\n", t*1000/getTickFrequency());
 //***************************************************************
 t = (double)getTickCount();
 Mat img3(1000, 1000, CV_32F);
 float* pData = (float*)img3.data;

 for (int i=0; i<1000; i++)
 {
  for (int j=0; j<1000; j++)
  {
   *(pData) = 3.2f;
   pData++;
  }
 }
 t = (double)getTickCount() - t;
 printf("in %gms\n", t*1000/getTickFrequency());
 //***************************************************************
 t = (double)getTickCount();
 Mat img4(1000, 1000, CV_32F);

 for (int i=0; i<1000; i++)
 {
  for (int j=0; j<1000; j++)
  {
   ((float*)img3.data)[i*1000+j] = 3.2f;
  }
 }
 t = (double)getTickCount() - t;
 printf("in %gms\n", t*1000/getTickFrequency());

 最后两招可以都看成是暴力青年的方法,因为反正都是指针的操作,局限了各暴力青年手段就不显得暴力了。

 

在Debug、Release模式下的测试结果分别为:

 

测试结果
  Debug Release
普通青年 139.06ms 2.51ms
文艺青年 66.28ms 2.50ms
暴力青年1 4.95ms 2.28ms
暴力青年2 5.11ms 1.37ms

 

根据测试结果,普通青年的操作在Debug模式下果然缓慢,文艺青年的路线确实有提高。值得注意的是本来后两种办法确实是一种比较2b青年的做法,因为at操作符或者ptr操作符,其实都是有内存检查的,防止操作越界的,而直接使用data这个指针确实很危险。不过从速度上确实让人眼前一亮,所以我不敢称这样的青年为2b,尊称为暴力青年吧。

不过在Release版本下,几种办法的速度差别就不明显啦。所以如果大家最后发行程序的时候,可以不在意这几种操作办法的,推荐前两种哦,都是很好的写法,

推荐两种文艺青年的处理方案,测试了一下,先贴代码,再贴测试结果:

 /*********加强版********/
 t = (double)getTickCount();
 Mat img5(1000, 1000, CV_32F);
 float *pData1;
 for (int i=0; i<1000; i++) 
 { 
  pData1=img5.ptr<float>(i);
  for (int j=0; j<1000; j++) 
  { 
   pData1[j] = 3.2f; 
  } 
 } 
 t = (double)getTickCount() - t;
 printf("in %gms\n", t*1000/getTickFrequency());
 /*******终极版*****/
 t = (double)getTickCount();
 Mat img6(1000, 1000, CV_32F);
 float *pData2;
 Size size=img6.size();
 if(img2.isContinuous())
 {
  size.width = size.width*size.height;
  size.height = 1;
 }
 size.width*=img2.channels();
 for(int i=0; i<size.height; i++)
 {
  pData2 = img6.ptr<float>(i);
  for(int j=0; j<size.width; j++)
  {
   pData2[j] = saturate_cast<float>(3.2f);
  }
 }
 t = (double)getTickCount() - t;
 printf("in %gms\n", t*1000/getTickFrequency());

测试结果:

 

 

  Debug Release
加强版文艺青年 5.74ms 2.43ms
终极版文艺青年 40.12ms 2.34ms

我的测试结果感觉这两种方案只是锦上添花的效果,也使大家的操作有了更多的选择,但感觉在速度上并没有数量级的提升,再次感谢箫铭对我blog的支持。后来箫铭说saturate_cast才把速度降下来,我很同意,就不贴上去测试结果了。但我查看资料了解了一下saturate_cast的作用。可以看成是类型的强制转换,比如对于saturate_cast<uchar>来说,就是把数据转换成8bit的0~255区间,负值变成0,大于255的变成255。如果是浮点型的数据,变成round最近的整数,还是很有用处的函数,推荐大家在需要的时候尝试。

 

 

 

http://blog.csdn.net/yang_xian521/article/details/7161335

posted @ 2016-01-14 14:48  蓝夜  阅读(485)  评论(0编辑  收藏  举报