代码改变世界

OpenCV成长之路(6):数学形态学基本操作及其应用

2013-12-26 15:23  ☆Ronny丶  阅读(6333)  评论(2编辑  收藏  举报

数学形态学实际上可以理解为一种滤波行为,所以很多地方称它为形态学滤波。有了个这概念,我们就能更好的理解它。我们滤波中用的滤波器(kernel)在这里被称为结构元素,结构元素往往是由一个特殊的形状构成,如:线条、矩形、圆、菱形等。我们把结构元素的中心(Anchor Point)与图像上像素点对齐,然后结构元素覆盖的领域像素就是我们要分析的像素,我们定义一种操作就形成了一种形态学运算。

我们在这里不解释形态学操作的算法原理及它们的意义,有兴趣的可以参见相关数字图像处理方面的教材,或关注本博客,博主打算在OpenCV系列写完后,开始写图像处理方面算法系列的文章。

一、形态学的基本操作

腐蚀运算:erode

void erode(InputArray src, OutputArray dst, InputArray kernel, Point anchor=Point(-1,-1), 
           int iterations=1, int borderType=BORDER_CONSTANT, 
           const Scalar& borderValue=morphologyDefaultBorderValue());

src:输入图像,很多场合下我们使用的是二值图像,当然灰度图像也可以。

dst:输出图像,格式和输入图像一致。

kernel:定义的结构元素。

anchor:结构元素的中心,如果是默认参数(-1,-1),程序会自动将其设置为结构元素的中心。

iterations:迭代次数,我们可以选择对图像进行多次形态学运算。

后面两个参数是边界类型,由于要处理领域问题,所以图像需要扩充边界。一般情况下使用默认即可。

膨胀运算:dilate

膨胀跟腐蚀的参数完全一致,就不过多的说明了。这两个形态学操作是最基本的两个操作。

int main()
{
    Mat image=imread("../cat.png");
    // 彩色转灰度
    cvtColor(image,image,CV_BGR2GRAY);
    // 阈值化
    threshold(image,image,255*(0.5),255,THRESH_BINARY);
    
    // 形态学操作
    // 如果把结构元素设置为Mat(),则将用默认的3*3的矩形结构元素
    Mat eroded;
    erode(image,eroded,Mat());
    Mat dilated;
    dilate(image,dilated,Mat());

    return 0;
}

image

下面要介绍的两个形态学操作,在实际应用中要比上面两个更加广泛,但实际上它们是上面两种操作的一个组合式的操作。

开运算与闭运算

这两个运算都是使用函数morphologyEx来实现的,这个函数的接口如下:

void morphologyEx(InputArray src, OutputArray dst, int op, InputArray kernel, Point anchor=Point(-1,-1), 
     int iterations=1, int borderType=BORDER_CONSTANT, const Scalar& borderValue=morphologyDefaultBorderValue());

函数的大部分参数都与上面介绍的erode函数参数是一样的,这里面的op是我们要进行的形态学的类型:

MORPH_OPEN:对图像进行开运算。

MORPH_CLOSE:对图像进行闭运算。

下面我们还是以小猫图像为例显示一下对二值图像进行开运算和闭运算后得到的结果。

int main()
{
    Mat image=imread("../cat.png");
    // 彩色转灰度
    cvtColor(image,image,CV_BGR2GRAY);
    // 阈值化
    threshold(image,image,255*(0.5),255,THRESH_BINARY);

    // 定义结构元素
    Mat se(5,5,CV_8U,Scalar(1));
    Mat closed;
    morphologyEx(image,closed,MORPH_CLOSE,se);
    Mat opened;
    morphologyEx(image,opened,MORPH_OPEN,se);

    return 0;
}

image

从图片中我们可以得出结论:

闭运算可以填充图像中的孔洞,连接一些缺口;开运算可以去除图像中一些较小的结构。前提是这些孔洞或碎片要与进行运算的结构元素尺度相当。

二、用形态学操作来检测边缘和角点

其实用形态学来检测边缘的原理非常简单,我们打开源码看它是怎么操作的:

case CV_MOP_GRADIENT:
        erode( src, temp, kernel, anchor, iterations, borderType, borderValue );
        dilate( src, dst, kernel, anchor, iterations, borderType, borderValue );
        dst -= temp;
        break;

可以看出来,它是对图像先做了一个腐蚀,再做了一次膨胀,然后将两次的结果相减即可。

int main()
{
    Mat image=imread("../cat.png");
    // 彩色转灰度
    cvtColor(image,image,CV_BGR2GRAY);
    Mat catEdge;
    morphologyEx(image,catEdge,MORPH_GRADIENT,Mat());

    // 阈值化
    threshold(catEdge,catEdge,40,255,THRESH_BINARY);
    namedWindow("catEdge");imshow("catEdge",catEdge);

    waitKey();
    return 0;
}

image

下面我们来实现用形态学操作来检测角点。

首先我们需要定义几个特殊的结构元素,我们这里都用Mat来定义,并像素式的赋值,你可以选择OpenCV里的getStructElement来更快的实现。

// 定义结构元素
    Mat cross(5,5,CV_8U,Scalar(0));
    Mat diamond(5,5,CV_8U,Scalar(1));
    Mat square(5,5,CV_8U,Scalar(1));
    Mat x(5,5,CV_8U,Scalar(0));
    
    for(int i=0;i<5;i++)
    {
        cross.at<uchar>(2,i)=1;
        cross.at<uchar>(i,2)=1;

    }
    diamond.at<uchar>(0,0)=0;
    diamond.at<uchar>(0,1)=0;
    diamond.at<uchar>(1,0)=0;
    diamond.at<uchar>(4,4)=0;
    diamond.at<uchar>(3,4)=0;
    diamond.at<uchar>(4,3)=0;
    diamond.at<uchar>(4,0)=0;
    diamond.at<uchar>(4,1)=0;
    diamond.at<uchar>(3,0)=0;
    diamond.at<uchar>(0,4)=0;
    diamond.at<uchar>(0,3)=0;
    diamond.at<uchar>(1,4)=0;

    for(int i=0;i<5;i++){
        x.at<uchar>(i,i)=1;
        x.at<uchar>(4-i,i)=1;
    }

第一个为一个十字型的结构元素,第二个为菱形,第三个是矩形,第四个是一个“X”

型。

然后我们按下面的顺序对一幅图像进行操作,并对最后的结果进行阈值化。

Mat result;
dilate(image,result,cross);
erode(result,result,diamond);

Mat result2;
dilate(image,result2,x);
erode(result2,result2,square);
absdiff(result2,result,result);

threshold(result,result,40,255,THRESH_BINARY);

经过上面步骤,我们得到了一张二值图像,显示了图像的一些角点的位置。

image

为了更形象的说明,我们将上面的这些点在原彩色图像上标出来:

// 标记角点
void drawOnImage(const Mat& binary,Mat& image)
{
    for(int i=0;i<binary.rows;i++)
    {
        // 获取行指针
        const uchar* data=binary.ptr<uchar>(i);
        for(int j=0;j<binary.cols;j++)
        {
            if(data[j]) //角点图像上的白点
                circle(image,Point(j,i),8,Scalar(0,255,0));// 画圈
        }
    }
}

image

三、用数学形态学进行车牌定位

智能交通中车牌的检测与识别一直是核心问题,而车牌识别发展了20余年,已经存在了很多的解决方案,我们这里采用数学形态学来进行车牌检测。本部分并不是一个完整的车牌定位程序,后面还需要进行连通区域的标记和筛选以及伪车牌去除等,有兴趣的读者可以继续现实或和我交流。

第一步:应用形态学做竖直方向的边缘检测。

文章第二部分中已经介绍了用形态学做边缘检测,我们这里只需要修改结构元素就可以实现只检测竖直方向上的边缘。

image

第二步:定义水平方向的闭运算和竖直方向的闭运算,将竖直的线条连成一块。

image

第三步:遍历连通区域,按照车牌的一些限制条件进行筛选即可。

int main()
{
    Mat cimage=imread("../car.png");
    Mat image;
    cvtColor(cimage,image,CV_BGR2GRAY);
     
    Mat result;
    //检测竖直边缘
    morphologyEx(image,result,MORPH_GRADIENT,Mat(1,2,CV_8U,Scalar(1)));
    //阈值化
    threshold(result,result,255*(0.2),255,THRESH_BINARY);
    //水平方向闭运算
    morphologyEx(result,result,MORPH_CLOSE,Mat(1,20,CV_8U,Scalar(1)));
    //竖起方向闭运算
    morphologyEx(result,result,MORPH_CLOSE,Mat(10,1,CV_8U,Scalar(1)));

    return 0;
}

注:上面的例程只是简单的用来介绍数学形态学的用法,想应用在实际工程中,还需要进行一步改进。