Mask operations on matrices

此为OpenCV官方教程的个人翻译

矩阵上的掩膜操作

矩阵上的掩码操作非常简单。基本做法是，我们根据掩膜矩阵（也称为内核）重新计算图像中的每个像素值。此内核包含的值将调整相邻像素（和当前像素）对新像素值的影响程度。从数学的角度来看，我们用我们指定的值进行了一个加权平均值计算。

测试用例

让我们考虑一下如何增强图像对比度。基本上，我们会对图像的每个像素应用以下公式：

第一种表示法是使用公式，而第二种表示法是使用掩码的第一种表示法的压缩版本。使用掩码核时，请将掩码矩阵的中心放在要计算的像素上，并将像素值与相应位置的矩阵值相乘。在大型矩阵的情况下，后一种表示法更容易查看。

现在让我们看看如何使用基本的像素访问方法或使用filter2D函数来实现这一点。

基本方法

以下函数可以执行掩膜操作:

void Sharpen(const Mat& myImage, Mat& result) {
    CV_Assert(myImage.depth() == CV_8U);

    result.create(myImage.size(), myImage.type());
    const int nChannels = myImage.channels();

    for (int j = 1; j < myImage.rows - 1; ++j) {
        const uchar* previous = myImage.ptr<uchar>(j - 1);
        const uchar* current = myImage.ptr<uchar>(j);
        const uchar* next = myImage.ptr<uchar>(j + 1);

        uchar* output = result.ptr<uchar>(j);
        for (int i = nChannels; i < nChannels * (myImage.cols - 1); ++i) {
            *output++ = saturate_cast<uchar>(
                5 * current[i] - current[i - nChannels] -
                current[i + nChannels] - previous[i] - next[i]);
        }
    }

    result.row(0).setTo(Scalar(0));
    result.row(result.rows - 1).setTo(Scalar(0));
    result.col(0).setTo(Scalar(0));
    result.col(result.cols - 1).setTo(Scalar(0));
}

首先，我们确保输入图像数据采用uchar格式。为此，我们使用CV_Assert函数，当其中的表达式为 false 时，该函数会引发错误。

CV_Assert(myImage.depth() == CV_8U);  // accept only uchar images

我们创建与输入具有相同大小和类型类型的输出图像。正如您在“图像矩阵如何存储在内存中？”部分中看到的那样，根据通道的数量，我们可能具有一个或多个子列。我们将通过指针循环访问它们.

Result.create(myImage.size(), myImage.type());
const int nChannels = myImage.channels();

我们将使用普通的 C [] 运算符来访问像素。由于我们需要同时访问多行，因此我们将获取每个行的指针（上一行、当前行和下一行）。我们需要另一个指针，指向要保存计算结果的位置。然后，只需使用 [] 运算符访问正确的项目即可。为了将输出指针向前移动，我们只需在每次操作后增加此值（使用一个字节）：

for(int j = 1; j < myImage.rows - 1; ++j)
{
    const uchar* previous = myImage.ptr<uchar>(j - 1);
    const uchar* current  = myImage.ptr<uchar>(j    );
    const uchar* next     = myImage.ptr<uchar>(j + 1);

    uchar* output = Result.ptr<uchar>(j);

    for(int i = nChannels; i < nChannels * (myImage.cols - 1); ++i)
    {
        *output++ = saturate_cast<uchar>(5 * current[i]
                     -current[i - nChannels] - current[i + nChannels] - previous[i] - next[i]);
    }
}

在图像的边界上，上一行不存在像素。因此,在这些点上，我们的公式是未定义的。一个简单的解决方案是不在这些点上应用掩码核，例如，将边界上的像素设置为零：

Result.row(0).setTo(Scalar(0));               // The top row
Result.row(Result.rows - 1).setTo(Scalar(0)); // The bottom row
Result.col(0).setTo(Scalar(0));               // The left column
Result.col(Result.cols - 1).setTo(Scalar(0)); // The right column

filter2D 函数

应用这样的滤镜在图像处理中非常普遍，因此OpenCV提供一个函数来应用掩码（在某些地方也称为内核）。为此，您首先需要定义一个保存掩码核的 Mat 对象：

Mat kern = (Mat_<char>(3,3) <<  0, -1,  0,
                               -1,  5, -1,
                                0, -1,  0);

然后调用 filter2D 函数，指定要使用的输入、输出图像和内核：

filter2D(I, K, I.depth(), kern);

该函数甚至有第五个可选参数来指定内核的中心，以及第六个用于确定在操作未定义的区域（边界）中要执行的操作的参数。使用此函数的优点是它更短，更不冗长，并且由于实现了一些优化技术，因此它通常比手动编码的方法更快。例如，在我的测试中，第二个只花了13毫秒，第一个花了大约31毫秒。有很大的不同。

例如：

posted @ 2022-06-26 11:09 帝皇の惊阅读(70) 评论(0) 收藏举报

刷新页面返回顶部

RickSchanze

Mask operations on matrices

矩阵上的掩膜操作

测试用例

基本方法

filter2D 函数

公告