Mask operations on matrices
此为OpenCV官方教程的个人翻译
矩阵上的掩膜操作
矩阵上的掩码操作非常简单。基本做法是,我们根据掩膜矩阵(也称为内核)重新计算图像中的每个像素值。此内核包含的值将调整相邻像素(和当前像素)对新像素值的影响程度。从数学的角度来看,我们用我们指定的值进行了一个加权平均值计算。
测试用例
让我们考虑一下如何增强图像对比度。基本上,我们会对图像的每个像素应用以下公式:

第一种表示法是使用公式,而第二种表示法是使用掩码的第一种表示法的压缩版本。使用掩码核时,请将掩码矩阵的中心放在要计算的像素上,并将像素值与相应位置的矩阵值相乘。在大型矩阵的情况下,后一种表示法更容易查看。
现在让我们看看如何使用基本的像素访问方法或使用filter2D函数来实现这一点。
基本方法
以下函数可以执行掩膜操作:
void Sharpen(const Mat& myImage, Mat& result) {
CV_Assert(myImage.depth() == CV_8U);
result.create(myImage.size(), myImage.type());
const int nChannels = myImage.channels();
for (int j = 1; j < myImage.rows - 1; ++j) {
const uchar* previous = myImage.ptr<uchar>(j - 1);
const uchar* current = myImage.ptr<uchar>(j);
const uchar* next = myImage.ptr<uchar>(j + 1);
uchar* output = result.ptr<uchar>(j);
for (int i = nChannels; i < nChannels * (myImage.cols - 1); ++i) {
*output++ = saturate_cast<uchar>(
5 * current[i] - current[i - nChannels] -
current[i + nChannels] - previous[i] - next[i]);
}
}
result.row(0).setTo(Scalar(0));
result.row(result.rows - 1).setTo(Scalar(0));
result.col(0).setTo(Scalar(0));
result.col(result.cols - 1).setTo(Scalar(0));
}
首先,我们确保输入图像数据采用uchar格式。为此,我们使用CV_Assert函数,当其中的表达式为 false 时,该函数会引发错误。
CV_Assert(myImage.depth() == CV_8U); // accept only uchar images
我们创建与输入具有相同大小和类型类型的输出图像。正如您在“图像矩阵如何存储在内存中?”部分中看到的那样,根据通道的数量,我们可能具有一个或多个子列。我们将通过指针循环访问它们.
Result.create(myImage.size(), myImage.type());
const int nChannels = myImage.channels();
我们将使用普通的 C [] 运算符来访问像素。由于我们需要同时访问多行,因此我们将获取每个行的指针(上一行、当前行和下一行)。我们需要另一个指针,指向要保存计算结果的位置。然后,只需使用 [] 运算符访问正确的项目即可。为了将输出指针向前移动,我们只需在每次操作后增加此值(使用一个字节):
for(int j = 1; j < myImage.rows - 1; ++j)
{
const uchar* previous = myImage.ptr<uchar>(j - 1);
const uchar* current = myImage.ptr<uchar>(j );
const uchar* next = myImage.ptr<uchar>(j + 1);
uchar* output = Result.ptr<uchar>(j);
for(int i = nChannels; i < nChannels * (myImage.cols - 1); ++i)
{
*output++ = saturate_cast<uchar>(5 * current[i]
-current[i - nChannels] - current[i + nChannels] - previous[i] - next[i]);
}
}
在图像的边界上,上一行不存在像素。因此,在这些点上,我们的公式是未定义的。一个简单的解决方案是不在这些点上应用掩码核,例如,将边界上的像素设置为零:
Result.row(0).setTo(Scalar(0)); // The top row
Result.row(Result.rows - 1).setTo(Scalar(0)); // The bottom row
Result.col(0).setTo(Scalar(0)); // The left column
Result.col(Result.cols - 1).setTo(Scalar(0)); // The right column
filter2D 函数
应用这样的滤镜在图像处理中非常普遍,因此OpenCV提供一个函数来应用掩码(在某些地方也称为内核)。为此,您首先需要定义一个保存掩码核的 Mat 对象:
Mat kern = (Mat_<char>(3,3) << 0, -1, 0,
-1, 5, -1,
0, -1, 0);
然后调用 filter2D 函数,指定要使用的输入、输出图像和内核:
filter2D(I, K, I.depth(), kern);
该函数甚至有第五个可选参数来指定内核的中心,以及第六个用于确定在操作未定义的区域(边界)中要执行的操作的参数。使用此函数的优点是它更短,更不冗长,并且由于实现了一些优化技术,因此它通常比手动编码的方法更快。例如,在我的测试中,第二个只花了13毫秒,第一个花了大约31毫秒。有很大的不同。
例如:


浙公网安备 33010602011771号