【查虫日志】快速判断一副灰度图像中是否只有黑色和白色值（即是否为二值图像）过程中bool变量的是是非非。

　　二值图像我们在图像处理过程中是经常遇到的，有的时候我们在进行一个算法处理前，需要判断下一副图像的数据是否符合二值图的需求，这个时候我们可以写个简单的函数来做个判断，比如我写了一个很简单的的代码如下：

bool IM_IsBinaryImage_C(unsigned char *Src, int Width, int Height, int Stride)
{
    int Channel = Stride / Width;
    if (Src == NULL)                            return false;
    if ((Width <= 0) || (Height <= 0))            return false;
    if (Channel != 1)                            return false;
    for (int Y = 0; Y < Height; Y++)                                        
    {
        unsigned char *LinePS = Src + Y * Stride;
        for (int X = 0; X < Width * Channel; X++)
        {
            if ((LinePS[X] != 255) && (LinePS[X] != 0))    return false;
            //if (((LinePS[X] == 255) || (LinePS[X] == 0)) == false) return false;
        }
    }
    return true;
}

　　即如果存在一个像素如果不为255，也不为0，则这副图就不是二值图，立即可以返回了，而无需进行后续的判断了。　　

　　当一副图不是二值图时，通常，我们很快就能返回结果了，那么最坏的情况就是他恰好是二值图，这样，我们就要遍历完所有的像素。我们测试过对于16MB的二值图（4000*4000），测试需要15ms的时间，为了能尽量减少耗时，可以使用如下的SIMD指令来优化这个判断：

bool IM_IsBinaryImage_SSE_Bug(unsigned char *Src, int Width, int Height, int Stride)
{
    int Channel = Stride / Width;
    if (Src == NULL)                            return false;
    if ((Width <= 0) || (Height <= 0))            return false;
    if (Channel != 1)                            return false;
    int BlockSize = 16, Block = (Width * Channel)/ BlockSize;

    for (int Y = 0; Y < Height; Y++)                                        //    速度提升约16倍
    {
        unsigned char *LinePS = Src + Y * Stride;
        for (int X = 0; X < Block * BlockSize; X += BlockSize)
        {
            __m128i SrcV = _mm_loadu_si128((__m128i *)(LinePS + X));
            __m128i MaskW = _mm_cmpeq_epi8(SrcV, _mm_set1_epi8(255));        
            __m128i MaskB = _mm_cmpeq_epi8(SrcV, _mm_setzero_si128());
            __m128i Mask = _mm_or_si128(MaskW, MaskB);
            if (_mm_movemask_epi8(Mask) != 65535)    return false;            //    if (((LinePS[X] == 255) || (LinePS[X] == 0)) == false) return false;
        }
        for (int X = Block * BlockSize; X < Width * Channel; X++)
        {
            if ((LinePS[X] != 255) && (LinePS[X] != 0))    return false;
        }
    }
    return true;
}

　　由于SIMD指令里没有_mm_cmpneq_epi8函数，我们该用代码1片段里被注释掉的那种逻辑来判断一个像素是否是黑色和白色，这里当然也有一些技巧，比如_mm_movemask_epi8指令的运用。我们判断这个像素是否等于255和0，当然，一个像素不可能同时满足这两个条件，不满足的Mask返回0，满足则Mask返回255，所以如果他是黑色和白色，你们这两个Mask进行或操作肯定就为255，否则或操作后就为0，SIMD中这样的比较可以一次性进行16个像素，如果这16个像素都符合条件，那么或操作后的mask都为255，这样通过使用_mm_movemask_epi8来判断这个mask就完成了16个像素的判断。

　　很显然，这个过程的效率要高很多，测试16MB的真二值图，也就1ms就完成了判断。

　　好，我用上面的那个代码写成DLL，供C#调用，相关的函数声明如下：

[DllImport("IsBinaryImage.dll", CallingConvention = CallingConvention.StdCall, CharSet = CharSet.Unicode, ExactSpelling = true)]
 private static extern bool IM_IsBinaryImage_C(byte* Src, int Width, int Height, int Stride);
[DllImport("IsBinaryImage.dll", CallingConvention = CallingConvention.StdCall, CharSet = CharSet.Unicode, ExactSpelling = true)]
private static extern bool IM_IsBinaryImage_SSE_Bug(byte* Src, int Width, int Height, int Stride);

　　可出来的结果令我非常诧异，我测试了下面这2幅图：

　　　　　　　　　　　　测试图1　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　测视图2 （页面压缩了）

　　这两幅图都不是二值图，他们在某些边缘位置都有抗锯齿操作。但是那个IM_IsBinaryImage_C检测图1不是二值图像，检测图2 是二值图像，而IM_IsBinaryImage_SSE_Bug则检测图1是二值图像，图2不是二值图像。开始我以为是我的SSE代码写错了，我就又换了一种写法，如下所示：

bool IM_IsBinaryImage_SSE(unsigned char *Src, int Width, int Height, int Stride)
{
    int Channel = Stride / Width;
    if (Src == NULL)                            return false;
    if ((Width <= 0) || (Height <= 0))            return false;
    if (Channel != 1)                            return false;
    int BlockSize = 16, Block = (Width * Channel) / BlockSize;
    bool Flag = true;
    for (int Y = 0; Y < Height; Y++)                                        //    速度提升约16倍
    {
        unsigned char *LinePS = Src + Y * Stride;
        if (Flag == false)    break;
        for (int X = 0; X < Block * BlockSize; X += BlockSize)
        {
            __m128i SrcV = _mm_loadu_si128((__m128i *)(LinePS + X));
            __m128i MaskW = _mm_cmpeq_epi8(SrcV, _mm_set1_epi8(255));        //    _mm_cmpeq_epi8是自带的，如果使用_mm_cmpneq_epu8则慢了一些。
            __m128i MaskB = _mm_cmpeq_epi8(SrcV, _mm_setzero_si128());
            __m128i Mask = _mm_or_si128(MaskW, MaskB);
            if (_mm_movemask_epi8(Mask) != 65535)
            {
                Flag = false;                            //    if ((LinePS[X] == 255) || (LinePS[X] == 0)) = false, return  false
                break;
            }
        }
        for (int X = Block * BlockSize; X < Width * Channel; X++)
        {
            if ((LinePS[X] != 255) && (LinePS[X] != 0))
            {
                Flag = false;
                break;
            }
        }
    }
    return Flag;
}

　　这个时候测绘对所有的图像结果都正确了。

　　但是，我觉得代码片段2应该是不会有任何错误的啊。为什么会出现这种现象呢。

　　后面从网上查了下，C++的bool变量就只有true和false，是字节变量，这个可以用printf("%d", sizeof(false));来验证，会打印1。而在其他语言中，似乎是int类型。但是我在C#中用 MessageBox.Show(sizeof(bool).ToString()); 似乎也是弹出1。

　　但是，当我们把这些函数的返回值都改为int后，在C#中调用就正常了，比如:

int IM_IsBinaryImage_C(unsigned char *Src, int Width, int Height, int Stride)

　　也就是说上述的IM_IsBinaryImage_SSE_Bug函数体并无Bug。这到底是怎么回事，还请万能的网络高手有空予以解疑。

　　附上测试工程和代码：https://files.cnblogs.com/files/Imageshop/ISBinaryImage.rar

posted @ 2019-06-30 16:23 Imageshop 阅读(3546) 评论(5) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

【查虫日志】快速判断一副灰度图像中是否只有黑色和白色值（即是否为二值图像）过程中bool变量的是是非非。

公告