颜色空间系列1: RGB和CIEXYZ颜色空间的转换及相关优化

颜色空间系列代码下载链接：https://files.cnblogs.com/Imageshop/ImageInfo.rar （同文章同步更新）

在颜色感知的研究中，CIE 1931 XYZ 色彩空间（也叫做 CIE 1931 色彩空间）是其中一个最先采用数学方式来定义的色彩空间，它由国际照明委员会（CIE）于1931年创立。CIE XYZ 色彩空间是从 1920 年代后期 W. David Wright (Wright 1928) 和 John Guild (Guild 1931) 做的一系列实验中得出的。他们的实验结果合并到了 CIE RGB 色彩空间的规定中，CIE XYZ 色彩空间再从它得出。

更过具体的关于XYZ空间的理论解释可见：点击打开链接

本文的重点是如何优化这个RGB<->XYZ相互转换的过程。

从相关的文献包括OpenCv的文档中可找到两者的理论转换算式如下：

[X] [0.412453 0.357580 0.180423] [R]

[Y] = [0.212671 0.715160 0.072169] [G] (1)

[Z] [0.019334 0.119193 0.950227] [B]

[R] [3.240479 -1.537150 -0.498535] [X]

[G] = [-0.969256 1.875992 0.041556] [Y] (2)

[B] [0.055648 -0.204043 1.057311] [Z]

仔细观察式（1），其中 X = 0.412453 * R + 0.412453 *G+ 0.412453B ; 各系数相加之和为0.950456，非常接近于1，我们知道R/G/B的取值范围为[ 0,255 ]，如果系数和等于1，则X的取值范围也必然在[ 0,255 ]之间，因此我们可以考虑等比修改各系数，使其之和等于1，这样就做到了XYZ和RGB在同等范围的映射，因此第一行的系数应分别修改为 [0.412453 0.357580 0.180423] / [0.950456] = [0.433953 0.376219 0.189828]。

式（1）的第二行，三个系数之和恰为1，因此无需修正。

式（1）的第三行，三个系数之和为1.088754，修正算式为 [0.019334 0.119193 0.950227] / [1.088754] = [0.017758 0.109477 0.872765]

由于式（1）的变化，式（2）必须做相应的调整，考虑式（1）关于X的各分量都除以了 0.950456，因此，只需在式2的对应分量上乘以 0.950456即可，同理，关于Z的各分量由于都除以了1.088754，式（2）各分量必须对应乘以1.088754。得到最终的变换式(3)(4)。

[X] [0.433953 0.376219 0.189828] [R]

[Y] = [0.212671 0.715160 0.072169] [G] （3）

[Z] [0.017758 0.109477 0.872765] [B]

[R] [3.0799327 -1.537150 -0.542782] [X]

[G] = [-0.921235 1.875992 0.0452442] [Y] （4）

[B] [0.0528909 -0.204043 1.1511515] [Z]

如果有朋友查阅过OpenCv的RGB到LAB空间的转换，就可以发现Cv就是用的上述矩阵先将RGB转到XYZ，再由XYZ转为LAB的。

由以上数式可以看出RGB和XYZ颜色空间的转换时线性的，因此，两个系数矩阵之间的成绩必为一个E矩阵（对角线为1，其他元素都为0），读者可以用matlab测试下。

由于各小数的存在，理论上说，RGB颜色空间的颜色对应的XYZ分量的数值一般都为浮点数，之前说过经过调整系数矩阵后其有效范围在[0,255]之间，这和RGB的范围是一致的，因此我们更感兴趣的可能是用整数表示XYZ的值，此时，如果先用上述计算式计算，最后在用（int) 强制取整，则效率很低下，因此，很有必要做点的优化。

优化的原理基本就是用整数的乘除法来替代浮点运算，比如，对各系数乘以一个很大的数，计算出结果在整除这个数，则得到的数字和之前的浮点算式取整结果是一致的。

如何取放大系数，也有着一定的讲究，比如0.433953 ，很多朋友的第一反应应该是乘以1000000得到433953 ，不错，这是个很好的优化，却不是最好的，因为最后的整除1000000相对来说也是个慢的过程，如果我们能够整除一个2的N次幂数，则可以用整数的移位来代替整除。众所周知，移位的速度非常快。

那这个N如何取呢，比方说取1可行吗，分析下马上得到的结果是绝对不行，因为很多系数乘以2再取整就变为0了。我对这个N的取值建议是在保证整个算式的每个部分的计算结果不超过int（对于64位CPU，则是long类型）类型的最大范围时，N越大越好。像我们这种情况，由于RGB的取值范围是[255]，因此N的取值最大只能是23。

假定我们取N的值为20，则RGB转XYZ的算式可以写为如下：

X = (Blue * 199049 + Green * 394494 + Red * 455033 + 524288) >> 20;          // 这些系数是按照RGBLAB类里的labXr_32f放大2^20后得到的  
Y = (Blue * 75675 + Green * 749900 + Red * 223002 + 524288) >> 20;  
Z = (Blue * 915161 + Green * 114795 + Red * 18621 + 524288) >> 20;            //  这里无需验证结果是否在[0,255]之间，必然在。

注意算式中的524288，这个值等于(2^20)/2，加上他的作用是使整个算式能够做到四舍五入。

另外，还要注意各系数小数点后数字的累积，那X一行来说事，0.433953 * 2^20 = 455032.700928，我们取值455033 ，0.376219 * 2^20= 394494.214144 ，则取值394494 ，那么最后一个系数其实可以不用计算，直接拿 2^20-455033 -394494 =199049 。

对应的XYZ转RGB空间算式为：

Blue = (X * 55460 - Y * 213955 + Z * 1207070) >> 20;  
Green = (X * -965985 + Y * 1967119 + Z * 47442) >> 20;    // x * -965985 和 -x * 965985 在反汇编后是不一样的，后者多了个neg指令  
Red = (X * 3229543 - Y * 1611819 - Z * 569148) >> 20;  
if (Red > 255) Red = 255; else if (Red < 0) Red = 0;      // 这里需要判断，因为RGB空间所有的颜色转换到XYZ后，并不是填充满了0-255的范围的，反转过去就会存在一些溢出的点。
if (Green > 255) Green = 255; else if (Green < 0) Green = 0;  // 编译后比三目运算符的效率高  
if (Blue > 255) Blue = 255; else if (Blue < 0) Blue = 0;

正如代码中的注释一样，XYZ-RGB的转换必须判断转换的颜色是否在有效范围内。

另外对上述算式提一点点优化方面的是事情：

Green = (X * -965985 + Y * 1967119 + Z * 47442) >> 20;       // x * -965985 和 -x * 965985 在反汇编后是不一样的，后者多了个neg指令  
00000048  imul        ebx,edi,0FFF1429Fh   
0000004e  imul        eax,dword ptr [ebp-10h],1E040Fh   
00000055  add         ebx,eax   
00000057  imul        eax,dword ptr [ebp-14h],0B952h   
0000005e  add         ebx,eax   
00000060  sar         ebx,14h

另外一种写法：

Green = (-X * 965985 + Y * 1967119 + Z * 47442) >> 20;       // x * -965985 和 -x * 965985 在反汇编后是不一样的，后者多了个neg指令  
00000048  mov         ebx,edi   
0000004a  neg         ebx   
0000004c  imul        ebx,ebx,0EBD61h   
00000052  imul        eax,dword ptr [ebp-10h],1E040Fh   
00000059  add         ebx,eax   
0000005b  imul        eax,dword ptr [ebp-14h],0B952h   
00000062  add         ebx,eax   
00000064  sar         ebx,14h

可以看到多了一句neg语句，虽然这个语句基本对效率没啥影响，但是作为一个速度控，我对这些还是很感兴趣的。

下面给出一些转换后的视觉图：

原始图像：