数字图像计算1
《数字图像处理》1-5章核心计算知识点详解(附手把手算例)
第2章 数字图像处理基础:颜色模型与采样
-
RGB与CMYK颜色转换
- 公式:
\( K = \min(1-R, 1-G, 1-B) \)
\( C = \frac{1-R-K}{1-K}, \quad M = \frac{1-G-K}{1-K}, \quad Y = \frac{1-B-K}{1-K} \) - 算例:若RGB=(0.8, 0.2, 0.3),则:
\(K = \min(1-0.8, 1-0.2, 1-0.3) = 0.2\)
\(C = \frac{1-0.8-0.2}{1-0.2} = 0\),\(M = \frac{1-0.2-0.2}{0.8} = 0.75\),\(Y = \frac{1-0.3-0.2}{0.8} = 0.625\) - 类比:RGB是发光色(如电视),CMYK是印刷色(如打印机),转换时相当于“用墨水覆盖白纸”,K代表黑色墨水的用量。
- 公式:
-
YIQ与RGB转换
- 矩阵公式:
\( \begin{bmatrix} Y \\ I \\ Q \end{bmatrix} = \begin{bmatrix} 0.299 & 0.587 & 0.114 \\ 0.596 & -0.275 & -0.321 \\ 0.212 & -0.523 & 0.311 \end{bmatrix} \begin{bmatrix} R \\ G \\ B \end{bmatrix} \) - 算例:RGB=(1, 0, 0)(红色),则:
\(Y = 0.299×1 + 0.587×0 + 0.114×0 = 0.299\)
\(I = 0.596×1 - 0.275×0 - 0.321×0 = 0.596\)
\(Q = 0.212×1 - 0.523×0 + 0.311×0 = 0.212\) - 类比:Y是亮度(黑白电视信号),I和Q是色彩信息,类似把彩色照片拆成亮度和色调两部分。
- 矩阵公式:
-
采样定理:奈奎斯特频率计算
- 公式:最低采样频率 \(\omega_s = 2\omega_m\),其中\(\omega_m\)是信号最高频率。
- 算例:若图像中细节最高频率为100Hz,则采样频率至少为200Hz。
- 类比:用相机拍旋转风扇,快门速度不够会拍模糊,采样定理就是“快门速度至少是风扇转速的2倍才能看清叶片”。
第3章 图像基本运算:几何变换
-
齐次坐标与旋转矩阵
- 旋转矩阵(绕原点逆时针旋转\(\theta\)):
\( T = \begin{bmatrix} \cos\theta & \sin\theta & 0 \\ -\sin\theta & \cos\theta & 0 \\ 0 & 0 & 1 \end{bmatrix} \) - 算例:点(2, 3)绕原点旋转90°,齐次坐标为\(\begin{bmatrix}2 \\ 3 \\ 1\end{bmatrix}\),变换后:
\( \begin{bmatrix} \cos90° & \sin90° & 0 \\ -\sin90° & \cos90° & 0 \\ 0 & 0 & 1 \end{bmatrix} \begin{bmatrix}2 \\ 3 \\ 1\end{bmatrix} = \begin{bmatrix}0 & 1 & 0 \\ -1 & 0 & 0 \\ 0 & 0 & 1\end{bmatrix} \begin{bmatrix}2 \\ 3 \\ 1\end{bmatrix} = \begin{bmatrix}3 \\ -2 \\ 1\end{bmatrix} \)
即新坐标为(3, -2)。 - 类比:旋转矩阵像“转盘”,每个点按角度规则移动,齐次坐标的第三维1是“固定点”。
- 旋转矩阵(绕原点逆时针旋转\(\theta\)):
-
错切变换
- X方向错切矩阵:
\( T = \begin{bmatrix}1 & d_x & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1\end{bmatrix} \) - 算例:点(1, 1)进行\(d_x=0.5\)的错切,变换后:
\( \begin{bmatrix}1 & 0.5 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1\end{bmatrix} \begin{bmatrix}1 \\ 1 \\ 1\end{bmatrix} = \begin{bmatrix}1+0.5×1 \\ 1 \\ 1\end{bmatrix} = \begin{bmatrix}1.5 \\ 1 \\ 1\end{bmatrix} \)
图像横向倾斜,类似“推箱子时箱子底部不动,顶部被推开”。
- X方向错切矩阵:
第4章 图像正交变换:傅里叶变换
-
离散傅里叶变换(DFT)
- 公式:
\( F(u, v) = \sum_{x=0}^{M-1}\sum_{y=0}^{N-1} f(x, y) e^{-j2\pi(ux/M + vy/N)} \) - 算例:简化为1D情况,f(x)=[1, 2, 3, 4],N=4,计算u=1时:
\( F(1) = 1×e^{-j2\pi×1×0/4} + 2×e^{-j2\pi×1×1/4} + 3×e^{-j2\pi×1×2/4} + 4×e^{-j2\pi×1×3/4} \)
\( = 1 + 2×(-j) + 3×(-1) + 4×j = (1-3) + j(4-2) = -2 + 2j \) - 类比:DFT像“分解音乐和弦”,把图像从像素空间分解成不同频率的“波形”组合。
- 公式:
-
卷积定理
- 公式:时域卷积等于频域乘积,即\(f*g \leftrightarrow F(u, v)G(u, v)\)。
- 应用:高斯滤波在时域是卷积运算,在频域直接乘高斯函数频谱,计算更快。
第5章 图像增强:灰度变换与直方图
-
线性灰度变换
- 公式:\(g(x,y) = a·f(x,y) + b\),其中\(a\)是斜率,\(b\)是偏移。
- 算例:若原图灰度范围[0, 127],想拉伸到[0, 255],则\(a=255/127≈2.0\),\(b=0\),如像素值50变为\(2×50=100\)。
- 类比:调手机屏幕亮度,\(a>1\)是提亮,\(a<1\)是调暗,\(b\)是偏色调整。
-
直方图均衡化
- 步骤:
- 统计各灰度级频率\(p(r_k)=n_k/N\);
- 计算累积分布\(s_k = \sum_{j=0}^k p(r_j)\);
- 映射到新灰度级\(g_k = \lfloor s_k×(L-1) \rfloor\),\(L\)是灰度级总数(如256)。
- 算例:假设图像灰度分布为:
\( \begin{matrix} r_k: & 0 & 1 & 2 \\ n_k: & 2 & 3 & 1 \\ \end{matrix}, \quad N=6 \)
则\(p(0)=2/6=1/3\),\(p(1)=3/6=1/2\),\(p(2)=1/6\)
累积分布:
\(s_0=1/3\),\(s_1=1/3+1/2=5/6\),\(s_2=5/6+1/6=1\)
映射到[0,2]灰度级(L=3):
\(g_0=\lfloor 1/3×2 \rfloor=0\),\(g_1=\lfloor 5/6×2 \rfloor=1\),\(g_2=\lfloor 1×2 \rfloor=2\) - 类比:把“高矮不一的人群”按身高排序后均匀分布,让每个身高段人数相近,图像对比度更均匀。
- 步骤:
-
同态滤波
- 流程:
- 取对数:\(z(x,y) = \ln f(x,y) = \ln i(x,y) + \ln r(x,y)\);
- 傅里叶变换:\(Z(u,v) = I(u,v) + R(u,v)\);
- 高通滤波:\(S(u,v) = H(u,v)·Z(u,v)\),其中\(H(u,v)\)提升高频(反射分量)、压制低频(光照分量);
- 逆傅里叶变换+指数变换:\(g(x,y) = e^{\text{IDFT}(S(u,v))}\)。
- 类比:处理阴天拍摄的照片,同态滤波像“分开调整光线和物体颜色”,压制全局光照不均,增强物体细节。
- 流程:
计算类选择题及分步解析
1. RGB=(0, 0, 255)转换为CMYK是?
A. (255, 255, 0, 0)
B. (0, 0, 255, 0)
C. (255, 255, 0, 255)
D. (0, 0, 0, 255)
解析:选B。RGB=(0,0,255)是蓝色,计算:
\(K = \min(1-0, 1-0, 1-1) = 0\)(因为B=255→1-B=0),
\(C=(1-0-0)/1=1\),\(M=(1-0-0)/1=1\),\(Y=(1-1-0)/1=0\),
转换为0-255范围:C=255, M=255, Y=0, K=0,即(255,255,0,0),但选项中B是(0,0,255,0)?哦,这里可能混淆了0-1和0-255的表示,正确步骤应为:
RGB值范围0-255,先归一化到0-1:R=0/255=0, G=0/255=0, B=255/255=1,
计算K=min(1-0,1-0,1-1)=0,
C=(1-0-0)/(1-0)=1→255,M=(1-0-0)/(1-0)=1→255,Y=(1-1-0)/(1-0)=0→0,K=0→0,
所以CMYK=(255,255,0,0),对应选项A。之前的选项可能排版错误,正确选A。
2. 点(3, 4)绕原点旋转45°,新坐标是?
A. (3√2, 4√2)
B. (-√2/2, 7√2/2)
C. (7√2/2, √2/2)
D. (√2/2, -7√2/2)
解析:选C。旋转矩阵\(\cos45°=\sin45°=√2/2\),
齐次坐标变换:
\(
\begin{bmatrix} √2/2 & √2/2 & 0 \\ -√2/2 & √2/2 & 0 \\ 0 & 0 & 1 \end{bmatrix} \begin{bmatrix}3 \\ 4 \\ 1\end{bmatrix} = \begin{bmatrix}3√2/2 + 4√2/2 \\ -3√2/2 + 4√2/2 \\ 1\end{bmatrix} = \begin{bmatrix}7√2/2 \\ √2/2 \\ 1\end{bmatrix}
\)
即新坐标(7√2/2, √2/2),选C。
3. 直方图均衡化中,累积分布函数的作用是?
A. 压缩高频噪声
B. 将灰度分布转为均匀分布
C. 增强边缘
D. 降低对比度
解析:选B。累积分布函数将原始灰度的概率分布映射为均匀分布,就像把“左密右疏”的直方图拉平,增强全局对比度。
计算通关秘籍
- 颜色模型转换:记住RGB是加色模型(发光),CMYK是减色模型(印刷),YUV/YIQ用于视频传输,HSI更符合人眼感知。
- 几何变换矩阵:旋转、平移、缩放都可用齐次坐标矩阵表示,注意变换顺序(先旋转再平移)。
- 直方图均衡化:关键是计算累积概率并映射,步骤虽多但逻辑清晰,可通过小例子手动推导加深理解。
- 同态滤波:分步骤记忆“对数→傅里叶→滤波→逆傅里叶→指数”,类比“分解光照和反射”来理解原理。
动手算一遍小例子(如3×3像素的直方图均衡化),比背公式更有效哦!

浙公网安备 33010602011771号