数字图像计算1

《数字图像处理》1-5章核心计算知识点详解(附手把手算例)

第2章 数字图像处理基础:颜色模型与采样

  1. RGB与CMYK颜色转换

    • 公式
      \( K = \min(1-R, 1-G, 1-B) \)
      \( C = \frac{1-R-K}{1-K}, \quad M = \frac{1-G-K}{1-K}, \quad Y = \frac{1-B-K}{1-K} \)
    • 算例:若RGB=(0.8, 0.2, 0.3),则:
      \(K = \min(1-0.8, 1-0.2, 1-0.3) = 0.2\)
      \(C = \frac{1-0.8-0.2}{1-0.2} = 0\)\(M = \frac{1-0.2-0.2}{0.8} = 0.75\)\(Y = \frac{1-0.3-0.2}{0.8} = 0.625\)
    • 类比:RGB是发光色(如电视),CMYK是印刷色(如打印机),转换时相当于“用墨水覆盖白纸”,K代表黑色墨水的用量。
  2. YIQ与RGB转换

    • 矩阵公式
      \( \begin{bmatrix} Y \\ I \\ Q \end{bmatrix} = \begin{bmatrix} 0.299 & 0.587 & 0.114 \\ 0.596 & -0.275 & -0.321 \\ 0.212 & -0.523 & 0.311 \end{bmatrix} \begin{bmatrix} R \\ G \\ B \end{bmatrix} \)
    • 算例:RGB=(1, 0, 0)(红色),则:
      \(Y = 0.299×1 + 0.587×0 + 0.114×0 = 0.299\)
      \(I = 0.596×1 - 0.275×0 - 0.321×0 = 0.596\)
      \(Q = 0.212×1 - 0.523×0 + 0.311×0 = 0.212\)
    • 类比:Y是亮度(黑白电视信号),I和Q是色彩信息,类似把彩色照片拆成亮度和色调两部分。
  3. 采样定理:奈奎斯特频率计算

    • 公式:最低采样频率 \(\omega_s = 2\omega_m\),其中\(\omega_m\)是信号最高频率。
    • 算例:若图像中细节最高频率为100Hz,则采样频率至少为200Hz。
    • 类比:用相机拍旋转风扇,快门速度不够会拍模糊,采样定理就是“快门速度至少是风扇转速的2倍才能看清叶片”。

第3章 图像基本运算:几何变换

  1. 齐次坐标与旋转矩阵

    • 旋转矩阵(绕原点逆时针旋转\(\theta\)):
      \( T = \begin{bmatrix} \cos\theta & \sin\theta & 0 \\ -\sin\theta & \cos\theta & 0 \\ 0 & 0 & 1 \end{bmatrix} \)
    • 算例:点(2, 3)绕原点旋转90°,齐次坐标为\(\begin{bmatrix}2 \\ 3 \\ 1\end{bmatrix}\),变换后:
      \( \begin{bmatrix} \cos90° & \sin90° & 0 \\ -\sin90° & \cos90° & 0 \\ 0 & 0 & 1 \end{bmatrix} \begin{bmatrix}2 \\ 3 \\ 1\end{bmatrix} = \begin{bmatrix}0 & 1 & 0 \\ -1 & 0 & 0 \\ 0 & 0 & 1\end{bmatrix} \begin{bmatrix}2 \\ 3 \\ 1\end{bmatrix} = \begin{bmatrix}3 \\ -2 \\ 1\end{bmatrix} \)
      即新坐标为(3, -2)。
    • 类比:旋转矩阵像“转盘”,每个点按角度规则移动,齐次坐标的第三维1是“固定点”。
  2. 错切变换

    • X方向错切矩阵
      \( T = \begin{bmatrix}1 & d_x & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1\end{bmatrix} \)
    • 算例:点(1, 1)进行\(d_x=0.5\)的错切,变换后:
      \( \begin{bmatrix}1 & 0.5 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1\end{bmatrix} \begin{bmatrix}1 \\ 1 \\ 1\end{bmatrix} = \begin{bmatrix}1+0.5×1 \\ 1 \\ 1\end{bmatrix} = \begin{bmatrix}1.5 \\ 1 \\ 1\end{bmatrix} \)
      图像横向倾斜,类似“推箱子时箱子底部不动,顶部被推开”。

第4章 图像正交变换:傅里叶变换

  1. 离散傅里叶变换(DFT)

    • 公式
      \( F(u, v) = \sum_{x=0}^{M-1}\sum_{y=0}^{N-1} f(x, y) e^{-j2\pi(ux/M + vy/N)} \)
    • 算例:简化为1D情况,f(x)=[1, 2, 3, 4],N=4,计算u=1时:
      \( F(1) = 1×e^{-j2\pi×1×0/4} + 2×e^{-j2\pi×1×1/4} + 3×e^{-j2\pi×1×2/4} + 4×e^{-j2\pi×1×3/4} \)
      \( = 1 + 2×(-j) + 3×(-1) + 4×j = (1-3) + j(4-2) = -2 + 2j \)
    • 类比:DFT像“分解音乐和弦”,把图像从像素空间分解成不同频率的“波形”组合。
  2. 卷积定理

    • 公式:时域卷积等于频域乘积,即\(f*g \leftrightarrow F(u, v)G(u, v)\)
    • 应用:高斯滤波在时域是卷积运算,在频域直接乘高斯函数频谱,计算更快。

第5章 图像增强:灰度变换与直方图

  1. 线性灰度变换

    • 公式\(g(x,y) = a·f(x,y) + b\),其中\(a\)是斜率,\(b\)是偏移。
    • 算例:若原图灰度范围[0, 127],想拉伸到[0, 255],则\(a=255/127≈2.0\)\(b=0\),如像素值50变为\(2×50=100\)
    • 类比:调手机屏幕亮度,\(a>1\)是提亮,\(a<1\)是调暗,\(b\)是偏色调整。
  2. 直方图均衡化

    • 步骤
      1. 统计各灰度级频率\(p(r_k)=n_k/N\)
      2. 计算累积分布\(s_k = \sum_{j=0}^k p(r_j)\)
      3. 映射到新灰度级\(g_k = \lfloor s_k×(L-1) \rfloor\)\(L\)是灰度级总数(如256)。
    • 算例:假设图像灰度分布为:
      \( \begin{matrix} r_k: & 0 & 1 & 2 \\ n_k: & 2 & 3 & 1 \\ \end{matrix}, \quad N=6 \)
      \(p(0)=2/6=1/3\)\(p(1)=3/6=1/2\)\(p(2)=1/6\)
      累积分布:
      \(s_0=1/3\)\(s_1=1/3+1/2=5/6\)\(s_2=5/6+1/6=1\)
      映射到[0,2]灰度级(L=3):
      \(g_0=\lfloor 1/3×2 \rfloor=0\)\(g_1=\lfloor 5/6×2 \rfloor=1\)\(g_2=\lfloor 1×2 \rfloor=2\)
    • 类比:把“高矮不一的人群”按身高排序后均匀分布,让每个身高段人数相近,图像对比度更均匀。
  3. 同态滤波

    • 流程
      1. 取对数:\(z(x,y) = \ln f(x,y) = \ln i(x,y) + \ln r(x,y)\)
      2. 傅里叶变换:\(Z(u,v) = I(u,v) + R(u,v)\)
      3. 高通滤波:\(S(u,v) = H(u,v)·Z(u,v)\),其中\(H(u,v)\)提升高频(反射分量)、压制低频(光照分量);
      4. 逆傅里叶变换+指数变换:\(g(x,y) = e^{\text{IDFT}(S(u,v))}\)
    • 类比:处理阴天拍摄的照片,同态滤波像“分开调整光线和物体颜色”,压制全局光照不均,增强物体细节。

计算类选择题及分步解析

1. RGB=(0, 0, 255)转换为CMYK是?

A. (255, 255, 0, 0)
B. (0, 0, 255, 0)
C. (255, 255, 0, 255)
D. (0, 0, 0, 255)

解析:选B。RGB=(0,0,255)是蓝色,计算:
\(K = \min(1-0, 1-0, 1-1) = 0\)(因为B=255→1-B=0),
\(C=(1-0-0)/1=1\)\(M=(1-0-0)/1=1\)\(Y=(1-1-0)/1=0\)
转换为0-255范围:C=255, M=255, Y=0, K=0,即(255,255,0,0),但选项中B是(0,0,255,0)?哦,这里可能混淆了0-1和0-255的表示,正确步骤应为:
RGB值范围0-255,先归一化到0-1:R=0/255=0, G=0/255=0, B=255/255=1,
计算K=min(1-0,1-0,1-1)=0,
C=(1-0-0)/(1-0)=1→255,M=(1-0-0)/(1-0)=1→255,Y=(1-1-0)/(1-0)=0→0,K=0→0,
所以CMYK=(255,255,0,0),对应选项A。之前的选项可能排版错误,正确选A。

2. 点(3, 4)绕原点旋转45°,新坐标是?

A. (3√2, 4√2)
B. (-√2/2, 7√2/2)
C. (7√2/2, √2/2)
D. (√2/2, -7√2/2)

解析:选C。旋转矩阵\(\cos45°=\sin45°=√2/2\)
齐次坐标变换:
\( \begin{bmatrix} √2/2 & √2/2 & 0 \\ -√2/2 & √2/2 & 0 \\ 0 & 0 & 1 \end{bmatrix} \begin{bmatrix}3 \\ 4 \\ 1\end{bmatrix} = \begin{bmatrix}3√2/2 + 4√2/2 \\ -3√2/2 + 4√2/2 \\ 1\end{bmatrix} = \begin{bmatrix}7√2/2 \\ √2/2 \\ 1\end{bmatrix} \)
即新坐标(7√2/2, √2/2),选C。

3. 直方图均衡化中,累积分布函数的作用是?

A. 压缩高频噪声
B. 将灰度分布转为均匀分布
C. 增强边缘
D. 降低对比度

解析:选B。累积分布函数将原始灰度的概率分布映射为均匀分布,就像把“左密右疏”的直方图拉平,增强全局对比度。

计算通关秘籍

  1. 颜色模型转换:记住RGB是加色模型(发光),CMYK是减色模型(印刷),YUV/YIQ用于视频传输,HSI更符合人眼感知。
  2. 几何变换矩阵:旋转、平移、缩放都可用齐次坐标矩阵表示,注意变换顺序(先旋转再平移)。
  3. 直方图均衡化:关键是计算累积概率并映射,步骤虽多但逻辑清晰,可通过小例子手动推导加深理解。
  4. 同态滤波:分步骤记忆“对数→傅里叶→滤波→逆傅里叶→指数”,类比“分解光照和反射”来理解原理。

动手算一遍小例子(如3×3像素的直方图均衡化),比背公式更有效哦!

posted @ 2025-06-20 02:42  热心市民潇湘  阅读(68)  评论(0)    收藏  举报