国科大-数字视频处理期末重点(录音转换版)

置顶:有错勿喷,感谢!

题型:判断题10道,选择题5,大题5道。
布置过习题的章节(134678)考大题,其它章节(25)考选择判断。

第一章
1.2:第5页傅里叶变换基本公式,连续傅里叶变换、离散信号的傅里叶变换,以及离散傅里叶变换。11页离散余弦变换,与DFT关系。

1.3:13页二维卷积。FIR、IIR了解就可以了。

1.4:17页多维采样理论的格上采样的概念、采样理论、基向量,19页沃洛诺域怎么画,习题1.13。

1.5:23页采样结构的转换问题,上转换下转换中间一个低通滤波器是吧。就格跟格之间的转换问题,逆格的概念以及它的沃罗诺域。

第二章
2.1:人类视觉系统,视视锥细胞视杆细胞作用。图2.2RGB和CMYK色彩空间,b减性色彩空间黄青交界的地方改成绿。要注意相加色彩空间和相减色彩空间的原则。接下来灵敏度问题、视觉特性。33页立体和深度感知,需要明白适应、汇聚的概念,适应就是聚焦的意思,汇聚就是把这个两幅画面聚合在一起。

2.2:34页逐行、隔行扫描的概念。

2.3:36页数字视频,空间分辨率。37页拜尔色彩滤镜阵列、动态范围的概念。38页YCrCb和RGB的转换问题。

2.6:53页客观质量评价两种方法,PSNR和SSIM概念、计算公式。

第三章
3.1:图像滤波里掌握Box滤波、高斯滤波、双边滤波。

3.2:图像重采样,61页内插就是插值方法,掌握零阶保持滤波、,线性内插、三次卷积内插方法。65页掌握多分辨率金字塔表示、高斯金字塔,。小波了解下概念,不做非常高的要求。

3.3:69到70页图像梯度的估计,掌握几个重要的算子,包括拉普拉斯算子、图3.17的算子。72页Canny边缘检测明白大概流程,先计算梯度、再非局部极值抑制、滞后预知判决。73页Harris角检测,需要重点掌握的是M矩阵。尤其是M矩阵的特点,当它的特征值满足什么样的情况下才可以判断是一个角点。

3.4:图像增强里一定重点掌握自动增益控制AGC、直方图均衡,对应习题3.4。直方图塑形了解即可。

3.5:81页重点掌握IIR维纳滤波器,尤其是正交性原理、正交性准则,对应习题要会做。85页掌握非线性滤波的中值滤波、86页顺序统计滤波器,小波收缩仅了解。

3.6:图像复原,89页掌握点扩散函数,包括失焦模糊、线性运动模糊。91页掌握伪逆波滤波的大概概念。95页掌握例题3.4,以及对应习题3.9失焦运动模糊的识别问题,运动模糊要会使用2D DFT做离散数列变换,看将来零点在哪。

第四章
4.1:首先这个成像问题,也就是投影相机,一定要注意用的是4.1b,因为后面推导都是根据4.1b来推导的。如果非得用4.1a那就是找麻烦。透视投影实际上就是二维跟三维之间的转换公式。在这章里边主要就是讲的是二维跟三维、三维跟三维以及二维跟二维之间的关系,你了解这几个关系就差不多了,就不会出现大错误。当然还要知道其次坐标,还有相机的内部参数矩阵、外部参数矩阵。这个P矩阵就是投影矩阵。在这章里三个矩阵比较重要:投影矩阵、后面讲的基本矩阵、本质矩阵。107页反射相机、正交投影已经太简单了看一下就可以了。

4.2:109页投影运动跟表观运动的区别。投影运动要重点掌握的是情形b,重点掌握4.14a,就是三维刚体运动的三维坐标跟三维坐标之间的一个关系问题。以及刚体运动的其次坐标。另外,表观运动跟实际的投影运动到底有什么区别,它俩是否一一对应。111页两种模型,一个是通用模型,是指对场景结构不做假设,没有约束条件。在这种情况下,推导出二维跟二维坐标之间的关系,就是运动前后的二维坐标通过三维坐标的三维刚体运动推出来的。另外一个重要模型就是单应性模型,单应性模型实际上是当特征点都在一个平面上的时,写成H矩阵的这种形式,此时不需要其次坐标,因为直接是其次的一个表示方式。三维坐标之间没有其次坐标,但是二维当然仍然有其次坐标。4.2.3就是参数化模,块平移、仿射等等,要知道做题的时候在哪儿找公式。

4.3:115页光流方程、法上流的概念,结合后面习题。116页光流方程位移分差,117页遮挡和孔径问题,这个这都要明白意思,什么叫遮挡,什么叫孔径问题,孔径问题有几种情形。还有一个分层运动估计,因为又用到了金字塔了,这个分层运动估计要解决什么问题——孔径问题。

4.4:120页的LK算法,掌握基本概念,以及掌握特殊情况块平移运动模。前面那个复杂的可以不用掌握。121页这个HS算法,HS算法的基本原则、它跟LK算法相比到底有些什么区别。一定要注意HS算法跟LK算法到底有什么区别。

4.5:124页基本块匹配的问题,块匹配的基本概念,然后它有什么样的搜索方法,比如最简单就是全搜索快速搜索方法,又比如说有的方法是牺牲精度的,有的不牺牲精度。对数搜索、钻石搜索等基本概念。4.5.3的分层块匹配的一个基本概念。

4.6-4.7:像素递归、贝叶斯、相位相关法等,大概了解一下。

4.8:三维运动估计,因为它非常复杂,因此只要求大家对于这个矩阵要做一个了解,比如说135页基本矩阵,基本矩阵F跟本质矩阵E存在什么样的关系,其实就是由相机的内部和外部参数来表示。至于其它就大概了解一下。

第五章
5.1:图像分割里的阈值法,其中奥特苏阈值法怎么计算。聚类方法,聚类方法两种比较重要:一个是K均值算法,另外一种Mean-Shift算法。会做,比如给一堆数聚个类,给一堆数做K均值聚类或者Mean-Shift。

5.2:153页变化检测就是镜头的边界检测,简单了解一下。

5.3:158页运动分割的一些基本概念,简单了解一下。

5.4:167页运动跟踪的一些基本原理,主要掌握的是KLT,也就是169页KLT的跟踪好特征,跟踪好特征其实就跟前面的Harris角检测有关系。

第六章
6.1:视频的频谱,也就是在全局匀速平移的情况下,要知道“频谱将被局限在一个平面上面”这个概念。以及把它投影到了一个平面(F1,Ft),就变成了一条斜线。运动自适应滤波和运动补偿滤波这两个概念要注意。运动自适应滤波并不需要运动估计,而运动补偿滤波一定是要进行运动估计然后沿着运动轨迹进行滤波。如果它沿着运动轨迹进行滤波就用到了所谓的通带问题,图6.3有一个运动补偿滤波器的频率反应。

6.2:视频格式转换其实讲了一个下变频。下变频讲到了临界速度的问题,去隔行情况下的临界速度,189页图6.8临界速度。190页和191页去隔行需要重点掌握的是两个滤波方法,一个是线性插值方法叫做bob滤波,一种时域去隔行叫做weave滤波。要掌握两种滤波方法分别适用于什么样的情况。帧率转换等仅仅了解就可以。

6.3:197页运动补偿去噪的问题。重点掌握了是两个方法,一个是LMMSE滤波方法,一个是AWA滤波器。注意这两个滤波器都是运动补偿滤波,对它需要先进行一种估计然后沿着运动轨迹进行滤波的方法。但是它俩之间是不同的,有什么不同点。掌握习题6.5。

6.5:203页多帧超分辨率的基本概念,为什么能够实现超分辨率,它要满足什么样的条件才能进行高分辨率。然后它的低分辨率采样的建模问题,掌握对应习题6.8。

第七章
7.1:217页信息论,无损编码定理、信源编码定理、预失真的函数等等。接下来图像编码的三要素,要知道是什么。然后就是量化,量化对应习题7.6。掌握均匀量化里的中平、中升两种量化器。符号编码熵编码,尤其要掌握霍夫曼编码,对应习题7.1和7.2,然后算术编码怎么算,类似表7.4要会。

7.3:233页离散余弦变换,变化完了之后的系数分布。237页例7.12之字形扫描,图7.14里8乘8的矩阵、以及4乘4的矩阵,要知道之字形扫描是怎么扫描的、符号是怎么产生的、系数值,会做相应题目。

第八章
8.1:251页运动补偿变换编码,它的思想和课件PPT里边的编码框架。

8.2:MPEG标准就是253页掌握GOP,序列、GOP、帧、slice、宏块的概念。图8.3就是一个GOP顺序问题。MPEG2里掌握259页隔行视频,260页图8.10交替扫描。

8.3:261页H264标准,掌握层次化B帧,262页图8.11。再掌握图8.12的这个分类预测模式,对应习题8.3。

8.4:267页重点掌握并行编解码工具,一个tile,一个是波前并行处理,这两个有什么区别。

PS:老师说的了解一下几乎就是不考,没提到的也不考。大题基本上是布置过的习题改编+提到过的例题。判断选择就是除去习题的剩下重点里出,感觉老师重点里直接念出来了答案。这里提醒一下第8章习题不用交,但还是要做一下会考到。要是来不及复习先做习题+例题,章节可以按照3-4-7-6-8-2-5顺序,越前面考的越多。感谢老师没怎么考傅里叶,最终3天速通90分!
复习方法:找不到很配套的网课,可以每个章节分小节发教材图片+课件+重点给GPT帮助复习。
算术编码分享一个小视频【算术编码例题讲解】 https://www.bilibili.com/video/BV1Qk4y1D7Fh/?share_source=copy_web&vd_source=54a40f9498e4554eb55eafa730c42409

posted @ 2026-01-10 13:29  唔西滴西哒噜噜  阅读(6)  评论(0)    收藏  举报