人类视觉感知
来讨论一些简单的生理学问题。正如我们将看到的那样,对我们的眼睛的工作原理的理解为视频和成像技术的发展铺设出一条重要的道路。
眼睛包含两种视觉细胞:杆状细胞和视锥细胞。杆状细胞主要对亮度信息敏感,而对颜色信息不敏感,它们使我们具备夜视能力。与此相反,视锥细胞对亮度并不敏感,但对400nm(紫光)~770nm(红光)波长范围内的光比较敏感。因此,这些视锥细胞使我们能够感知色彩。
视锥细胞有3种,每一种都带有不同的色素,分别对红光、绿光或者蓝光波长敏感,虽然这3种细胞的响应特性有重叠区域。总的说来,视锥细胞对波长在555nm左右的绿光区域最为敏感。这也就是为什么在LCD显示器中,绿色通道的分辨率高于红色和蓝色通道。
红色、绿色和蓝色视锥细胞的发现大大促进了三色理论的发展,该理论认为,任何一种有色光,可以通过不同比例的红光、绿光和蓝光的组合生成。
由于人眼含有的杆状细胞的数量要远多于视锥细胞,故眼睛对亮度的敏感度要高于对色彩的敏感度。这使得我们可以借助对色彩信息的子采样来节省视频和图像信息的带宽。
我们对亮度的感受特性是对数性的,而非线性的。换句话说,用于产生50%
灰度图(恰好在全黑和全白之间的正中)所需的实际的光强仅为我们需要产生全白图像所需的光强的18%。这一特性在相机传感器和显示技术中尤为重要,正如我们将在后面的伽马校正中讨论的。此外,这一效应还将导致人眼对高亮度环境下的量化失真的感知度下降,导致这一特性被许多媒体编码算法所利用。视觉方面的另一新奇之处在于,人眼可以适应环境,创建自己的白光参考,即使在低照明或者人工照明的情况下也是如此。因为摄像传感器自身并不具有这一特性,因此它需要使用参考量作为绝对白色,并对传感器进行调整,这一过程称为白平衡控制。
人眼对高频信息的敏感性要低于对低频信息。而且,虽然它可以检测出静态图像中细节和彩色部分的分辨率,但对于快速移动的图像,却无法做到这一点。于是,人们可以利用变换编码(DCT、FFT等)以及低通滤波技术来降低呈现一幅图像或者视频序列时所需的总带宽。
当图像的刷新速率低于50~60次/s时,我们的眼睛会感受到一种亮光“闪烁”
的效应。在光线较暗的情况下,该频率值降低到24Hz。此外,我们更倾向于观察到大而均匀的区域内的闪烁,相比之下,对局部区域的闪烁敏感度较低。这些特性对于隔行视频、刷新速率和显示技术具有重要的潜在作用。

图中:Breakdown of Luma Signal——亮度信号的分类,Back Porch——后洛,Horizontal syc——水平同步,White level——白色级,Grey Level——灰色级,Black Level——黑色级
从根本上来说,一个视频信号基本上只是由亮度和色彩数据构成的2维阵列,该阵列以一定帧率的刷新变化来描述运动。在传统的阴极射线管(CRT)电视和显示器中,屏幕上的磷粉由一个电子束从上到下、从左到右的方式激发产生光亮。该电子束是由一个如图1所示的模拟视频信号调制生成。嵌入该模拟信号中的同步信号,决定了电子束什么时候激亮磷粉,什么时候停止操作。这样电子束可以在下一行由右向左回程扫描,或者从下到上开始对下一帧视频场或帧信号进行扫描。这些同步信号如图2所示。
HSYNC是水平同步信号。它界定了视频帧每一行中(从左到右)有效视频的起始位置。水平消隐为电子枪从屏幕右侧回扫至下一行左侧的时间间隔。
VSYNC是垂直同步信号。它定义了一个新的视频图像的起始位置(从上到下)。
垂直消隐为电子枪从屏幕图像的右下角返回左上角所需的时间间隔。
FIELD用于在隔行视频信号中区分出目前所显示的场。该信号并不适用于逐行扫描视频系统。

视频信息的传输起源于由黑到白的相关亮度显示,黑白电视系统也是这样产生的。在空间中的一个给定点处的电压水平则与该点图像的亮度水平相关。
当彩色电视出现后,它必须保证与黑白电视的后向兼容,因此彩色脉冲信息被添加到已有的亮度信号顶部,如图3所示。色彩信息也被称为色度。我们将在关于色彩空间的讨论中更多的探讨这一问题(见该系列文章的第2部分)。

图中:Luma Channle——亮度通道,Chroma Channel——色度通道,Composite Video signal——复合视频信号。
Color Burst Demodulation Reference Signal——色彩脉冲解调参考信号广播电视—NTSC和PAL制式
模拟视频标准的区别在于它们各自对亮度和彩色信息的编码方式。目前广播电视领域占统治地位的是两种标准——NTSC和PAL。NTSC由美国国家电视系统委员会提出,在亚洲和北美广泛使用,而PAL是NTSC的一个分支,在欧洲和南美占据统治地位。另外一种制式,SECAM,则在法国和东欧部分地区流行,不过,
在这些地区中,许多也都采用PAL。我们的讨论将集中在NTSC制上,但讨论的结果也适用于基于PAL制的系统。
视频分辨率
水平分辨率是指图像每行的像素个数,而垂直分辨率则是指显示完整一帧时屏幕上出现的水平线的数量。标清NTSC系统采用隔行扫描方式,具有480线有效像素,每条线上有720个有效的像素(即总计720×480像素)。高清系统常常采用逐行扫描方式,其水平和垂直分辨率要远高于标清系统。我们将专注于标清系统,而非高清系统,但我们讨论的大部分,也将推广到具有更高帧和像素传输率的高清系统。
在讨论视频技术时,分辨率和帧速率的提升是沿着两条主要的分支发展的,即计算机图形图像格式和广播视频格式。表1给出了各种常见的屏幕分辨率和帧率的比较。即使这两路分支源于不同的领域,而且要求也不同(例如,计算机图形显示使用RGB逐行扫描方法,而广播视频则使用YCbCr隔行扫描方法),如今在嵌入式领域,它们在使用上几乎可以是互换的。也就是说,VGA与NTSC“D-1"广播格式相当,QVGA对应的则是CIF。应该注意的是,虽然D-1是720像素×480行格式,但它通常被称为720x480像素(这实际上是针对DVD和其他数字视频的NTSC“DV”格式)。

浙公网安备 33010602011771号