数字图像处理综述
摘要
随着互联网、移动通信技术以及智能终端设备的不断发展和普及,我们可以更加便捷地生成和浏览图片。Facebook平均每天收到用户上传图片超过4.5亿张,面对爆发式增长的图片信息,如何对其高效的索引、浏览以及存储,都是数字图像处理领域需要面对的现实问题。此外,图片中含有丰富的语意信息,如何从这些大量的数据中获取我们所需的知识,也是目前人工智能领域一个重要的研究方向。本文对数字图像处理技术做一个总体概述。
关键词
数字图像处理
I 数字图像处理概述
数字图像处理技术是指将一种图像信号转变为二进制数字信号, 经过计算机对而其进行的图像变换、编码压缩、增强和复原 以及分割、特征提取等处理,而高精准的还原到显示器的过程。对应上述概念定义,即可得出数字图像处理所包括的主要方法:图像增强、 图像复原、
图像压缩、图像分割等主要方法。
II 数字图像处理研究背景及现状
在数字图像处理中,图像被分割成像素(每英寸的像素的数目取决于图像的分辨率). 可以说图像处理是对图像数据的一种操作或者运算, 一般是由计算机或者专用图像处理硬件来实现的。 我国常用的数字图像处理技术主要有两种, 一种是光学处理法, 一种是数字(电子)处理法。当前,数字图像处理技术已经逐步完善。 数字图像处理技术与人们的生活紧密相
关,如常用的数字电视、 数码照相机、数码摄像机等所输出的图像都是数字图像,即数字像处理技术的成果。 目前数字图像处理已发展成为信息处理技术的一个综合性边缘学科,成为了信息处理的一个重要的学科分支, 并与相关学科相互联系、相互交叉。
数字图像处理最早出现于 20 世纪 70 年代,当时是以人为对象的,为了改善图像的视觉效果。 到目前为止,图像处理技术在许多应用领域受到广泛重视并取得了重大的开拓性成就, 使图像处理成为一门引人注目、 前景远大的新型学科。而它发展至今,在原有的基础上又有了新的技术支持, 已经逐渐覆盖至方方面面,在各个学科都有着难以忽视的作用。
由于计算机价格性能比的持续下降、 网络通信带宽的提高及互联网和万维网的不断扩张, 数字图像处理技术的持续发展迎来了更大的机会。 数字图像处理技术将在各个领域发挥更大的作用。
III 数字图像处理技术的主要方法
-
图像增强
-
图像增强研究背景及意义
在一般情况下,经过图像的传送和转换,如成像、复制、扫描、传输和显示等,经常会造成图像质量的下降, 即图像失真。 在摄影时由于光照条件不足或过度, 会使图像过暗或过亮;光学系统的失真、相对运动、大气流动等都会使图像模糊,传输过程中会引入各种类型的噪声。 总之输入的图像在视觉效果和识别方便性等方面可能存在诸多问题, 这类问题不妨统称为质量问题。 图像增强是指根据特定的需要突出图像中的重要信息, 同时减弱或去除不需要的信息。 从不同的途径获取的图像, 通过进行适当的增强处理, 可以将原本模糊不清甚至根本无法分辨的原始图像处理成清晰的富含大量有用信息的可使用图像, 有效地去除图像中的噪声、 增强图像中的边缘或其他感兴趣的区域, 从而更加容易对图像中感兴趣的目标进行检测和测量。 处理后的图像是否保持原状已经是无关紧要的了, 不会因为考虑到图像的一些理想形式而去有意识的努力重现图像的真实度。图像增强的目的是增强图像的视觉效果,将原图像转换成一种更适合于人眼观察和计算机分析处理的形式。 它一般要借助人眼的视觉特性, 以取得看起来较好地视觉效果, 很少涉及客观和统一的评价标准。 增强的效果通常都与具体的图像有关系,靠人的主观感觉加以评价。
-
图像增强的定义
为了改善视觉效果或者便于人和机器对图像的理解和分析, 根据图像的特点或存在的问题采取的简单改善方法或者加强特征的措施称为图像增强。
-
图像增强的分类及方法
图像增强可分成两大类: 频率域法和空间域法。 前者把图像看成一种二维信号, 对其进行基于二维傅里叶变换的信号增强。 采用低通滤波 (即只让低频信号通过) 法,可去掉图中的噪声;采用高通滤波法,则可增强边缘等高频信号,使模糊的图片变得清晰。具有代表性的空间域算法有局部求平均值法和中值滤波 (取局部邻域中的中间像素值) 法等, 它们可用于去除或减弱噪声。
常用的图像增强方法:
-
直方图均衡化
有些图像在低值灰度区间上频率较大,使得图像中较暗区域中的细节看不清楚。这时可以通过直方图均衡化将图像的灰度范围分开,并且让灰度频率较小的灰度级变大,通过调整图像灰度值的动态范围,自动地增加整个图像的对比度,使图像具有较大的反差,细节清晰。 -
对比度增强法
有些图像的对比度比较低, 从而使整个图像模糊不清。 这时可以按一定的规则修改原来图像的每一个象素的灰度,从而改变图像灰度的动态范围。 -
平滑噪声
有些图像是通过扫描仪扫描输入、或传输通道传输过来的。图像中往往包含有各种各样的噪声。这些噪声一般是随机产生的,因此具有分布和大小不规则性的特点。这些噪声的存在直接影响着后续的处理过程,使图像失真。图像平滑就是针对图像噪声的操作,其主要作用是为了消除噪声,图像平滑的常用方法是采用均值滤波或中值滤波,均值滤波是一种线性空间滤波,它用一个有奇数点的掩模在图像上滑动,将掩模中心对应像素点的灰度值用掩模内所有像素点灰度的平均值代替,如果规定了在取均值过程中掩模内各像素点所占的权重,即各像素点所乘系数,这时就称为加权均值滤波;中值滤波是一种非线性空间滤波,其与均值滤波的区别是掩模中心对应像素点的灰度值用掩模内所有像素点灰度值的中间值代替。 -
锐化
平滑噪声时经常会使图像的边缘变的模糊,针对平均和积分运算使图像模糊,可对其进行反运算采取微分算子使用模板和统计差值的方法,使图像增强锐化。图像边缘与高频分量相对应,高通滤波器可以让高频分量畅通无阻,而对低频分量则充分限制,通过高通滤波器去除低频分量,也可以达到图像锐化的目的。
-
-
-
图像复原
-
图像复原研究背景与意义
图像复原是数字图像处理技术的一个重要研究方向, 在现实生活中,有着非常广阔的应用前景和市场。 数字图像处理研究很大部分是服务于数字图像复原的, 而运动模糊图像的复原又是图像复原中的重要课题之一, 从六十年代起就有人研究它。 初期研究的主要原因是对卫星所拍摄的图像进行复原, 因为卫星相对地球是运动的, 所拍出的图像是模糊的(当然卫星所拍摄图像的模糊原因不仅仅是相对运动而造成的,还有其他原因如大气湍流所造的模糊等等) 。美国的喷气推进实验室( JPL)对徘徊者飞行器发回的月球照片进行了图像恢复处理。传统的图像恢复方法可以很好地恢复出来原始图像, 但是需要事先知道系统的先验知识(例如系统的点扩散函数) 。在先验知识不足的情况下,如何恢复出来原始图像?这就需要模糊图像盲恢复技术。根据不同的应用背景和先验知识, 大致可以两种方法恢复两种类型的模糊图像,以满足不同的应用要求。
第一种方法: 如何快速恢复模糊图像, 进行适时性图像处理?这个技术在实际生活中有着广泛应用。
第二种方法:如何在事先不能确定模糊系统点扩散函数的情况下,恢复模糊图像,改善图像的质量,这就是图像盲恢复的问题。 -
图像复原的定义
图像复原即利用退化过程的先验知识,去恢复已被退化图像的本来面目。
-
图像复原的方法
经典的图象复原方法不少,但归纳起来大致可分为逆滤波法,或称相关变换法( inv ersefiltering or t ransfo rm related techniques ) 和代数方法( alg ebraic techniques ) 两种。
-
逆滤波方法
逆滤波法大致有经典逆滤波法、维纳滤波法、卡尔曼滤波法等。其中,在傅立叶变换域,经典逆滤波的变换函数是引起图象失真的变换函数的逆变换,其虽在没有噪声的情况下,可产生精确的复原图象,但在有噪声时,将对复原图象产生严重的影响,虽然滤波函数经过修改,有噪声的图象也能复原,但它仅适用于极高信噪比条件下的图象复原问题;维纳滤波法是通过选择变换函数,同时使用图象和噪声的统计信息来极小化均方复原误差,这虽然在一定程度上克服了逆滤波法的缺点,但是维纳滤波法需要较多有关图象的先验知识,如需要对退化图象进行满足广义平稳过程的假设,还需要知道非退化图象的相关函数或功率谱特性等等,而在实际应用中,要获得这些先验知识有较大的困难,为此,Ozkan等人在研究图象序列的复原问题时,提出了一种解决空间和时间相关性的多帧维纳滤波法,是近年来维纳滤波法的新发展;卡尔曼滤波是一种递归滤波方法,其虽可用于非平稳图象的复原,但是因计算量过大,而限制了其实际应用的效果。Wu和 Kundu又对卡尔曼滤波方法进行了改进,不仅提高了速度,并考虑了应用于非高斯噪声的情况;Cit rin和 Azimi-Sadjadi也对卡尔曼滤波方法进行了改进,提出了块卡尔曼滤波方法;Koch 等提出了扩展卡尔曼滤波(extended Kalmam filter)复原方法,该方法可以较好地复原模糊类型不相似的退化图象 . 除了上述的逆滤波方法外,还有参数估计滤波法,它实质上是维纳滤波法的变种 . 20 世纪90 年代初,又提出了基于递归图象滤波的自适应图象复原方法及合成滤波方法,它代表了滤波方法新的发展方向.1998 年Kundur等人首先明确提出了递归逆滤波( recursive inverse filtering)算法 ,2000 年 Chow 等人又进行了改进,即在代价函数中增加了空间自适应正则化项,从而很好地抑制了噪声,并减少了振铃现象,较好实现了在低 SNR 条件下的盲图象复原 . 2001 年,Eng 等人结合模糊集的概念,提出了自适应的软开关中值滤波方法,它能在有效地去掉脉冲噪声的同时,很好地保存图象的细节,是一种值得重视的新的图象复原方法。
-
代数方法
Andrews 和 Hunt 提出了一种基于线性代数的图象复原方法。这种方法可能比较适合那些相对于积分运算,则更喜欢矩阵代数,而相对于分析连续函数,又更喜欢离散数学的人的口味。它为复原滤波器的数字计算提供了一个统一的设计思路。代数方法可分为伪逆法、奇异值分解伪逆法、维纳估计法和约束图象复原方法等。其中,伪逆法,实质上是根据图象退化的向量空间模型来找到引起图象退化的模糊矩阵,但由于模糊矩阵总是很大的,因此在计算上往往不可行;而奇异值分解伪逆法则是利用矩阵可分解成特征矩阵系列的思想,将模糊矩阵进行分解,由于简化了计算,从而有利于模糊矩阵的估计计算,但在有噪声存在时,经常会出现不稳定的现象;维纳估计法虽然考虑了噪声的情况,但它仅适合噪声是二维随机过程,且已知其期望和协方差的情况。前面的方法仅把图象看成是数字的阵列,然而一个好的复原图象应该在空间上是平滑的,其在幅度值上是正的,而约束图象复原方法就是将这些因素作为约束条件,如基于维纳估计法和回归技术而提出的图象复原方法就是一种约束图象复原方法,而且通过选取不同的约束参数和回归方法可以得到不同的图象复原算法。传统的图象复原算法或面临着高维方程的计算问题,或要求恢复过程满足广义平稳过程的假设,这就是,使得具有广泛应用价值的图象复原问题没有得到圆满的解决的根本原因。
-
-
-
图像压缩
-
图像压缩研究背景与意义
在当前这个信息化社会中,新信息技术革命使人类被日益增多的多媒体信息所包围。多媒体信息主要是由图像、文本和声音三大元素组成。图像作为其主要元素之一,发挥着越来越重要的作用。而传输和存储图像需要占用大量的数据空间,这严重影响了传输速率和实时处理量,极大地制约了图像通信的发展。其中,数据量最大的是数字视频数据。未经处理的数字视频信息需要消耗巨大的存储资源,以主流高清视频为例,在分辨率为1280×720,帧率为30帧每秒的视频应用中,存储一分钟的视频信息,需要约 18.5G(以常 4:2:0 视频,每像素12比特)比特存储空间,一部120分钟高清电影约需要 2225G 比特的存储空间。可见未经处理的视频信息量非常大,为了满足存储和传输需求,视频信息的压缩是十分必要的。在同等的通信容量下,如果图像数据可以压缩之后再传输,就可以使传输的数据量变得很小,也就
能够增加通信能力。因此图像压缩编码技术受到了越来越多的关注及广泛的应用。 如数码相机、USB 摄像头、可视电话、视频点播、视频会议系统、数字监控系统等等,都使用到了图像或视频的压缩技术。 -
图像压缩的定义
数字图像压缩是以尽可能少的比特数代表图像或图像中所包含的信息量的技术, 图像通过压缩处理去掉其中的数据冗余、符号冗余、视觉冗余等各种冗余信息,提高传输速率,节省存储空间。
-
图像压缩的方法
图像压缩有两种基本的压缩方法:一种是有损数据压缩;另一种是无损数据压缩。有损数据压缩一般采用变换编码方法,例如,基于离散余弦变换(dct)的变换编码方法,如jpeg;还有基于小波变换的方法,例如jpeg2000、ezw、spiht 等等。jpeg 是有损数据压缩。通过 dct 变换后选择性丢掉人眼不敏感的信号分量,实现高压缩比率。png 是无损数据压缩中图片压缩常采用的格式,采用lz77派生的无损数据压缩算法。而音频压缩格式fllac、tta和视频压缩格式huffyuv也是无损数据压缩常采用的压缩格式。
-
有损数据压缩
有损数据压缩是一种破坏性压缩。它在压缩过程中,允许有一定信息的失真,但此失真对原图像影响较小,得到一个与原图像相近似的图像,但压缩比却大大提高了。有损数据压缩常用于因特网、流媒体、视频以及电话领域。有损数据压缩方法有色彩空间、色度抽样、变换编码、分形压缩。
-
无损数据压缩
无损数据压缩采用数据的统计冗余进行压缩,使数据通过其压缩后信息没有受到损失,均可还原到压缩前的原样。比如在工程制图、计算机程序、医疗图像、指纹图像等方面此方法得到广泛应用。经常使用的无损压缩方法有shannon-fano编码、huffman编码、游程(run-length)编码、lzw(lempel-ziv-welch)编码和熵编码法等。无损压缩的优势有100%的保存,没有任何信号丢失;音质高,不受信号源的影响;转换方便。无损压缩的不足是缺乏硬件支持,占用空间大,压缩比不高。
-
-
-
图像分割
-
图像分割研究背景与意义
关于图像分割技术,由于问题本身的重要性和困难性,从 20 世纪 70 年代起图像分割问题就吸引了很多研究人员为之付出了巨大的努力。虽然到目前为止,还不存在一个通用的完美的图像分割的方法,但是对于图像分割的一般性规律则基本上已经达成的共识,已经产生了相当多的研究成果和方法。
图像分割是图像分析的第一步,是计算机视觉的基础,是图像理解的重要组成部分,同时也是图像处理中最困难的问题之一。
-
图像分割的定义
所谓图像分割是指根据灰度、彩色、 空间纹理、几何形状等特征把图像划分成若干个互不相交的区域,使得这些特征在同一区域内表现出一致性或相似性,而在不同区域间表现出明显的不同。简单的说就是在一副图像中,把目标从背景中分离出来。对于灰度图像来说,区域内部的像素一般具有灰度相似性,而在区域的边界上一般具有灰度不连续性。
-
传统图像分割的方法
-
基于阈值的图像分割方法
阀值分割法是一种传统的图像分割方法,因其实现简单、计算量小、性能较稳定而成为图像分割中最基本和应用最广泛的分割技术。阀值分割法的基本原理是通过设定不同的特征阀值,把图像像素点分为具有不同灰度级的目标区域和背景区域的若干类。它特别适用于目标和背景占据不同灰度级范围的图,目前在图像处理领域被广泛应用,其中阀值的选取是图像阀值分割中的关键技术。灰度阀值分割方法是一种最常用的并行区域技术,是图像分割中应用数量最多的一类。图像若只用目标和背景两大类,那么只需要选取一个阀值,此分割方法称为单阀值分割。单阀值分割实际上是输入图像 f 到输出图像 g 的如下变换:
![image-20201226115531542]()
在上述表达式中,T为阀值,对于目标物体的图像元素g(i,j)=1,对于背景的图像元素g(i,j)=0。但是如果图像中有多个目标需要提取,单一的阀值分割就会出错。就需要选取多个阀值将每个目标分割开,这种分割方法称为多阀值分割。
阀值分割的结果取决于阀值的选择。由此可见,阀值分割算法的关键是确定阀值。阀值确定后,将阀值与像素点的灰度值比较以及对各像素的分割并行地进行。常用的阀值选择方法有利用图像灰度直方图的峰谷法、最小误差法、基于过渡区法、利用像素点空间位置信息的变化阀值法、结合连通信息的阀值方法、最大相关性原则选择阀值和最大熵原则自动阀值法。
-
基于区域的图像分割方法
基于区域的分割方法是以直接寻找区域为基础的分割技术,具体算法有区域生长和区域分离与合并算法。基于区域提取方法有两种基本形式:一种是区域生长,从单个像素出发,逐步合并以形成所需要的分割区域;另一种是从全局出发,逐步切割至所需的分割区域。
-
基于边缘检测的图像分割方法
基于边缘检测的分割方法试图通过检测包含不同区域的边缘来解决分割问题,它可以说是人们研究的最多的方法之一。通常不同的区域之间的边缘上像素灰度值的变化往往比较剧烈,这是边缘检测方法得以实现的主要假设之一。边缘检测方法一般利用图像一阶导数的极大值或二阶导数的过零点信息来提供判断边缘点的基本依据。边缘检测技术通常可以按照处理的技术分为串行边缘检测和并行边缘检测。串行边缘检测是要想确定当前像素点是否属于检测边缘上的一点,取决于先前像素的验证结果。并行边缘检测是一个像素点是否属于检测边缘上的一点取决于当前正在检测的像素点以及与该像素点的一些相邻像素点。最简单的边缘检测方法是并行微分算子法,它利用相邻区域的像素值不连续的性质,采用一阶或二阶导数来检测边缘点。近年来还提出了基于曲面拟合的方法、基于边界曲线拟合的方法、基于反应-扩散方程的方法、串行边界查找、基于变形模型的方法。常用的一阶导数算子有梯度算子、Prewitt 算子和 Sobel 算子。二阶导数算子有 Laplacian算子、Kirsch 算子和 Wallis 算子。
-
-
IV 数字图像处理的主要应用
图像是人类获取和交换信息的主要来源,因此,图像处理的应用领域必然涉及到人类生活和工作的方方面面。随着人类活动范围的不断扩大,图像处理的应用领域也将随之不断扩大。一下仅选取了几个主要的方面进行阐述。
-
在生物医学中的应用
在医学中,随着数字图像处理技术的渗透. 数字图像将相关的病症呈现出来,
井通过处理技术对画面上相关数据进行处理。 这种医疗手段. 可大幅提升相关病
症的治愈率, 实现更加精准治疗的疗效。 在医学中医学影像广泛用于以下几方面
之中,其中包括CT(计算机X线断层扫描) 、PET(正电子发射断层成像)、MRI(核磁共振影像)以及UI(超声波影像)。数字图像处理技术在技术发展基础上,其应用的范围将会在逐渐得到扩展,应用成效将会进一步得到提升。 -
在航空航天技术中的应用
数字图像处理技术在航空航天中的应用非常广泛,如多光谱卫星图像分析,地形、地图普查,天文探测及分析、卫星遥感图像处理、飞机遥感图像处理及校正等。这些应用推动了灾害检测、农业规划、城市规划、交通规划、气象预报等的快速进步。 如使用遥感技术为森林火险等级预报、及时跟踪火灾发展情况等都提供了有效手段。可以预见,数字图像处理技术在航空、卫星等方面的应用,将随着相关技术的发展而发挥越来越大的作用。
-
在通信工程中的应用
当前通信的主要发展方向是声音、文字、图像和数据结合的多媒体通信。其中以图像通信最为复杂和困难,因图像的数据量十分巨大。要将数据实时传送出去,必须采用编码技术来压缩信息的比特量,编码压缩是这些技术成败的关键。
-
在军事公安中的应用
在军事方面图像处理和识别主要用于导弹的精确末制导,各种侦察照片的判读,具有图像传输、存储和显示的军事自动化指挥系统,飞机、坦克和军舰模拟训练系统等;公安业务图片的判读分析,指纹识别,人脸鉴别,不完整图片的复原,以及交通监控、事故分析等。目前已投入运行的高速公路不停车自动收费系统中的车辆和车牌的自动识别都是图像处理技术成功应用的例子。
-
在工业中的应用
数字图像处理技术在工业工程领域中图像处理技术有着广泛的应用。如模具、零件制造,零件、产品无损检测,流场分析、应力分析,电路板、纺织品质量检查等。在工业自动化方面,可以使用机器视觉系统对生产过程进行监视和控制。此外,交通管制、机场监控、火车车皮识别等均有数字图像处理技术的应用。在工业发展中,具备视觉、听觉和触觉功能的智能机器人已经应用于焊接、装配、喷漆等工序,并将是一个重要发展领域,必将给工业生产带来新的面貌,大大提高工作效率与工作质量,并不断降低人们的工作强度,进一步解放生产力。
V 存在的问题
在近几年数字图像处理技术虽然得到了高速的发展,但是仍然存在一些不足之处。
- 在提高精度的同时着重解决处理速度的问题,巨大的信息量和处理速度仍然是一对主要的矛盾;
- 一些边缘学科例如人的视觉特性、心理学特性研究的突破将带动图像处理技术的发展。
- 还需要开发新的处理方法及加强软件的研究,重点是移植其他学科的技术成果。
- 理论研究已经逐步形成图像处理科学自身的理论体系。
- 建立图像标准子程序和图像信息库,存放统一的格式和检索。图像信息量大,若没有图像处理领域的标准化,图像信息的建立、检索和交流将成为一个极大的问题。
VI 研究趋势
数字图像处理技术的发展方向大致为一下四个方向:
- 朝高分辨率、高速、多媒体、立体化、标准化和智能化方向发展。主要是提高显示分辨率和采集分辨率;提高硬件速度;加强图像的压缩;三维图像将随着虚拟显示技术及计算机图形学的发展得到越来越广泛的应用;实现图像处理技术的统一国际标准;尽量使计算机的理解和识别可以按照人的认识和思维方式进行工作。
- 把图像处理的许多功能固化在一块芯片上,使之方便使用。
- 图像与图形相结合,朝着多维成像的方向发展。
- 新算法及新理论的研究。例如近几年来小波、遗传算法、人工网络等等都被广泛应用于图像处理。
VII 总结和前景展望
在数字图像处理技术已经到达一定程度,融入日常生活为我们提供着方便的同时,我们也不能忘记我国目前的水平较西方发达国家还是有所不如的。前段时间人工智能大战人类围棋大师大获全胜的事实也在向我们展示着西方的先进水平,我们需要进行科学创新研究,投入更多的精力到数字图像技术的发展中,让它在未来小康社会的建设中起更大的作用,更好的服务于人类。

浙公网安备 33010602011771号