1、1毕业设计基于人眼视觉特性的图像增强算法研究2摘 要:利用图像增强技术,可以使图像获得更佳的视觉效果,提高人眼对信息的辨别能力,另一方面,图像增强作为一种预处理技术,能使处理后的图像比原图像更适合于参数估计、图像分割和目标识别等后续图像分析工作。因此,图像增强技术的研究一直是图像处理的一项重要内容。但传统的基于直方图的图像增强方法存在以下几个问题:1)传统直方图灰度级统计量与信息量存在不一致问题;2)传统直方图均衡方法在灰度级调整过程中,没有充分利用视觉敏感区段;3)没有针对图像内容多变特点,自适应地获取灰度级调整的优化配置参数。针对上述问题本文展开以下几个方面研究:首先,针对传统直方图对图像
2、信息的描述存在不足,本文提出了一种新的基于视觉注意机制的灰度级信息量直方图构造方法。这种新的直方图在灰度级统计过程中同时考虑各灰度级数量和空间分布情况,采用视觉注意机制计算模型测算出不同位置灰度级的重要性(或显著性) ,并依据各像素灰度级的重要性进行加权统计,使得统计结果可以客观反映各灰度级对图像信息刻画所起的作用。其次,在灰度级调整过程中考虑人眼视觉感知的非线性特性,并针对其特点提出了将不同比例的灰度级信息量分配至不同的视觉敏感度区段。其分配原则遵循敏感度大的区段分配较多的信息量,同时为避免主导灰度级在直方图拉伸处理中占用较大范围的灰度级空间,本文利用人眼感知能力曲线约束主导灰度级动态范围。
3、最后,由于图像内容存在多变的特点,为了获取更好的图像增强效果,有必要对各视觉敏感度区段的信息量分配比例做一定的调节,为此本文提出了依据图像增强质量客观评估算法的分析结果,自适应地获取最佳调节参数。图像增强质量客观评估算法是依据视觉感知模型设计的,大量测试结果表明,客观评估算法的分析结果与主观评估结果基本吻合。关键词:图像增强;视觉注意机制;人眼调制传递函数;临界可见偏差;图像质量评价1 引言1.1研究背景及意义在一个图像系统中,从图像的获取,到图像的发送、传输、接收、输出(显示) 、复制等等,每一个环节都会产生干扰,都会使图像质量降低,不能很好的贴合人眼直接观察到的图像。例如,摄像时,由于光学
4、系统失真、相对运动、大气湍流等都会使图像模糊;医学上,由于受到人体的器官、组织、光照等各个方面的影响,拍到的照片总是不尽人意,很难识别病变组织与正常组织,做出早期诊断。因此,如何对这些“降质”图像或受到噪声污染的质量不太满意的图像进行处理,以符合人们的要求,例如尽可能恢复原貌,改善图像的视觉效果,突出有用的目标等,具有广泛的应用前景和工程价值。这也是图像处理的一般要求。图像增强是一种常用的图像处理方法,其目的是将图像中感兴趣的部分尽可能突现出来。例如一幅侦察图像甚至有可能是经过各种欺骗和伪装后的侦察图像,在这类图像中,目标和背景可能混淆不清,很难区别。如何3从中识别出人们感兴趣的目标,如机场、
5、跑道、飞机、建筑物等,就需要进行增强处理。图像增强处理的应用已经渗透到医学诊断、航天航空、军事侦察、指纹识别、无损探伤等领域。例如:(1)在医学应用当中的血管造影技术,由于心脏的剧烈运动,并且是非刚体运动,造成影像图与原始血管图的匹配非常困难。如果能够先对造影图像进行增强滤波处理,可以去除非感兴趣器官(如肌肉、骨骼等)对 X 射线吸收形成的背影图像,则有利于提高医生临床诊断的准确性。对 X 射线图像、CT 图像、内窥镜图像等进行增强,使医生更容易从中确定病变区域。(2)红外技术在军事及人们日常生活中有着越来越广泛的应用。由于红外探照灯以及红外探测器件的限制,红外成像系统的成像效果不够理想。在民
6、用监测应用中,主要表现在夜视距离近,图像特征信息不明确等方面。为使夜视距离达到监测要求并使图像更适合于人眼观测、适用于图像后续目标识别及跟踪处理,有必要对红外图像低照度采集来增长主动式红外夜视系统的夜视距离,对图像进行增强及目标分割处理来增强红外图像视觉效果。(3)在航天遥感和航空遥感应用中,由于遥感图像的获取平台高,很容易受到自然因素的影响,尤其是可见光波段,如天气、云雾等都能使图像质量下降,因此获得的图像有的会出现对比度低、图像模糊等现象;有的图像总体视觉效果较好,但是对所需信息,如边缘部分或线状物不够突出;还有的图像波段数据量大,例如 TM 图像,而且各波段之间存在一定的相关性,为进一步
7、处理造成困难。所以,可通过图像增强技术,改善图像质量,提高图像目标视觉效果,突出所需要的信息,压缩图像数据量,为进一步的图像分析判读做好预处理工作。(4)在煤矿工业电视系统中采用增强处理来提高工业电视图像的清晰度,克服光线不足、灰尘等原因带来的图像模糊、偏差等现象,减少电视系统维护量。总之,图像增强技术的快速发展同它广泛的应用是分不开的,发展的动力来自不断涌现的新的应用,可以预料,在未来社会中,图像增强技术将会发挥更XX 大 学 XX 学 院 201X 届 XXXX 专 业 毕 业 设 计4大的作用。1.2 图像增强的研究现状图像增强的主要目的是改善图像的视觉质量。对于一幅给定的图像,图像增强
8、可以根据图像的模糊情况和应用场合,采用某种特殊的技术来突出图像中的某些信息,削弱或消除某些无用的信息,从而有目的的强调图像的整体或局部特征 。经过多年研究,图像增强技术已经取得了长足的进步,到目前为止,已经形成了多种理论算法。目前常用的增强技术根据其处理所进行的空间不同,可分为基于空间域(图像域)的方法和基于频率域(变换域)的方法两种。其中空间域增强方法包括点处理和模板处理两种,点处理增强常用的方法有:直接灰度变换、直方图处理、图像间运算等等,模板处理增强常用的方法有:线性平滑滤波、非线性平滑滤波、线性锐化滤波和非线性锐化滤波等;频域增强方法有低通滤波、高通滤波、带阻滤波、同态滤波等。低通滤波
9、能够平滑图像,将像素灰度值突变的细节滤掉;而高通滤波能够增强图像,保留像素突变的细节。经典的空间域和变换域增强方法都可以在绝大多数“数字图像处理”教材中找到,为此不再赘述。以下将介绍空间域和变换域一些较新的研究进展。1.2.1 基于直方图处理的图像增强算法由于直方图数据描述简单,操作简便,且易于编程实现,因此在图像处理、模式分析与识别等多个领域得到了广泛的应用。以直方图为基础的增强算法研究是空间域算法的主流研究方向。研究人员在直方图基础上,结合不同的应用对象和分析要求,提出了多种增强算法,这些算法主要分为两大类:全局直方图算法和局部(自适应)直方图算法。全局直方图均衡(Global Histo
10、gram Equalization, GHE)是全局算法中的代表性成果,其基本思想是依据直方图的统计结果,相应地分配灰度级的动态范围。虽然这种算法的增强效果并不是最优的,但这种直方图均衡的增强思想却被其它算法广泛采用。当图像的灰度级级数较多,且分布较均匀时,GHE 算法的增强效果不明显,针对以上问题,Pizer 等人将 GHE 算法推广应用于图像的局部分析,提出了局部自适应直方图增强算法(Adaptive Histogram Equalization,AHE) 。AHE 算法是依据像素局部邻域的直方图统计结果,确定该像素灰度级映射值,使局部XX 大 学 XX 学 院 201X 届 XXXX 专
11、 业 毕 业 设 计5对比度明显拉伸,然而该算法计算复杂度太大、对噪声敏感、平滑区过增强等问题较为突出。针对这些问题,很多学者提出了多种改进的方案。自适应算法主要是依据图像的局部信息进行调整,这使得某些所占空间区域较大的物体表面形态发生了较大的变化。为了克服以上问题,Caselles 等人提出了保形对比度增强方法(Shape Preserving Contrast Enhancement,SPCE) 。算法采用局部直方图均衡算法来增强对比度,同时保持图像的水平集(Level-sets)不变,从而使增强后图像中的物体区域形状保持不变。以上算法都是在不改变直方图统计方式上做出的,但由于传统直方图存
12、在明显缺陷,即完全丢失了像素的位置信息,使得这些算法的性能受到了一定程度的影响。后面将对传统直方图数据描述方式的局限性进行深入地分析。1.2.2基于多尺度分析的图像增强方法近年来在变换域算法研究方面也取得了一些可喜的进展,其中较为突出的是基于多尺度分析的增强算法。多尺度分析又称为多分辨率分析,它是由Mallat 首先提出来的。近几年来,以小波变换为代表的多尺度分析方法备受科学技术界的重视,它不仅在数学上已经形成一个新的分支,而且在应用上,如信号处理和图像处理,被认为是近年来分析工具及方法上的重大突破。原则上讲,凡传统使用傅里叶分析的方法都可以用小波分析来代替。小波分析在时域和频域上都具有很好的
13、局部特性,而且由于对高频信号采取逐渐精细的时域或空域步长,从而可以聚焦到分析对象的任意细节。在图像处理和计算机视觉中,通常要进行分析和识别的图像结构有着不同的大小,一般情况下不能事先定义一个分析图像的最优分辨率,因此采用多分辨率分析将原始图像分为不同分辨率上的几个信号,然后选择合适的分辨率或同时在各级分辨率上处理这个信号,从而达到多尺度分析的目的,利用这些不同分辨率上的信号,重构的信号就能够在一些方面表现出比原始信号更好的性能。近几年来使用多尺度分析思想来增强这些图像已经引起众多研究者的关注,并且在理论和应用上取得了一些有价值的结果。最近,一种自适应的图像去噪、保留并增强边缘信息的方法已经被
14、Jung 等人提出。这种方法使用冗余的小波变换将图像进行多分辨率分解,在每一级分辨率上,把对应噪声和边缘的小波系数用 Gaussian 函数建模,然后采用一种软XX 大 学 XX 学 院 201X 届 XXXX 专 业 毕 业 设 计6阈值的方法,即小波收缩(Wavelet Shrinkage) ,处理这些系数,在考虑了保留边缘的几何约束后,用这些处理过的小波系数进行重构就可以获得具有很好增强效果的图像。为了验证这种方法的有效性,Jung 对具有严重噪声污染的Lena 图像、监控图像和自然场景图像进行了增强处理,结果表明这种方法是有效的。基于多尺度分析思想的图像增强方法主要应用的场合通常是一些
15、特殊图像,如医学图像、卫星遥感图像、纹理图像和严重噪声污染的图像等。这些方法的基本思想都是将图像先进行分解,然后对分解后的图像进行处理,最后重构图像,从而达到某种处理效果。但以上算法面临的主要问题是很难确定合适的分析尺度及不同尺度下的最优调节参数。目前尚无统一的衡量图像增强质量的通用标准。在图像增强的方法使用上,可以使用一种增强方法,也可以使用多种方法混合使用,只要达到需要的效果即可。1.3 研究内容和目的直方图均衡化依据各灰度级的统计量相应地调整图像的灰度值动态范围,即拉大统计量较大的灰度级级差,达到图像增强的目的。但这类方法存在三个主要的缺陷:1)传统直方图灰度级统计量与信息量存在不一致问
16、题;2)传统直方图均衡方法在灰度级调整过程中,没有充分利用视觉敏感区段;3)没有针对图像内容多变特点,自适应地获取灰度级调整的优化配置参数。首先,在直方图均衡化处理过程中,灰度级直方图只是简单地数量上的统计,而丢失了灰度级的位置信息,使得统计结果无法客观反映各灰度级对刻画图像信息所起的作用,即出现灰度级统计量与信息量不一致问题。比如,在图像的平滑区或背景区内某些灰度级的统计值虽然很大,但这些灰度级所刻画的信息却很少(或很简单) 。因此本文提出一种新的基于视觉注意机制的灰度级信息量直方图构造方法。该直方图综合考虑灰度级的个数和空间分布,并在灰度级统计过程中注重保留重要信息区的灰度级统计量,同时削
17、弱平滑区或背景区XX 大 学 XX 学 院 201X 届 XXXX 专 业 毕 业 设 计7的统计量,使得统计结果可较好地反映各灰度级对刻画信息所起的作用。另外,传统的直方图均衡化方法是在假定不同的灰度级的视觉敏感度一样的基础上进行的,但研究发现,人眼视觉系统的感知特性是非线性的,即在不同的灰度级范围内,视觉敏感度是不同的,在暗区,敏感度低,在亮区,敏感度高,因此传统的直方图均衡化方法在分配信息时没有充分利用视觉敏感度。为解决这个问题,本文把灰度级按照视觉感知特性分为三个部分:最弱感知区、最强感知区及次强感知区,同时把图像中大量信息区的灰度级分配在最强感知区,把含有少量信息的区域的灰度级分配在
18、最弱感知区及次强感知区,但次强感知区分配到的信息量要比最弱感知区多,这样可以拉伸图像的灰度层次,提高图像的对比度,使增强后的图像获得满意的视觉效果。由上一段得知,需要把直方图划分为三个区域,即大量信息区与两个少量信息区,信息区的划分,尤其是最大信息区与最小信息区的划分,不能总是依靠人眼,这样算法移植性不高,而且由于图像信息分布的多样性,也不能固定阈值,比如,有的图像灰度级较多且分布较均匀,则阈值不能太小,因为如果分配到最强感知区的信息量太多,则会有大量的信息分享有限的灰度级空间,导致小于人眼感知能力曲线的信息量增加,反而不利于感知图像;有的图像灰度级较少,这时阈值不能太大,因为本文期望能把大量
19、信息尽可能的分配在最强敏感区及次强敏感区,也就是在不损害且充分利用最强感知区信息的情况下,把尽可能少的信息分配给最弱感知区。为了自适应的获取使图像增强效果最佳的阈值,本文根据视觉感知模型设计了一个简单有效的图像增强质量客观评价算法,该算法除了能对增强效果进行评价,也可以对参数进行自适应调节,从而获得最佳调节参数。2 人眼视觉系统概述图像信息是通过人的视觉来接收的。在实际应用中,许多图像处理与分析的目的就是改善图像的视觉效果或处理后以便于人们对图像的分析,所以了解人的视觉系统特性及视觉信息处理特性在观察图像或判读图像时的某些现象和特性是有必要的。视觉是人类的主要感觉来源,人类认识外界信息中 80
20、%来自XX 大 学 XX 学 院 201X 届 XXXX 专 业 毕 业 设 计8视觉。视觉器官“眼睛”接受外界的刺激信息,而大脑对这些信息通过复杂的机理进行处理和解释,使这些刺激具有明确的物理意义。视觉系统是一个复杂的完善的信息获取和分析系统,它涉及许多学科,但目前尚有许多感知机理仍不清楚,这也是阻碍图像处理发展的重要原因。因为现有的大多图像处理算法都或多或少地引入了人眼视觉系统,为便于理解,本章首先就人眼构造及光学特性、人眼视觉感知系统作简单介绍。人眼构造及其光学感知特性人眼的结构和照相机相似,如图 2.1 所示。眼睛的前部为一圆球,其平均直图 2.1 人眼的构造径为 20mm 左右,它由
21、三层薄膜包着,即角膜和巩膜外壳、脉络膜和视网膜。它的正前方六分之一是透明的角膜,角膜是一种硬而透明的组织,它盖着眼睛的前表面,巩膜与角膜连在一起,巩膜是一层包围着眼球剩余部分的不透明的膜。脉络膜位于巩膜的里边,这层膜包含有血管网,它是眼睛的重要滋养源,脉络膜外壳着色很重,因此有助于减少进入眼内的外来光和眼球内的回射。在脉络膜的最前面角膜的后面被分为睫状体和虹膜。虹膜中间有一小圆孔称为瞳孔。XX 大 学 XX 学 院 201X 届 XXXX 专 业 毕 业 设 计9在虹膜环状肌的作用下,瞳孔的直径可在 28mm 间调节,从而控制进入人眼的光通量,起到照相机光圈调节的作用。瞳孔后面是一扁球形的弹性
22、透明体,称为晶状体,相当于照相机镜头的作用。它在睫状肌的作用下,可以调节曲率改变焦距,使不同距离的景物可以在视网膜上成像。当晶状体的折射能力由最小变到最大时,晶状体的聚集中心与视网膜之间的距离约由 17mm 缩小到 14mm。当眼睛聚集到远于 3m 的物体时,晶状体的折射能力最弱,当聚集到非常近的物体时,其折射能力最强。眼睛最里层的膜是视网膜,它布满在整个眼球后部的内壁上,当眼球适当聚集时,从眼睛的外部物体来的光就在视网膜上成像。整个视网膜表面上分布的分离的光接收器造成了图案。这种光接收器可分为两类:锥状体和杆状体。锥状细胞的直径为 26 m,长约 40 m,有 500 万个。它们主要位于视网
23、膜的中间部分,叫做中央凹,即黄斑区,它们主要是在强光下检测亮度和颜色信息。每个锥状细胞连接着一个视神经末梢,因此黄斑区的分辨率极高,从而使人所感兴趣物体的像落在视网膜的中央凹上,这样人们利用这些锥体细胞就能充分地识别图像的细节,形成人眼的明视。在视网膜的其他部分分布着杆状细胞,直径约 27004 m,长约 60 m,共有 750015000 万个。由于分布面积较大且多个杆状细胞与一个视觉神经末梢相连,使接收器能够识别细节的量减少了,即对细分辨率较低,只能给出视野中一般的轮廓,形成人眼的暗视。它们能在弱光下检测亮度信息,但没有色彩的感觉。例如,在白天呈现鲜明颜色的物体,在月光下却没有颜色,这是因
24、为只有杆状细胞受到了刺激,而杆状没有色彩的感觉。视锥细胞和视杆细胞统称视细胞。图 2.2 表示视细胞在视网膜上的分布情况。以眼球水平方向上的圆周角作为水平距离的度量,黄斑中心在鼻侧的地方是视神经的汇聚点,没有视细胞就形成“盲点” 。对于落入盲点的图像人眼无法看到。XX 大 学 XX 学 院 201X 届 XXXX 专 业 毕 业 设 计10图 2.2 视细胞在视网膜上的应用从生理学角度看视觉有以下显著特性:(1)分辨率人眼对于不同空间细节的分辨能力是变化的,视觉空间频率响应具有带通滤波器的性质,高频端的灵敏度要低于低频端的灵敏度,对高频区域的噪声或失真也不太敏感。(2)同时对比度由于人眼对亮度
25、有很强的适应性,因此很难精确判断刺激的绝对亮度。即使有相同的亮度,由于其背景亮度不同,人眼所感受的主观亮度是不一样的。(3)对比灵敏度实验表明,人眼辨别亮度差的能力是同周围环境以及照度本身的大小有关,即视觉对亮度偏差的敏感程度随背景亮度变化呈非线性变化,总的来说在高亮度背景区人眼对亮度偏差的辨别力相比在低亮度区要强。把主观上可识别的最小亮度差称为亮度的可辨别阈值。(4)视觉掩蔽效应当存在多个刺激量时,它们之间会相互干扰,导致视觉阈值的变化,它有多种表现形式,人眼对损伤的敏感度在非常亮或者非常暗的区域会下降,在图像空间域变化大的区域会比变化小的区域低。2.2 人眼视觉感知系统2.2.1 视觉信息传递过程XX 大 学 XX 学 院 201X 届 XXXX 专 业 毕 业 设 计