1、兰州交通大学毕业设计(论文)- 1 -内容摘要人脸识别是人类视觉最杰出的能力之一,它的研究涉及模式识别、图像处理、生理,心理学、认知科学,和基于其它生物特征的身份鉴别方法以及计算机人机感知学交互领域都有密切联系其中人眼的识别是计算机人脸识别和智能监控中的重要部分。本文所研究的人眼识别对象都是针对单人正面或半侧面图像。该文提出了一种基于最大类间方差阈值分割和灰度积分投影技术的眼睛定位方法。首先通过图像预处理技术中的中值滤波方法去除图像噪声,并通过非线性变换消除人脸图像因为曝光条件不同而造成的模糊,得到灰度分配较为均匀的图像,然后利用最大类间方差阈值法对图像进行二值化处理,将特征点从人脸图像分割出
2、来,并分别利用水平和垂直灰度积分投影曲线结合人脸的结构特征找到眼睛的位置坐标,实现了准确的眼睛定位,从而为进一步提取其它特征点打好了基础。关键词: 特征提取;眼睛定位;积分投影;阈值分割兰州交通大学毕业设计(论文)- 2 -AbstractComputer face recognition is a very active area of research in recent years. Its applications range is very wide, such as identity authentication in safety system, video surveillan
3、ce, target identification and tracking, as well as facial expression analysis, age analysis, lip reading and so on. compared with mouth and nose, Eyes are the most significant features of the face. which can provide more reliable, more important message, so eye detection is often necessary to dispos
4、e in face recognition. An algorithm for eyes location is presented in this paper based on maximum variance between two classes and gray- level integration projection. First, median filter is used to eliminate the noise, then the image blur caused by deficient exposal is cleared up using non - linear
5、 transform. Maximum variance between two classes is provided to get the binary image, and then the features are extracted from the image. Finally, by the way of gray-levelinte gration projection and human face configuration, we can easily find that the location of eyes is determined by the coordinat
6、e of the minimum in the diagram. Further feature detection can be done based on this result.KEYWORDS: Feature extraction; Eye location; Integration projection; Threshold segment兰州交通大学毕业设计(论文)- 3 -目 录目 录 .3第一章 绪 论 .41.1 课题的背景和意义 .41.2 论文的主要内容 .7第二章 图像预处理基本知识 .92.1 图像灰度变换 .92.1.1 图像的灰度化 .102.1.2 图像灰度求
7、反 .112.1.3 图像灰度拉伸 .122.2 图像平滑去噪 .132.2.1 概述 .132.2.2 图像噪声分类 .132.2.3 图像系统噪声的特点 .142.2.4 均值滤波 .152.2.5 中值滤波 .162.3 直方图均衡化 .172.4 图像二值化 .19第三章 人眼定位算法 .223.1 算法流程 .223.2 人脸识别的常用方法 .243.3 投影法原理 .243.4 人眼左右边界的判定 .253.5 眉眼区域的判定 .263.6 眉眼区域的处理 .273.7 眼睛的精确定位 .28第四章 检测结果与分析 .29第五章 总结与展望 .305.1 总结 .305.2 算法的
8、改进与前景 .31参考文献 .32致 谢 .33兰州交通大学毕业设计(论文)- 4 -第一章 绪 论本章主要介绍了本文的研究背景和研究的意义,以及对本文的研究内容和各个章节的安排进行了介绍。1.1 课题的背景和意义人脸检测(Face Detection)是指在输入图像中确定所有人脸 (如果存在)位置与大小。人脸检测系统的输入是可能包含人脸的图像,输出是关于图像中是否存在人脸以及人脸的数目、位置、尺度、姿态等信息的参数化描述。检测任务的完成涉及从复杂的背景中分割、抽取、验证人脸区域和可能要用到的人脸特征(如眼角、嘴角等),成功的人脸检测系统应能处理实际存在的光线、人脸方向和离照相机距离变化等各种
9、不同情况。人脸检测作为人脸信息处理中的一项关键技术,近年来成为模式识别与计算机视觉领域内一项受到普遍重视、研究十分活跃的课题。人脸检测问题的提出最早可以追溯到早期的人脸识别研究中对人脸定位的需求。一个完整的人脸自动识别系统至少要包含两个主要的技术环节:人脸的检测和人脸的特征提取与识别。人脸检测是自动人脸识别系统中的一个关键环节,但是早期的人脸识别研究主要针对具有较强约束条件的人脸图像(如无背景人脸图像等),往往假设人脸位置己知或很容易获得,因此人脸检测问题未引起研究者的充分重视。近几年来,电子商务等网络资源的利用使得人脸识别成为最有潜力的生物身份验证手段,在这种应用背景下,要求人脸自动识别系统
10、能够对一般环境图像具有一定的适应能力,由此所面临的一系列问题使得人脸检测作为一个独立的课题受到研究者的重视。今天,人脸检测的应用背景己经远远超出了人脸识别系统的范畴。随着网络技术和桌上视频的广泛采用,图像捕捉设备正在成为个人计算机的标准外设,为视频会议等服务所急需的技术 基于内容的压缩与检索成为一个研究热点。人脸的检测是进行人脸压缩的前提条件,同时人脸也是基于内容检索的重要对象,因而人脸检测在这个领域中占有重要的地位。此外,人脸检测在智能化人机界面、视觉监测、数字视频处理等方面也有着重要的应用价值,这使得人脸检测的研究倍受关注。下面对人脸检测的一些应用领域做些简要的介绍:兰州交通大学毕业设计(
11、论文)- 5 -(1) 基于内容的视频检索随着因特网上应用的迅速增长,图像、视频、语音等多媒体信息的使用日益广泛,其数量也迅速膨胀起来。尤其是视频这种媒体,集成了影像、声音和文字,是一种综合媒体。它的非结构化的本质决定了传统的浏览和检索手段不适用于这种媒体。基于内容的多媒体信息检索就是在这样的背景下提出的,并成为多媒体研究领域的一个热点。视频结构单元通常可以看作两层:镜头和场景。镜头是由相互关联的连续的视频组成。它描绘同一个场景,对应摄像机一次记录的起停动作,代表一个场景中时间和空间上连续的动作。在高层的内容分析、索引和分类中,镜头是基本的单元。场景包含有多个镜头,针对同一批对象,但拍摄的角度
12、不同,传达的含义不同。经过分析视频结构单元间的关系建立视频内容语义进而形成有效的视频内容索引,这是支持有效的基于内容的视频检索的关键。显然,只有实现基于语义层次上的检索,结果才能接近用户所要检索内容的要求,所得的结果才能和用户对视频内容的表述一致,比如要检索“有乔丹参加的篮球比赛”的电视节目。而对视频图像中的特定对象(如人或轿车等)的分析是形成语义结果的基础。(2)有关 MPEG-7 标准为解决对多媒体信息描述的标准问题,国际运动图像专家组于 2001 年,发表了国际标准 MPEG-7,其全称为“多媒体内容描述接口” ,其目标就是制定一组标准的描述子及其描述模式( 定义描述子的结构和相互关系)
13、,内容描述与媒体内容结合,使用户能够快速准确地进行检索。它不是针对特定应用的,而是提供了灵活且可扩展的视听内容描述框架以实现各种传输媒体的共享访问和交换、强调基于内容的交互性、可重用性、可伸缩性。除此之外,人的面部表情、性格特征也是 NPEG-7 的数据类型之一。另外,MPEG-7 标准组织已经建立了人脸识别草案小组,人脸检测算法也是一项征集的内容。(3)基于内容的图像检索现在许多应用都集成了大规模的图像库,而且是其中的重要部分。基于内容的图像检索本质上是基于相似性的检索,最好是利用图像本身的特征,从所有的图像中找出与查询者要求最接近的一批图像。现在可资利用的相似性有全局颜色的相似性,形状的相
14、似性,纹理的相似性等。而基于目标的相似性应该说是很有效的方法。比如,兰州交通大学毕业设计(论文)- 6 -原本要检索一个有关小女孩方面的图像,检索的结果却给出一些风景或建筑方面的图像,就说明系统的检索能力和效率还急需提高。(4)视频监视在一些安全监控部门,需要摄像机把周围的环境及其变化记录下来。如果有人在活动,这时更关心目标的人脸的方向和位置,而不是服饰等次要因素,以便辨认和事后检查。这就需要为摄像机提供视野内进行自动跟踪的能力。人脸的检测和跟踪是这类应用的关键部分。(5)媒体压缩的需要为了节约存储空间和传输带宽,应保证人们最为注意和敏感的目标有尽可能小的失真,而对背景进行尽可能大的压缩。多数
15、情况下,人的活动和面部表情成了关注的焦点。这是人脸检测和分割成为研究热点的原团之一。(6)虚拟现实和电子娱乐如果让电子游戏中的角色能感知游戏参与者的头部的动作和面部表情的变化,将大大增强参与者的参与感和真实感。(7)人脸识别由于人脸识别不干扰使用者,不侵犯使用者的隐私,属于非侵犯性的主动识别,易于为用户所接受,而且成本也不高,因此人脸识别成为最有潜力的生物身份验证手段。人脸识别有两种主要的应用:1.身份鉴定(一对多的搜索 ):在鉴定模式下,确定一个人的身份,识别技术可以快速地计算出实时采集到的人脸数据与人脸数据库中所有己知人员的人脸特征数据之间的相似度,给出一个按相似度递减排列的可能的人员列表
16、,或简单地返回鉴定结果(相似度最高的)和相对应的可信度。身份确认(一对一的比对):即所声明的身份是否与证件上所存的持证人的人脸特征数字编码相符。在确认模式下,人脸特征面纹数据5可以存储在智能卡中或数码记录中,这种应用只需要简单地将实时采集的人脸数据与存储的相比对,如果可信度超过一个指定的阈值,则比对成功,身份得到确认。其应用领域还包括很多方面,比如银行业务、智能卡、访问控制、人机交互界面等等。如果人脸检测作为能适应多种环境图像的技术,精度和效率都有了较大的提高,那么在此基础上再分析人脸的形状等特征,且能消除非相关因素的干扰,结果人脸识别的可靠性和正确率会相应的得到提高。就是说,人脸检测技术的难
17、度和重要意义是不能忽视的。人脸检测的研究受到重视,不仅因为它在基于人脸的身份验兰州交通大学毕业设计(论文)- 7 -证、视觉监视以及丛于内容的检索等方面有着重要的应用,人脸检测研究还具有重要的学术价值。 人脸是一类具有相当复杂的细节变化的自然结构目标,此类目标的检测问题的挑战性在于:(1)人脸由于外貌、表情、肤色等不同,具有模式的可变性;(2)一般意义下的人脸上,可能存在眼镜、胡须等附属物;(3)作为三维物体的人脸的影像不可避免地受由光照产生的阴影的影响。因此,如果能够找到解决这些问题的方法,成功构造出人脸检测与跟踪系统,将为解其它类似的复杂模式检测问题提供重要的启示.目前,国外对人脸检测问题
18、的研究很多,比较著名的有 MIT,CMU 等;国内的清华大学、北京工业大学、中国科学院计算技术研究所和中国科学院自动化研究所等都有人员从事人脸检测相关的研究.而且,MPEG7 标准组织已经建立了人脸识别草案小组,人脸检测算法也是一项征集的内容.随着人脸检测研究的深入,国际上发表的有关论文数量也大幅度增长,重要国际会议上每年都有大量关于人脸检测的论文,占有关人脸研究论文的近 1/3 之多.有关人脸检测的内容在人脸识别研究的综述中有所涉及,但仅仅侧重于人脸识别系统的输入环节,目前较为详尽的人脸检测与跟踪综述为文献,着重于介绍各种方法所使用的特征和模型。1.2 论文的主要内容人脸由眼睛、鼻子、嘴巴、
19、下巴等器官构成,正因为这些部件的形状、大小和结构上各种差异才使得世界上每个人脸千差万别,因此,对这些器官的形状和结构关系的几何描述,可以作为人脸识别的重要特征。几何特征提取即是用适当的方法对眼睛、鼻子、嘴巴、下巴等器官的形状、大小和结构关系进行几何描述,例如眼睛、鼻子和嘴的位置和宽度,眉毛的厚度和弯曲程度等,以及这些特征器官之间的关系。其中眼睛这一器官有着举足轻重的作用,对眼睛进行几何描述势必先要找到眼睛的位置,即要先进行眼睛定位。而且只要眼睛被精确定位,则脸部其他器官,如眉、鼻、嘴等,可由潜在的分布关系比较准确地定位。在人脸正面图像识别过程,不管是利用人脸的全局特征还是局部特征,是采用图像的
20、几何特征,还是图像的代数特征,人脸方位的变化对识别的结果都有显著的影响,所以在特征提取前必须先对人脸图像进行预处理,如对人脸方位进行调整使其规范化;对人脸图片的拍摄距离进行归一化。在人脸方位调整中对眼睛的准确定位是必不可少的步骤,这是因为两眼中心间距受光照或表情变化的影响最小,双眼中心连线的方向随人像的偏转,可以作为图像旋转的依据。而且若以两眼之间的距离对抽取的各个特兰州交通大学毕业设计(论文)- 8 -征值进行归一化,则这些特征值具有平移、旋转和尺度上的不变性。计算机人脸识别是近年来非常活跃的研究领域。它的应用范围很广,如安全系统中的身份认证、视频监控中目标的识别与跟踪,以及表情分析、年龄分
21、析、唇读、智能计算机中的人机交互等。可以从不同的角度对人脸检测问题进行分类。从人脸姿态的角度,可以分为正面人脸检测、多姿态人脸检测。从人脸个数是否己知的角度,可以分为已知人脸个数的人脸检测、未知人脸个数的人脸检测。从图像背景复杂程度的角度,可以分为简单背景(指无背景或背景的特征被严格约束,在该条件下只利用人脸的轮廓、颜色、运动等少量特征,就能够进行准确检测)、复杂背景(指背景的类型和特征不受约束,某些区域可能在色彩、纹理等特征上与人脸相似,必须利用较多的人脸特征才能做到人脸的准确检测)。从图片是否包含彩色信息的角度,可以分为彩色图片的人脸检测、灰度图片的人脸检测。从图片是否是动态的角度,可以分
22、为在静止图象中检测人脸、在视频图像序列中检测跟踪人脸。人眼作为人脸最显著的特征,与嘴、鼻相比较,能够提供更可靠、更重要的信息,因此往往是人脸识别中必要的处理对象。本文主要讨论在静止灰度单人图像中人眼检测的问题。要进行人眼的识别,首先要进行人脸的识别与定位。人脸识别方法大致有如下几类:一是通过主分量分析法训练和检测人脸,即特征人脸方法。这类方法定位准确,但算法复杂,计算量大。二是通过颜色分析进行肤色检测来定位人脸。此类方法针对彩色图像,利用面部皮肤的颜色特性建立一个新的颜色坐标系,通过从图像中分离出肤色来实现对脸部的定位。此类方法对光照敏感,且无法适用于灰度图像。三是变形模板类方法。该类方法用椭
23、圆近似地表示头部轮廓,通过迭代求精。其缺点是收敛速度慢,运算时间长。另外,还有人使用神经网络方法检测人脸,其缺点同样是计算量太大,无法达到弱实时的要求。有的快速人脸检测方法是灰度投影方法,其中是对图像做水平灰度投影,因为背景及人着装的干扰,给人脸定位造成困难;对彩色图像的红色分量做垂直灰度投影,但直接使用最大和最小梯度值作为界定人脸左右边界的条件,在复杂背景下往往会造成误判。确定人脸之后,再进行人眼的识别。人眼的识别有边缘特征分析法、Hough变换法和变形模板法等。变形模板法能够准确地确定人眼形状及大小,但存在收敛速度的题;Hough变换法检测瞳孔的圆形特征或眼睑形成的椭圆特征,所需计算量大。
24、本文所采用的方法是一种新的人眼定位方法。使用中值滤波和直方图均衡方法去除噪声和光照对图像的影响后,将图像做积分投影以缩小到人脸的眼部区域,在得到的眉眼区域中再做一次水平积分投影,找到两眼的垂直位置。最后利用兰州交通大学毕业设计(论文)- 9 -人眼模板沿着该垂直方向进行匹配程度最高的部分即为要定位的人眼位置。第二章 图像预处理基本知识本章主要介绍了数字图像处理的相关知识,为下一章进行人眼检测算法提供了理论基础。2.1 图像灰度变换当图像受到CCD 摄像系统的影响,受到摄像机周围环境的影响,受到成像时曝光不足或过度的影响,以及受到成像设备的非线性,或图像记录设备动态范围太窄的影响,都会出现对比度
25、不足,使图像中的细节分辨不清。另外,自然图像由于其灰度通常分布在较窄的区间,也会引起图像细节不清楚。对CCD 摄像系统获取的图像,进行直方图变换,可使图像的灰度间距拉开或者使图像的灰度分布图像的灰度变换处理是图像增强处理技术中一种非常基础、直接的空间域图像处理方法,也是图像数字化软件和图像显示软件的一个重要组成部分。灰度变换是指根据某种目标条件按一定变换关系逐点改变原图像中每一个像素灰度值的方法。目的是为了改善画质,使图像的显示效果更加清晰。灰度变换有时又被称为图像的对比度增强或对比度拉伸。从图像输入装置得到的图像数据,以浓淡表示,每个像素与某一灰度值相对应。设原图像的灰度值 ,处理后图像像素
26、的灰度值 ,则灰度增强可表示为:yxfD, yxfD(2.1)fTyxg,或 要求 和D 都在图像的灰度范围之内。函数T( D) 称为灰度变换函数,T它描述了输入灰度值和输出灰度值之间的转换关系。一旦灰度变换函数确定,则确定了一个具体的灰度增强方法。图像中每一点的运算就被完全确定下来。灰度变换函数不同,即使是同一图像也会得到不同的结果。选择灰度变换函数应该根据图像的性质和处理目的来决定。选择的标准是:经过灰度变换后,像素动态范围增加,图像的对比度扩展,使图像变得更加清晰、细腻,容易识别。灰度变换主要针对独立的像素点进行处理,通过改变原始图像数据所占据的灰度范围而使图像在视觉上得到良好的改观,兰
27、州交通大学毕业设计(论文)- 10 -没有利用像素点之间的相互空间关系。因此,灰度变换处理方法也叫做点运算法。点运算是一种既简单又重要的技术,一幅输入图像经过点运算后将产生一幅新的输出图像,由输入像素点的灰度值决定相应的输出像素点的灰度值。点运算与局部运算的差别在于:后者每个输出像素的灰度值,由对应输入像素的一个临域内几个像素的灰度值决定。因此,点运算不可能改变图像内的像素的空间关系。2.1.1 图像的灰度化图像灰度化就是使彩色的 分量值相等的过程. 由于 的取值范围是BGR, BGR,0255 ,所以灰度的级别只有256 级,即灰度图像仅能表现256 种颜色(灰度)。灰度化处理的方法主要有三
28、种:1 ) 最大值法:使 的值等于三值中最大的一个,即:,(2.2)BGRR,max最大值法会形成亮度很高的灰度图像。2 ) 平均值法:使 的值求出平均值,即:BG,(2.3)3/R平均值法会形成较柔和的灰度图像。3 ) 加权平均值法:根据重要性或其他指标给 赋予不同的权值,并使R 、G、B 它BG们的值加权平均,即:(2.4)3/WRBGR其中 分别为 的权值. 取不同的值,加权平均值法就将W, BR,形成不同的灰度图像.由于人眼对绿色的敏感度最高,对红色的敏感度次之,对蓝色的敏感度最低,因此使 将得到较合理的灰度图像。试验和理论推导证明,当BR时,即当1.0,59.,30.GR(2.5)V(2.6)时,能得到最合理的灰度图像。用MATLAB实现程序如下: