1、#*毕业设计(论文)人脸识别系统的研究与实现学院(系): 专业班级: 学生姓名: 指导教师: #*摘要人脸识别技术是包括人脸检测技术和人脸身份认证技术在内的识别技术。人脸检测技术是根据所获得的视频或者图片信息,利用图像处理和计算机视觉图像算法,从图像中判断是否有人脸,并给出存在人脸的数量和位置;人脸身份认证技术是通过脸与脸的匹配识别人脸的身份。论文研究了人脸识别的基本原理和算法,分析了人脸识别系统的需求,设计了人脸识别系统的总体框架和主要功能模块,包括图像获取功能、图像预处理功能、人脸跟踪定位功能和人脸识别等。直接使用 VS2010 调用 OpenCV 库的视频捕获和图像处理函数获取图像并进行
2、图像预处理,利用基于 Adaboost 算法的人脸检测算法进行人脸检测,并将人脸特征标记出来,实现了一个人脸检测系统。最后根据 EHMM 人脸识别算法,设计并实现了一个人脸识别软件系统,并结合已有的人脸数据库,对系统进行了实验仿真,实验结果表明本文设计的人脸识别系统是稳定的,并具有良好的人脸识别率。关键词:人脸识别;特征提取;C+;VS2013;图像预处理#*AbstractFace recognition technology is a technology which includes face detection technology and face authentication te
3、chnology. Face detection technology is based on video or image information obtained to judge whether there is a face in the image by using image processing and computer vision algorithms, and show the number and position of the face. Face authentication technology is by face match to recognize the i
4、dentity of the face.The basic principles and algorithms of face recognition are studied in the dissertation, and the demand for face recognition system is analyzed. The overall framework and the main functional modules of face recognition system is designed, which includes image acquisition function
5、, image preprocessing function, face tracking and positioning function,face recongnition functiong and so on. A face detection system is developed, to implement the real-time video face detection tracking. The basic principles of the Adaboost face detection algorithm and the Hidden Markov Model-base
6、d recognition algorithm is described.VS2010 is used to call video capture and image processing function of OpenCV to get and preprocess the image. And then face detection algorithms based on Adaboost algorithm is used to detect the human face and implemented a face detection system to track and posi
7、tion the face.Finally,designed and implementated a face recognition software system with the HMM face recognition algorithm.Combining with the existing experimental face database,simulated the system. Experiment results showed that the design of the face recognition system is stable, and it also has
8、 good recognition rates.Key words: Face Recognition; Feature Extraction; HMM Algorithm; Image Pre-processing; Adaboost Algorithm#*目录第 1 章 绪论 .11.1 人脸识别的研究背景和意义 .11.1.1 研究背景 .11.1.2 研究意义 .21.2 国内外人脸识别技术研究现状 .21.3 本文所做的主要工作及论文内容安排 31.3.1 本文所做的主要工作 .31.3.2 论文内容安排 .4第 2 章 人脸识别技术的综述 .52.1 人脸识别技术的基本原理 52.
9、2 人脸识别技术包含的内容 52.2.1 人脸检测 52.2.2 人脸识别 .72.2.3 人脸图像的预处理 .82.2.4 人脸跟踪定位 112.2.5 人脸特征提取 .122.3 基于 ADABOOST 算法的人脸细检测 132.3.1 Adaboost 算法描述 132.3.2 Haar 特征与积分图 .152.3.3 基于 Haar 特征的 Adaboost 算法描述 162.4 基于隐马尔可夫模型的人脸识别方法 172.4.1 隐马尔可夫模型介绍 .172.4.2 HMM 的三个基本问题 182.4.3 HMM 人脸模型 .202.4.4 隐马尔可夫模型训练 .212.5 基于嵌入式
10、隐马尔可夫模型的人脸识别方法 23#*2.5.1 嵌入式隐马尔可夫模型 .242.5.2 最佳状态链的确定 .252.5.3 概率 的计算 25|OP2.5.4 EHMM 人脸识别 .262.5.5 EHMM 模型训练 .272.6 人脸识 别的技术难点与发展方向 282.6.1 技术难点 282.6.2 发展方向 293 章 人脸识别系统的需求分析 303.1 可行性分析 .303.1.1 技术可行性 303.1.2 操作可行性 303.2 需求分析 313.2.1 功能需求分析 313.2.2 算法需求分析 31第 4 章 系统的方案设计和实现 .334.1 结构 设计 334.1.1 人
11、脸实时检测跟踪系统 334.1.2 人脸识别系统 .344.2 功能设计 .344.2.1 人脸实时检测跟踪系统设计 .344.2.2 人脸识别系统设计 .364.3 人脸实时跟踪 系统功能的实现 .374.3.1 VS2013 与 OpenCV 库简介 374.3.2 OpenCV 环境配置 .384.3.3OpenCV 中用于图像处理的函数 384.3.4 基于 OpenCV 的目标检测算法 .394.3.5 人脸检测跟踪的核心算法 .40#*4.4 人脸识别系统功能实现 .414.4.1 人脸数据库简介 .414.4.2 系统框架 .424.4.3 具体的实验函数分析 .44第 5 章
12、系统的测试与分析 .465.1 人脸实时检测跟踪系统 .465.1.1 系统测试 .465.1.2 结果分析 .475.2 人脸识别系统 475.2.1 系统测试 .475.2.2 结果分析 .51第 6 章 总结与展望 .526.1 总结 .526.2 展望 .53参考文献 .54#*第 1 章 绪论1.1 人脸识别的研究背景和意义1.1.1 研究背景早在古埃及时人们就开始通过人体生物特征的测量(如人脸、人手等)来鉴别人的身份,在刑侦领域,人们也早已使用最有效的人体生物特征之一,指纹,来确定罪犯。随着计算机技术的出现,人们开始凭借计算机的强大功能来研究和实现自动的身份鉴别系统。近年来,在美国
13、、欧洲、香港等许多国家和地区的大学都成立了以人体生物识别技术为主要研究方向的实验室或研究中心,同时许多公司也相继先后开发出许多产品,并不断地推向市场,逐步形成一个新兴的、很有希望的产业。在我国,已经涌现出很多专门机构广泛开展人体生物识别技术方面的研究工作,有许多研究人员投身到这一新兴研究领域,开展用于身份鉴别的人脸识别、话者识别、联机签名识别、指纹识别等多项研究工作,并取得了一定的成果。目前,用于个人身份鉴别主要依靠卡(如身份证、工作证、储蓄卡等) 、密码(如进入计算机系统、取款)等手段,而这些手段存在携带不便、密码被窃等诸多问题。例如,信用卡问题:美国每年的信用卡欺诈损失超过数百万美金;在失
14、业救济、健康保险、福利发放等领域,由于冒别人之名而损失极大;使用伪造证件非法移民等。人们希望有一种更加方便可靠的办法来进行身份鉴别,生物特征识别技术给这一愿望带来了实现的可能,人们可能会遗忘或丢失他们的卡片或密码,但绝对不会遗忘或者丢失自己的生物特征,如人脸、指纹、虹膜、掌纹等。因此,基于生物特征识别技术的个人身份识别系统具有更好的安全性、可靠性和有效性,正越来越受到人们的重视,并开始进入我们社会生活的各个领域,迎接新时代的挑战。虽然与指纹识别技术、虹膜识别技术等相比,人脸识别技术更容易受到各种因素的干扰,比如光照、装扮或者是人的表情等,但是人脸识别技术的发展空间和发展前景依然是非常巨大的。可
15、以从以下的三个方面了解人脸识别技术的优势所在:(1)无侵犯性所谓无侵犯性是指在使用人脸识别技术进行识别的过程当中,不需要被识别者的主动参与、积极配合,从而避免了被识别者产生反感、拒绝等逆反心理,使得识别过程可以有效、迅速的执行。(2)自然性好人脸识别技术具有良好的自然性。在这里,自然性是指我们使用的人脸识别技术是#*否与人类用来互相识别区分的方法相似。在日常生活当中,识别一个人最简单最直接的方法就是识别他的脸部。(3)性价比高人脸识别技术所需求的硬件设备,相对于其他生物特征识别技术如指纹识别技术较为简单,不需要其他特殊的外接设备,只需要采用高分辨率摄像头即可。1.1.2 研究意义人脸识别技术的
16、研究无论在理论上还是在实践中都有很大的意义,它涵盖了数字图像处理、神经网络、心理学、生理学、模式识别、计算机视觉以及人工智能等各方面的知识内容,对推动各个学科领域的发展具有重要的理论意义。在公安、金融、网络安全、物业管理以及考勤等各种领域也都有着巨大的应用价值。如人脸识别技术可以快速地计算出实时采集到脸部数据与人脸图像数据库中已知人员的脸部数据之间的相似度,返回鉴别结果和相对应的可信度。如应用面像捕捉,人脸识别技术可以在监控范围中跟踪一个人并确定他的位置。如在商场、银行、交易所等和金融相关场所,加以人脸识别智能监控,排除不法分子的侵入。利用人脸识别技术,可以进行计算机的登录控制,可以进行应用程
17、序安全使用、数据库安全访问和文件加密,可以实现局域网和广域网的安全控制,可以保护电子商务的安全性。如门禁控制,通过摄像机动态捕获人脸,将人脸信息同数据库中的人脸信息进行检索对比,只有图像信息符合的人才可以进入,否则拒绝进入。在日常生活中,人们识别周围的人用的最多的是人脸。由于人脸识别的非侵犯性,具有直接、友好、方便的特点,是人们最容易接受的身份鉴别方式。1.2 国内外人脸识别技术研究现状模式识别技术 5早在上个世纪 60 年代就已经有人提出,由于当时计算机处理速度的限制,只能从理论上证明是可行的。20 世纪 90 年代以来,随着高速度高性能计算机的出现,人脸识别方法有了重大突破,进入了真正的机
18、器自动识别阶段,人脸识别研究也得到了前所未有的重视。欧美等各高校都建立了人脸识别的实验室,其中著名的大学包括麻省理工学院(MIT) 、卡内基梅隆大学(CMU)等。在美国主要有麻神理工学院等研究实验室提出的特征人脸对特征空间的投影来实现;在法国已经把人脸识别身份认证技术应用到自助取款机上,在实际使用时需要用一台 3D 摄像机,采集人的立体影像来鉴定身份。目前,美国许多研究小组相继投入到人脸识别方面的研究工作,他们的研究工作得到了美国军方、警方和大公司的资助,进展迅速。美国军方更是在每年组织人脸识别大赛(FERT),以促进人脸识别的研究。日本 sony 公司最新推出的数码相机已经整合了人脸自#*动
19、识别功能,在拍照时,可以自动检测出人脸区域并进行对焦,并且还具有识别笑脸的功能,能够自动检测出笑脸。2007 年 3 月,美国 NIST 报告了 2006 年人脸识别供应商评测(FRVT2006 )结果,对控制光照条件下的极高分辨率正面人脸图像,最小错误接受率为 0.001 时,最小错误拒绝率已达到 0.01,对高分辨率、低分辨率下的正面人脸图像的识别,这个数据也分别达到了 0.021 与 0.024。在一定条件,有些技术甚至超过了人类的人脸识别力。国内对于人脸识别的研究较之国外稍晚一些,但是发展速度很快,同时,国家对人脸识别技术的研究也给予了高度的重视。九十年代中后期以来,国内众多研究机构的
20、研究组在国家自然科学基金、863 计划等资助下开始对人脸识别进行了研究。其中,具有代表性的人脸识别系统有:清华大学电子系丁晓青教授研究小组开发的 THfaceID 系统;中国科技大电子科学与技术系庄镇泉教授研究小组开发的人脸识别考勤系统(KD-Face2.0) ;中科院计算所高文研究组开发的 GodEye 系统;清华大学电子系苏光大教授研究小组开发的大型人脸综合识别系统;中科院自动化所李子青研究小组开发的人脸识别系统等。2008 年,在北京奥运会及残奥会开闭幕式,使用了由 CBSR 研制的人脸识别技术进行实名制门票查验。在奥运会及残奥会开闭幕式中,约 36 万人次经过了人脸识别系统的验证后进入
21、开闭幕式现场。为奥运会的安保工作做出了巨大的贡献,该技术拥有完全独立自主的知识产权,人脸识别系统的性能优良,在国际上亦处于领先地位。2011年 1 月,由台湾政府资助开发出了新型的人脸识别自动售货机,该机器可以应用在某些特殊商品的销售领域中,如保健产品、面膜、剃须刀等,该人脸识别自动售货机可以根据消费者面部的特征向其推荐特定的商品。同时,人脸识别技术也可以帮助解决很多社会问题,比如,目前的解救乞讨儿童的公益活动。其中,以中科院自动化所免费提供人脸识别相关的技术支持,并与多个网络平台合作尽快的付诸于实践。1.3 本文所做的主要工作及论文内容安排1.3.1 本文所做的主要工作本文针对实时视频的人脸
22、检测跟踪与静态图像的人脸识别展开研究,介绍了一种开放源代码的计算机视觉类库 OpenCV,阐述了该软件的特点及结构,并对其在 VS2010 开发环境下的配置作了详细的说明,然后提出了一个基于 OpenCV 的人脸检测算法 25和基于隐马尔可夫模型的人脸识别方法 24。对人脸识别技术做了详细综述,着重讨论了人脸识别过程中的几个关键性问题,如图像预处理、识别和检测算法等。在分析和借鉴了国内外人脸识别领域研究成果的基础上,结合实际应用的目的,对人脸识别关键技术进行了深入研究,主要工作包含以下几个方面:#*(1)介绍了基于人脸识别的研究背景和意义,总结了现有的人脸识别的方法,分析比较了它们的特点以及存
23、在的问题。(2)对人脸检测和识别过程中的静态图像预处理技术和特征提取技术展开讨论,重点分析了图像的灰度变换、直方图均衡化、边缘检测等问题。(3)对国内外人脸检测的 Adaboost 算法和人脸识别的隐马尔可夫算法的研究进行了跟踪,提出了一种基于 Adaboost 的人脸检测算法,和一种基于嵌入式隐马尔可夫模型的人脸识别算法,并对算法进行的实验测试进行分析,实验结果表明文章中提出的算法具有较好的人脸检测和识别的准确率。(4) 从应用的角度出发,结合前面两章的研究成果,设计并实现了一个人脸检测跟踪系统和一个静态人脸图像识别的人脸识别系统。基本思想是:利用文章中提出的的Adaboost 算法先检测出
24、候选的人脸区域,再根据特定的算法提取出面部的人脸特征,确定并标示出人脸的位置;另外利用嵌入式隐马尔可夫模型算法开发了一个人脸识别系统进行人脸识别。文章进行了大量的实验测试,并对测试结果进行了分析。1.3.2 论文内容安排针对研究内容,本文的结构安排如下:第一章为绪论,介绍了人脸识别技术研究的背景及意义和国内外的研究现状。第二章为人脸识别技术的综述,分析了人脸识别的基本原理和方法,重点讨论了人脸识别中的关键算法,指出了现在人脸识别技术的研究难点。第三章为人脸识别系统的需求分析,分析了算法需求和功能需求,为系统的方案设计做好准备。第四章为人脸识别系统的方案设计和实现,给出了系统的总体设计方案和各个
25、功能模块的设计,详细阐述了整个系统和各个模块的实现过程。第五章为人脸识别系统的系统测试,阐述了系统的功能测试和测试结果。第六章为总结与展望,阐 述 了 自 己 论文的主要成果和仍需要做的改进。#*第 2 章 人脸识别技术的综述人体生物特征识别技术是依靠人体的生物特征来进行人的身份验证的一种高科技识别技术。而人脸识别技术具有比其他生物特征识别技术更直观、简便、准确、可靠及可扩展性良好等众多优势,因而应用广泛。2.1 人脸识别技术的基本原理人脸识别技术是基于人的脸部特征,对输入的人脸图象或者视频流,首先判断其是否存在人脸, 如果存在人脸,则进一步给出每个脸的位置、大小和各个主要面部器官的位置信息。
26、并依据这些信息,进一步提取每个人脸中所蕴涵的身份特征,并将其与已知的人脸进行对比,从而识别每个人脸的身份。广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。2.2 人脸识别技术包含的内容2.2.1 人脸检测人脸检测是指在动态的场景与复杂的背景 10中判断是否存在面像,并分离出这种面像。下面是几个主要的人脸检测方法:(1)基于知识的方法:这种方法是基于规则的人脸检测方法,规则来源于研究者关于人脸的先验知识,将典型的人脸形成规则库对人脸进行编码,通过面部特征之
27、间的关系进行人脸定位。一般比较容易提出简单的规则来描述人脸特征和它们的相互关系,如在一幅图像中出现的人脸,通常具有互相对称的两只眼睛、一个鼻子和一张嘴。特征之间的相互关系可以通过它们的相对距离和位置来描述,在输入图像中首先提取面部特征,确定基于编码规则的人脸候选区域。基于知识的方法存在的问题是很难将人类知识转换为明确定义的规则。如果规则太详细( 严格 ),由于不能通过所有的规则可能使得检测失败;如果规则太概括(通用),可能会有较高的错误接收率。此外,很难将这种方法扩展到在不同的位姿下检测人脸,因为列举所有的情况是一项很困难的工作。(2)基于特征不变性的方法:在姿态、视角或光照条件改变的情况下找
28、到存在的结#*构特征,然后使用这些特征确定人脸。这类方法主要有采用人脸特征检测、基于皮肤颜色纹理特征检测以及基于多个特征综合检测。不仅可以从已有的面部特征而且可以从它们的几何关系进行人脸检测。与基于知识的方法相反,它是寻找人脸的不变特征用于人脸检测。人们已经提出了许多先检测人脸面部特征,后推断人脸是否存在的方法。一般利用边缘检测器提取面部特征(如眉毛、眼睛、鼻子、嘴和发际等),根据提取的特征,建立统计模型描述特征之间的关系并确定存在的人脸。这类方法的缺点在于这些特征会由于照明、噪声以及遮挡情况被破坏,人脸的特征边界会被弱化,在这种情况下很多方法都会失效;同时由人脸阴影所形成的边缘可能对几何特征
29、的边缘带来不良影响。(3)基于模版匹配的方法:这类方法首先人工定义或者参数化的建立一个函数来描述标准人脸模式(通常是正面人脸) ,然后根据输入的人脸和定义的标准人脸的相关性来进行检测。但是实际上,我们的人脸模式变化太大,人脸模板的构建是相当难的,如果是固定的模板,很难做出准确的判断。也有人提出了带参变量的曲线函数,即变形模板。变形模板可以根据人脸模式的变化自适应地调节匹配模板,提高了模板的适应性和检测精度。最近提出了多分辨率模版、多比例模版、子模版等方法来适应比例及形状的变化。基于模板的方法较为直观,但是固定模板对位姿、表情和尺度变化敏感;可变形模板虽然对非刚性模式具有较好的适应性,但是可变形
30、模板的选择和参数的确定困难,受人脸各种因素的影响比较大,尤其是在图像背景比较复杂的情况下,模板匹配鲁棒性差,如果待测图像中有多个人脸的话,要实现图像中多个人脸的检测特别困难。(4)基于外观的方法:这类方法主要依赖于统计分析和机器学习理论,对应于模版匹配的预先定义模版的方法,通过从样本图像学习中获得“模版”进行人脸检测。通过将人脸图像视为一个高维向量,从而将人脸检测问题转化为高维空间中分布信号的检测问题。通常,基于外观的方法依靠统计分析和机器学习技术找到相应的人脸和非人脸图像的特征。学习的特征由分布模型或判别函数形成,同时,由于计算效率和检测有效性的原因通常需要降维。该类方法主要有,特征脸(Ei
31、genfaces)方法:将 KL 变换 21引入了人脸检测,在人脸识别中采用的是主元子空间(特征脸) ,而人脸检测利用是次元子空间(特征脸空间的补空间) ,用待检测区域在次元子空间上的投影能量,也即待检测区域到特征脸子空间的距离作为检测统计量,距离越小,表明越象人脸。神经网络方法:人脸检测可以看作是只有人脸样本和非人脸样本两个分类的模式识别问题,通过对人脸样本集和非人脸样本集进行学习可以产生分类器。由于人脸模式的多样性和图像获取过程的不确定性,人脸在图像空间中分布非常复#*杂,建立人脸在高维图像空间的精确分布模型是一件非常困难是工作。建立一个统计可靠的估计不仅需要大量的正例样本,而且还需要充分
32、多的有效反例样本。2.2.2 人脸识别人脸识别的主要任务不仅包括从照片和图像序列中识别某个人脸图像,而且还涉及到对面孔图像的分析或合成。主要有以下几种方法:(1)基于面部特征 20的方法:将人脸用一个几何特征矢量表示,进而用模式识别中的层次聚类思想设计分类器对人脸进行识别。具体的实现过程如下:首先检测出面部的明显特征点(通常为眼睛、鼻子、嘴等部位):然后测量出这些面部特征点之间的距离,并把这些距离作为几何特征矢量(眼睛、鼻子、嘴的位置和宽度,眉毛的厚度和弯曲程度等都可以作为我们描述一张人脸的几何特征矢量);最后将待测图像和训练好的人脸库的几何特征矢量进行比较,就可以判断是否为人脸,如果是人脸,
33、可以找出与已知人脸库的最佳匹配人脸。这种方法存在的问题有:检测率不高,会受到很多外界条件的影响,尤其对强烈的表情变化不敏感,稳定性较差,如果背景区域中存在类人脸区域,则必然导致误检。(2)基于统计特征脸(PCA) 19的方法:该方法是基于 KL 变换的人脸识别方法,KL 变换是图像压缩的一种最优正交变换。高维的图像空间经过 KL 变换后得到一组新的正交基,保留其中重要的正交基,由这些基可以张成低维线性空间。如果假设人脸在这些低维线性空间的投影具有可分性,就可以将这些投影用作识别的特征矢量,这就是特征脸方法的基本思想。这些方法需要较多的训练样本,而且完全是基于图像灰度的统计特性的。 (3)基于模
34、板匹配的方法:静态模板匹配直接对两幅图像进行比较,其中一幅作为模板,而另一幅是被识别图像。通过计算得出两幅图像的特征值,从而比较两幅图像的相似程度。在模板匹配方法当中,即可以把整张脸当作一个模板,也可以把人脸分成几个相互独立的小模板,每个小模板可包含眼部、嘴部、眼眉、鼻子、额头、脸颊等部位。弹性模板匹配是根据待检测人脸特征的先验的形状信息(通常利用小波特征)定义一个参数描述的形状模型,该模型的参数反映了对应特征形状的可变部分,如位置、大小、角度等,它们最终通过模型与图像的边缘、峰、谷和灰度分布特性的动态交互适应来得以修正。由于模板变形利用了特征区域的全局信息,因此可以较好地检测出相应的特征形状
35、。(4)基于隐马尔科夫模型的方法:隐马尔科夫模型(HMM)是用于描述信号统计特性的统计模型。基于人脸从上到下、从左到右的结构特征,Samaria 等首先采用 1-DHMM#*和 2-D Pseudo HMM 用于人脸识别。基于 I-DHMM,Kohir 等采用低频 DCT 系数作为观察矢量获得了较好的识别效果。Eickeler 等采用 2-D Pseudo HMM 识别 DCT 压缩的 JPEG图像中的人脸图像。(5)基于神经网络的方法:人工神经网络方法同人类神经功能一样具有记忆功能,对于一个模式的训练样本比较丰富时,利用神经网络人脸检测方法可以应用到处理比较复杂的检测。神经网络的输入可以是降
36、低分辨率的人脸图像、局部区域的自相关函数、局部纹理的二阶矩等。神经网络方法在人脸识别上比其他类型的方法有其独到的优势,它避免了复杂的特征提取工作,可以通过学习的过程获得其他方法难以实现的关于人脸识别的规律和规则的隐性表达。(6)基于支持向量机的方法:支持向量机(SVM)主要解决的是一个 2 分类问题,它的思想是试图把一个低维的线性不可分的问题转化成一个高维的线性可分的问题。在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势。通常的实验结果表明 SVM 有较好的识别率,但是它需要大量的训练样本(每类 300 个) ,这在实际应用中往往是不现实的。而且支持向量机训练时间长,方法实现复杂,
37、函数的取法没有统一的理论。2.2.3 人脸图像的预处理通常情况下,我们在采集图像时,由于成像设备、光照条件、被检测的人脸状态等诸多因素的影响,另外还有噪声的存在,使得我们得到的初始图像效果是很差的,对特征的提取是不利的。因此,对初始图像进行相应的预处理是很必要的。人脸图像预处理的主要目的是消除与人脸图像无关的信息,滤除干扰、噪声、恢复真实有用的信息,最大程度地增强有关信息和简化数据,从而给后续的特征抽取、图像分割、匹配和识别创造条件,给系统的稳定作保障。本文所研究的图像预处理主要包括图像增强与平滑、图像分割两个方面,具体包括:灰度化、图像二值化、边缘检测、尺度归一化和直方图均衡化等。(1)图像
38、灰度变换为了使实验拥有比较好的效果,尤其是更加满足实际应用的要求,文章对采集到的图像,首先要进行灰度变化,然后才能方便于后续的处理,适用于 Adaboost 人脸检测算法。灰度变换 18是图像增强的一种重要手段,属于空域处理法。它可以使图像动态范围加大,使图像的对比度扩展,图像更加清晰,特征更加明显。这些特征都更加有利于人脸特征的提取与识别。灰度变换的实质就是按一定的规则修改图像的每一个像素的灰度,从而改变图像灰度的动态范围,灰度变换按照其变换的方法可以分为:线性、分段线性、#*非线性以及其他的灰度变换。通常实验中采集到的人脸图像是彩色图像。彩色图像中的像素点是由 R(红色)、 G(绿色)、B
39、(蓝色)三种颜色混合而成的,不同含量的 RGB 混合组成不同的颜色。而灰度图像是只含有亮度信息,不含有色彩信息,而且是亮度是连续变化的,灰度图像的表示是把图像的亮度值进行量化来表示的。灰度图像通常划分为 0255 共 256 个级别,0 表示全黑(最暗),255 表示全白(最亮)。在人脸识别中,利用彩色图像,往往会受到复杂背景(尤其是肤色) 16的影响,存在很多缺陷;而灰度图像则比较容易处理,不存在复杂背景的问题,而且很多经典的人脸检测和识别的算法都是采用灰度图像来进行的,像本文会采用的 Adaboost 人脸检测算法。所以,本文首先对采集的人脸彩色图像进行灰度化。彩色图像中像素点 RGB 分
40、量是不相等的,而灰度像素点的 RGB 分量是相等的。也就是说(0,0,0) 是全黑色,而 (255,255,255)是全白色,中间的即为灰色。灰度化就是使彩色分量相等的过程。彩色图像和灰度图像间的 RGB 分量之间的对应关系为BGRgraycolr14.0578.29.0. BGR(2.1)也就是说,根据这公式,我们可以将一幅彩色图像变换为灰度图像。(2)直方图均衡化直方图均衡化又称为灰度均衡化 18,是通过某种灰度映射使输入图像转化为在每一灰度级上都有近似相同像素点数的输出图像,使之演变成一幅具有均匀灰度概率分布的新图像。在经过均衡化处理的图像中,像素占有尽可能多的灰度级并且分布均匀。其结果
41、是扩展了像素取值的动态范围,从而达到了增强图像整体对比度的效果,从而部分地消除光照对灰度图像影响。直方图是一种点操作,它逐点改变图像的灰度值,尽量使各个灰度级别都具有相同数量的像素点,使直方图趋于平衡。若考虑图像的灰度范围为 且连续。按照图像的概率密度函数 (PDF,归一化带1,0单位面积的直方图)的定义:)(*0/1)(xHAxP(2.2)其中 为直方图, 为图像的面积,设转换前图像的概率密度函数为 ,转换后)(xH0A Pr图像的概率密度函数为 ,转换函数为 ,由概率论的知识,我们可以得到:)(SPs)(rfsdsSPs*)r((2.3)如果想使转换后图像的概率密度函数为 1 (即直方图是
42、平的),则必须满足:#*drs)P((2.4)等式两边积分得:rr uHAufS002)(/1)()((2.5)该转换式被称为图像的累积分布函数。上面的公式是被归一化后推导的,对于没有归一化的情况,只要求以最大的灰度值(Dmax,对于灰度图就是 255)即可,灰度均衡的转换式为:duHADfAB )(*0max/)((2.6)对于离散图像转换式为:ADiiABf 0*ax/)((2.7)式中 为第 i 级灰度的像素个数。iH(3)尺度归一化处理假设样本图像为F(x,y)MxN,图像的宽度和高度分别为 M 和 N,大小归一化后为G(x,y)WxH,实验中人脸样本取 W=96,H=96 ;使用反向
43、投影和线性插值从原始图像得到归一化后的样本图像,则输入图像与归一化后图像之间的对应关系有:)/,(),(yxrFyxG(2.8)其中 和 分别是 x 和 y 方向的尺度变换因子: , ;由于 xry HNrx/WMy/、 的取值一般不为整数,故需要根据附近已知离散点处的值来估计 F(x/ x,y/x/y/ r)的取值,这里采用线性插值法;对于给定(x,y),令:yr0/yryrxx,(2.9)可以得到公式:)1(),1()1(),( )(,00 00 yxyxFxyF yxFyxG(2.10)#*(4)边缘检测图像边缘是图像最基本的特征,边缘在图像分析中起着非常重要的作用。所谓边缘是指图像局部
44、特征的不连续性,比如:灰度级的突变、颜色的突变和纹理结构的突变等。边缘广泛存在于目标与目标、物体与背景、区域与区域(包含不同色彩)中之间,它是图像分割所依赖的重要特征。本文中主要讨论 Canny 算法,Canny 边缘检测算法 20是由 Canny 提出的,是一种多尺度边缘检测算子。它是高斯函数的一阶导数,是对信噪比与定位之乘积的最优化逼近算子。其基本思想是先将图像使用高斯函数进行平滑,然后计算平滑后图像的梯度,梯度最大的位置就是物体的边缘,然后利用非最大值抑制来处理梯度图像,以细化边缘,最后再利用滞后算法对图像进行阈值化处理,以检测并连接图像的边缘。该算法的主要实现步骤如下:1)用二维高斯滤
45、波模板进行卷积运算,以消除噪声;2)利用 22 领域一阶偏导的差分来计算滤波后的数据阵列 I(x,y)的梯度幅值大小和方向。其中,x 方向和 y 方向的偏导数分别为:2/y)1,-I(x),1(dyxI(2.11)y(2.12)则梯度的幅值大小为:22)(dDyx(2.13)梯度的方向为:dxyarctn(2.14)3) 对梯度进行非极大值抑制:首先遍历图像,如果某个像素的灰度值小于其梯度方向上的前后两个像素的灰度值,那么该像素即为非边缘。4) 检测和连接边缘。传统的 Canny 算法采用双阈值化处理。即经过步骤 3)中非极大值抑制后的图像可能存在孤立点而造成轮廓的中断,为了避免这种情况,Ca
46、nny 使用了滞后双阈值处理,即设定两个阈值:高阈值 和低阈值 (一般取 ),图像2T1T210.4T中每一点的梯度值凡是大于 一定是边缘;梯度值凡是小于 的一定不是边缘;检测2T结果在 与 之间的,要根据这个像素的邻接像素来确定是不是边缘。1T2#*2.2.4 人脸特征提取对样本图像进行处理,检测出人脸部分图像后,我们需要对图像的特征进行提取,已备进一步的识别。根据不同识别手段,我们需要最优的特征因子也不同。对于人脸识别来说,人脸特征的选取 17对最终的识别结果的影响是非常重要的。在特征提取的方法9中,可使用的特征通常分为视觉特征、像素统计特征、人脸图像变换系数特征、人脸图像代数特征、运动特
47、征。目前的研究主要集中在面部几何特征、统计特征、变换域中的面部特征、运动特征和代数特征等几个方面 11。(1)几何特征的提取在特征的提取方式上,可以分为以下三种:在手动的预先定义一组特征点的基础上进行特征点运动的跟踪、全自动提取特征点和基于面部轮廓特征的模块匹配。(2)统计特征的提取与提取图像的几何特征相比,这种统计特征是基于图像的整体灰度特征的,它强调尽可能多地保留原始面部图像信息,通过对大量样本的训练,获得其统计特征,其基本思想是将面部图像映射到特征空间,将大量图像数据降维后进行模式分类,因此提取统计特征的方法实际上是“子空间分析法” 。如果将子空间的正交基按图像阵列排列,则可以看出这些正
48、交基呈现人脸的形状,因此这些正交基也被称为特征脸,这种识别方法也叫特征脸方法。(3)频率域特征的提取小波变换是一种信号的时间尺度分析方法,它具有多分辨率分析的特点,而且在时频两域都具有表征局部信号特征的能力。Gabor 小波核函数具有与人类大脑皮层简单细胞的二维反射区相同的特征,即能够捕捉对应于空间频率、空间位置及方向选择性的局部结构信息,因此用二维 Gabor 小波变换的系数幅值作为特征来匹配有着良好的视觉特性和生物学背景,在人脸识别和图像处理中曾被广泛应用。(4)代数特征的提取代数特征反映的是图像的一种内在属性,将图像作为矩阵看待,可对其进行各种代数变换,或进行各种矩阵分解。由于矩阵的特征
49、向量反映的是一种代数属性,并且具有不变性,因此可用来表征图像特征。不变矩和奇异值特征是两种常用的图像代数特征,两者具有平移、尺度和旋转不变性特征,而且奇异值特征还对噪声、光照变化引起的图像灰度变化具有不敏感性。2.3 基于 ADABOOST 算法的人脸细检测人脸具有共性和差异性。人脸检测是在寻找人脸的共同属性,即根据给定的一幅图#*像或一帧进行图像分析,找出属于人脸中共同的属性,用一定的标示表示出来,证明人脸的存在或不存在。Adaboost 算法 16是采用分类器的思想,把人脸检测问题看成是一个只有两个类的分类问题,即将图像分为“脸”和“非脸”两大类。基于 Adaboost 算法的人脸细检测是在基于人脸粗检测的基础之上,对候选人脸区域使用 Adaboost 算法,进行人脸的精确检测,将真正的人脸从“类人脸”的区域集合中快速而准确地分离出来,并且做以标定。2.3.1 Adaboost 算法描述Adaboost 算法 16是目前在人脸检测方面检测速度较快、检测效果较好的一种检测方法,它是一种