1、人脸定位算法研究计算机科学与技术专业 学生:杨晔 指导教师:赵辉煌摘要:人脸定位是指给定静止图像或视频序列,不管图像中人脸的位置、大小、方向、姿势、光照等如何变化,找到并定位所有人脸的确切位置的一种技术。文章对人脸定位问题作了一些探讨,对几种人脸定位算法进行了验证,同时在综合多个标准人脸库的大型人脸图像库中作了大量实验,目的是确定一种可靠的人脸定位算法,满足实际应用的需要。关键词:人脸定位;Matlab;二值化;边缘检测;Adaboost 算法1 研究背景人脸定位就是利用计算机分析人脸图像,从中提取有效的人脸信息,用来确定人脸位置的一种技术。它涉及到模式识别、图像处理、计算机图形学等诸多学科的
2、知识,并与基于其它生物特征的身份鉴别方法有密切联系。同时,人脸定位是人脸识别技术的一个重要研究方向。在今天,人脸识别技术已经广泛应用,它与指纹、视网膜、虹膜、基因、掌纹等其它人体生物特征识别系统相比,人脸识别技术因其无需用户过多参与、非接触式的数据采集方式、对用户无任何损害、便于隐藏等优点而普遍为人们所看好,被称为 21 世纪最有前途的身份验证方法。人脸识别技术应用背景十分广泛,可用于公安系统刑侦破案的罪犯身份识别、身份证及驾驶执照等证件验证、银行及海关的监控、自动门卫系统、视频会议、机器人的智能化研究以及医学等方面。因此对于人脸识别中的关键环节之一的人脸定位显得尤为重要。2 算法介绍2.1
3、基于肤色分割的人脸定位2.1.1 YcbCr 颜色空间YCbCr 是在世界数字组织视频标准研制过程中作为 ITU - RBT1601 建议的一部分,其实是 YUV 经过缩放和偏移的翻版。其中 Y 与 YUV 中的 Y 含义一致,Cb,Cr 同样都指色彩,只是在表示方法上不同而已。在 YUV 家族中,YCbCr 是在 计算机系统中应用最多的成员,其应用领域很广泛,JPEG、MPEG 均采用此格式。一般人们所讲的 YUV 大多是指YCbCr。 YCbCr 有许多取样格式,如 4:4:4,4:2:2,4:1:1 和 4:2:0。RGB 色彩空间与 YCbCr 色彩空间的转换关系如下:1) YCbCr
4、 转换为 RGBR=Y+1.371(Cr-128)G=Y-0.698(Cr-128)-336(Cb-28)B=Y+1.732(Cb-128)彩色图像图像预处理肤 色 检 测肤色分割人 脸 定 位2)RGB 转换为 YCbCrY=(77/256)R+(150/256)G+(29/256)B Cr=(131/256)R-(110/256)G-(21/256)B+128Cb=-(44/256)R-(87/256)G+(131/256)B+1282.1.2 基于肤色分割的人脸定位的实现利用肤色信息进行人脸的检测与定位,一个完整的人脸检测和定位过程如图 2-1 所示:图 2-1 人脸检测和定位过程Fig
5、 2-1 Face detection and localization process图 2-1 中:(1)对图像进行预处理,主要是直方图均衡和平滑处理。(2)对图片进行颜色空间转换,用建立的肤色模型,对图像中的皮肤像素进行检测。(3)对检测到的肤色区域进行形态学处理。(4)标定出图像中的最大块的肤色区域,作为人脸的候选区域。(5)利用人脸的其它特征来进一步确定人人脸。(6)定位出所检测到的人脸区域。通过比较,本文采用的肤色模型如下,即通过阈值方法对肤色进行判决,对图片中的每一个像素(i, j)(式 2-(,)7,12r(,)13,71,0(,)ij CijCbelsMij且1)这样将图像转
6、变成一个二值图像,白色的区域就是人脸候选区域。然后利用垂直积分投影方法来对人脸候选区域进行判决。算法定位效果如下:图 2-2 不同情况下人脸定位效果Fig 2-2 The different Human Face positioning effect总体而言,从实验结果可以看出本算法有如下特点:(1) 对女性人脸的定位效果受到头发的影响比较大,定位精度不高。(2) 有一定的抗倾斜的能力。(3) 对背景和被检测者的发型、着装、脸部表情没有严格的限制。(4) 对于不同的人脸具有较高的鲁棒性。(5)在实际应用中范围有限。2.2 基于 AdaBoost 算法的人脸定位2.2.1 AdaBoost 算法
7、概述AdaBoost 算法是一种基于样本(包括正样本和反样本)训练学习的方法。训练前先从原始的样本图像中计算出相应的 Haar 特征值,再把 Haar 特征作为整个训练过程的输入变量,利用算法挑选出部分分类能力较强的 Haar 特征构成各自对应的弱分类器,然后利用AdaBoost 算法按目标驱动的方式将多个弱分类器组合成一个强分类器。AdaBoost 算法是第一个实时的人脸定位算法,该方法从本质根除了定位的速度问题,同时拥有较好的定位结果。利用此方法能够将一组弱学习方法提升为一个强学习方法,其核心思想是当分类器对某个样本分类正确时,则降低这个样本的权重;当分类错误时,则增加这个样本的权重,使得
8、在后续的学习中可以集中分类错误的训练样本进行学习,最终得到一个定位准确率十分理想的分类器。文中采用的 AdaBoost 算法采用的是 Haar-Like 特征。Haar-Like 特征最早是由 Papageorgio 应用于人脸的表示,Viola 等在他们的基础上进行了扩展,使用 3 种类型 4种形式的特征。3 种类型分别为:2-矩形特征、3-矩形特征、4-矩形特征,4 种形式如图 2-3 所示: A B C D 图 2-3 Viola 特征库Fig 2-3 Feature library 2.2.2 AdaBoost 算法分类器 每个 Haar 特征对应看一个弱分类器,但并不是任伺一个 Ha
9、ar 特征都能较好的描述人脸灰度分布的某一特点,如何从大量的 Haar 特征中挑选出最优的 Haar 特征并制作成分类器用于人脸检测,这是 AdaBoost 算法训练过程所要解决的关键问题。Paul Viola 和 Michael Jones 于 2001 年将 Adaboost 算法应用于人脸检测中,其基本思想是针对不同的训练集训练同一个分类器(弱分类器) ,然后把这些不同训练集上的得到的分类器联合起来,构成一个最终的强分类器。 Adaboost 算法中不同的训练集是通过调整每个样本对应的权重来实现的。开始时,每个样本对应的权重是相同的,对于 h1 分类错误的样本,加大其对应的权重; 而对于
10、分类正确的样本, 降低其权重, 这样分错的样本就被突出出来,从而得到一个新的样本分布 U2 。在新的样本分布下,再次对弱分类器进行训练,得到弱分类器 h2 。依次类推,经过 T 次循环,得到 T 个弱分类器,把这 T 个弱分类器按一定的权重叠加(boost)起来,得到最终想要的强分类器。训练系统总体框架,由“训练部分”和“补充部分”构成。依据系统框架,本文的训练系统可分为以下几个模块:(1) 以样本集为输入,在给定的矩形特征原型下,计算并获得矩形特征集;(2) 以特征集为输入,根据给定的弱学习算法,确定闽值,将特征与弱分类器一一对应,获得弱分类器集;(3) 以弱分类器集为输入,在训练检出率和误
11、判率限制下, 使用 AdaBoost 算法挑选最优的弱分类器构成强分类器;(4) 以强分类器集为输入,将其组合为级联分类器;(5) 以非人脸图片集为输入,组合强分类器为临时的级联分类器,筛选并补充非人脸样本。本文基于 VC+6.0 的平台对 AdaBoost 算法的人脸定位作了实现,由于分类器的训练缺乏专业的人脸数据库,且太过复杂,故采用了比较成熟的 OpenCV 中所提供的级联分类器:haarcascade_frontalface_alt2.xml。实验结果如图 2-4 所示:图 2-4 基于 AdaBoost 算法的人脸定位效果Fig 2-4 The AdaBoost algorithm-
12、based face localization effect通过与基于肤分割的人脸定位的实验结果相比,基于 AdaBoost 算法的人脸定位在定位精度方面有了明显的提高,尤其是在对女性人脸定位方面有了很大的提高(在基于肤色分割的人脸定位算法中,头发的影响比较大) ,但是在实现的难易上比基于肤色分割的人脸定位复杂了很多(需要在分类器的训练上花费比较多的功夫) ,而且该算法在侧面人脸定位方面的精度上也有所欠缺。总的来说,该算法有了很大的进步,有了重要的实际应用意义。2.3 基于特征提取的人脸定位方法人脸的结构非常复杂,故人脸图像的特征也非常丰富。人脸定位利用的是人脸的共性特征,大致分为基本特征、变
13、换域特征、统计特征等。基本特征又包括灰度特征、边缘特征、形状特征、结构特征等。利用这些特征或者特征的组合,可以有效地表征一幅人脸。2.3.1 肤色检测该算法和基于肤色分割的人脸定位算法一样,都需要进行肤色的检测。通过实验,我们沿用第二章所采用的对肤色的判决,对整个图像进行检测,这样就将图像变成一个二值图像。2.3.2 特征部位检测二值化图像之后,我们初步可以对整个图像中的人体的头部进行划分,通过边缘检测等方法对整个人脸进行划分,区别出人的脸部和头发部分,并用不同的颜色进行标识。效果如图 2-5:图 2-5 原图像与进行区分后的图片Fig 2-5 The original image and t
14、he image after the distinction2.3.3 建立样本直方图为了实现对脸部的定位,需要对样本图像建立相对应特征点的直方图,这里,我们对上一部区分出来的脸部和头发部位进行建立直方图的操作,具体效果如下:图 2-6 脸部直方图Fig 2-6 The face of histogram图 2-7 头发直方图Fig 2-7 Hair histogram建立好直方图后,我们首先通过直方图匹配法来确定眼睛的位置,在二值图像中,设点(x,y)处的灰度值为 g(x,y),二次微分的表达式为:(,)()9(,)dxygxiyjgxy1,0ijIf d(x,y)D, d(x,y)=255
15、else d(x,y)=0 (式 2-2)其中 D 是预先设定好的门限值。由二值图像大小可以大致求出头部的顶点位置 H,头顶的位置不要求很精确,因为它对接下来的眼睛定位影响不大。求到 H 点后,由 H 点向下移动一定距离,在这里开始依次向下移动,每移动一次都抽取一横条进行投影直方图分析,直到判断出眼睛的大致位置位置为止。由于眉毛与眼睛挨得比较近,在检测眼睛位置的时候有可能会受到眉毛的影响而产生偏差。因此在检测出眼睛的大致位置后需要进一步检测原图中眼球的位置。根据眼球处的灰度特性,对眼球的检测可以采用圆面匹配的方法。由于眼球的灰度特征比较明显,对眼球的检测正确率能够达到 100%,从而也保证了眼
16、睛位置的准确率。由于在人脸中,人脸的正面像中,脸颊基本上是一条垂直方向上的直线段,如图 2-8。般检测直线的方法都采用 Hough 变换,但是由于边缘点比较多,计算比较繁琐,在这儿采用的是直线匹配搜索的方法。由于能大致确定脸颊的位置以及直线参数的范围,这种本来比较繁琐的方法在此显得简单而有效。脸颊直线的极坐标方程为:(式 2-cosinrxAy3)Wid (x,y)图 2-8 脸颊模版示意图AFig 2-8 Cheek template diagram在前面我们得到了眼睛的精确位置,现在可以由此计算出脸颊的位置。 (由图 2-10 所示,其中 =68%, =40%, =39%, =69%,以上
17、数据及计算方法详细情况请参考文1234献1,具体方法是构造一个能量函数 Eedge(wid,x):(式 2-4)(,)/EedgwixedginumberW W W W1234图 2-9 脸颊位置的计算Fig 2-9 The cheek position of calculated其中 对直线上的所有点的灰度值梯度求和,其中梯度算子采用二次微分算子,number 为直线上点的个数。不断改变 wid 和 x 的值并求出相应的 Eedge 的值,当 Eedge 取最小值时候的 wid、x 我们所要求的脸颊直线的参数。具体定位效果如图 2-10:图 2-10 基于特征提取的人脸定位效果Fig 2-1
18、0 Based feature extraction face localization effect通过与前两种人脸定位的实验结果相比,基于特征提取的人脸定位方法在对图片质量要求比较高,且在定位精度上不如前两种算法,实际应用意义不大,需要进一步对其研究,并加以改进。3 总结人脸定位作为人脸信息处理中的一项关键技术,近年来己经成为模式识别、计算机视觉、信息安全、智能监控、虚拟现实等领域中一项受到普遍重视、研究十分活跃的热点研究方向。然而,由于人脸模式自身的复杂多变以及外界环境(包括遮挡、光照以及成像条件等因素的影响)的不确定,使得人脸定位问题成为一个较为复杂的具有挑战性的研究课题。.文章以模式
19、识别的理论为基础,认真分析和总结了现有的定位方法,对人脸定位算法进行了深入而广泛的研究和讨论。主要体现在以下三个方面的工作:(1)基于肤色的人脸定位算法本文研究了人脸肤色的色彩空间与肤色的聚类模型,通过肤色在不同色彩空间的聚类性比较分析,最终选择了目前广泛使用的 YCbCr 色彩空间,并采用肤色模型来进行肤色分割,并根据人脸区域的面积、孔洞数、长宽比等进行人脸候选区域的初步筛选。实验结果表明,基于肤色的人脸定位方法对于不同姿态、不同表情、不同旋转角度的人脸均有较好鲁棒性而且具有较高的检测率,是人脸定位过程中前期人脸粗定位中的一种比较理想的人脸定位方法。(2)基于 AdaBoost 的人脸定位算
20、法本文研究了 AdaBaoost 人脸定位算法的基本原理,从一个较大的特征集中选择了较少量的人脸的关键特征,从而产生一个高效的强分类器。同时,为了减少特征值的计算量,采用一种称为“积分图像”的图像表示方法,能够快速计算出弱分类器用到的特征值。在检测人脸的过程中,根据肤色分割预先确定人脸的大小,检测窗口只需扩大到与最大的候选人脸区域相当即可。通过大量的实验表明,采用 AdaBoost 算法构造的级联分类器检测性能较好。(3)基于特征提取的人脸定位算法本文研究了基于特征提取的人脸定位算法的基本原理。在人脸的一系列基本特征中选取了边缘特征来进行研究。通过对图像的处理,以及对投影直方图的积分操作,定位
21、出人眼的位置,然后通过人脸正面图像的比例模型,定位出脸颊的位置,最终定位出人脸。参考文献1 Xiaobo Li,Nicliolas Roeder. Face Contour Extraction From Front-View ImagesJ,Pattern Recognition, 1995,28 (8):1167-1179.2 韩春霞. 人脸定位方法研究:(硕士学位论文). 辽宁:沈阳工业大学 ,2009.05.3 王文宁. 人脸的检测定位方法:(硕士学位论文). 山东:山东大学,2005.044 吴证,周越,杜春华,袁泉,戈新良. 彩色图像人脸特征点定位算法研究J. 电子学报,2008,
22、33(2):309-313.5 尹璐. 人脸精确定位算法研究:(硕士学位论文).北京:北京工业大学,2007.04.6 贾换霞,吴建华.人脸图像定位算法J.仪器仪表学报,2005,26(8):410-415.7 阮鹏,赵明生. 安全监控中的一种快速人脸定位算法.中国图像图形网,2006,125-129.8 马瑜,王有刚,陈鲁.正面人脸的眼睛精确定位算法J.计算机应用,2007,27(6):1482-1487.9 刘直芳,游志胜,王运琼.基于一种新的非线性彩色空间的人脸检测J.数据采集与处理,2004,19(2):407-409.10 龙伶敏.基于 Adaboost 的人脸检测方法及眼睛定位算法
23、研究:(硕士学位论文).四川:电子科技大学,2008.04.11 胡旭鸣.计算机人脸定位算法研究J.电脑知识与技术,2011,7(8):1865-1866.12 涂承胜,陆玉昌.Boosting 理论基础.计算机科学,2004,10( 31):11-14.13 艾海舟,肖习攀,徐光裕.人脸定位与检索.计算机学报J,2003,26(7):874-880.14 Rafael C.Gonzalez Richad E.Woods.数字图像处理(第二版).阮秋琦,阮宇智.北京:电于工业出版社,2003.15 陶霖密,彭振云,徐光枯.人体的肤色特征.软件学报,2001,7(12):1031-1041.16
24、 周杰,卢春雨.基于方向对称变换的人脸定位J.电子学报,1999,27(8):12-15.18 张永亮. 基于 DSP 的人脸检测和定位算法研究 :(硕士学位论文).山西:太原科技大学,2008.04.19 张宏林.Visual C+ 数字图像模式识别技术及工程实践 M.人民邮电出版社 ,2003.Research on Human Face Detection AlgorithmMajor: Computer science and technology Name:YangYe Tutor:ZhaoHuiHuangAbstract: Face localization refers to a
25、 kind of technology that can find and locate all the exact positions of faces in given still images or videos, regardless of the position, size, orientation, and illumination changes of faces in the images. This paper presents some discussions on the face localization problem, and made a lot of experiments in the comprehensive library of standard face with a large face database, so as to establish a reliable face localization algorithm and meet establish a reliable face localization algorithm.Keywords : face localization; Matlab; Binarization; Edge detection; Adaboost algorithm