收藏 分享(赏)

人脸检测算法的研究与实现.doc

上传人:weiwoduzun 文档编号:2317129 上传时间:2018-09-10 格式:DOC 页数:50 大小:852KB
下载 相关 举报
人脸检测算法的研究与实现.doc_第1页
第1页 / 共50页
人脸检测算法的研究与实现.doc_第2页
第2页 / 共50页
人脸检测算法的研究与实现.doc_第3页
第3页 / 共50页
人脸检测算法的研究与实现.doc_第4页
第4页 / 共50页
人脸检测算法的研究与实现.doc_第5页
第5页 / 共50页
点击查看更多>>
资源描述

1、南京邮电大学硕士学位论文人脸检测算法的研究与实现姓名:凌亮申请学位级别:硕士专业:电子与通信工程指导教师:卢官明2011-06南京邮电大学全日制工程硕士研究生学位论文 Abstract IIAbstract Face detection means to detecte face from the image or video background in accordance with certain strategy. Because of its important applications in security access control,content-based retrieva

2、l,video conferencing,facial expression recognition and other fields,face detection have begun to be a very active research topic on the field of computer vision and pattern recognition in recent years. Based on the extensive reading of literatures,this paper elaborates to the present situation and d

3、evelopment of face detection technology,analyzes and summarizes the face detection of the related methods. The study work of this paper mainly includes the following aspects: (1) A method of skin detection algorithm based on the YCbCr color space have been studied. After comparing with several color

4、 space,this paper uses brightness and color separation in the rbCYCcolor space for skin color segmentation.Then it is carried out with the method of binarization processing. In order to eliminate the effect of noise,the paper uses the method of the filtering and mathematieal morphology. (2) A method

5、 of face detection algorithm based on Adaboost algorithm have been studied. For the disadvantages of Adaboost algorithms: When the detector encounters faces rotated,there always occurs center undetected area.So this paper adds two new feature templates,which improve the detection effect greatly. (3)

6、 As skin color detection under complex background image achieves the high false detection rate and the Adaboost algorithms detection result is not satisfactory in multi-pose and multi-face images. In this paper,a novel face detection method combined skin color detection and Adaboost algorithm based

7、on improved model is porposed. At the front of Adaboost detector , the skin color detection is added. The results of experiment show that the method have achieved the purpose of optimizing the detector. Keywords: Face Detection, YCbCr Color Space, Skin Detection, Adaboost Algorithm南京邮电大学学位论文原创性声明 本人

8、声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包 含其他人已经发表或撰写过的研究成果,也不包含为获得南京邮电大学或其它 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的 任何贡献均已在论文中作了明确的说明并表示了谢意。 南京邮电大学学位论文使用授权声明 南京邮电大学、中国科学技术信息研究所、国家图书馆有权保留本人所送 交学位论文的复印件和电子文档,可以采用影印、缩印或其它复制手段保存论 文。本文电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文 外,允许论文被查阅和借阅,可以公布(包

9、括刊登)论文的全部或部分内容。 论文的公布(包括刊登)授权南京邮电大学研究生院(筹)办理。 研究生签名:_ 日期:_ 研究生签名:_ 导师签名:_ 日期:_ 南京邮电大学全日制工程硕士研究生学位论文 第一章 绪论 1第一章 绪论 1.1 课题背景及研究意义 近年来,随着计算机科学在机器视觉领域的飞速发展,人脸检测作为人脸图像信息处理中的基础,现在已经成为计算机视觉与模式识别1领域研究十分活跃的课题,也是现阶段生物体身份识别的重要组成部分。 人脸检测2是指对输入任意图像,按照一定策略确定出是否含有人脸,如果有,则返回人脸的大小、位置和姿态。它是一个复杂的具有挑战性意义的模式检测问题。近年来已受到

10、许多科研机构及单位的高度重视,成为一项研究十分活跃的课题。 生物特征检测与识别是模式识别及计算机视觉3的研究热点课题,其研究成果在安全防护、交通监控、商业等领域有着重要的应用。经过近十年高速发展,生物特征检测作用已经逐渐显现出其价值,并运用在许多重要的商业领域。在生物特征检测中,人脸检测是一个重要而具有研究意义的方向,具体表现在视频监控、门禁准入系统、数字视频处理等领域。典型应用如下: 视频监控:监控的对象是人,而人脸极大的反映出个体的特征。 人脸识别:人脸检测是人脸识别的前提,我们只有检测出图像中人脸的位置、大小,才能对其进行进一步的识别处理。 人机交互:人脸特征(肤色、轮廓、表情)、以及姿

11、势都是新一代的人机交互的核心组成部分。 基于内容的图像检索:根据图像中人脸特征信息来检索是基于内容检索的一个重要分支。 视频会议:人脸由于具有极其丰富的特征,在视频会议中最能表达参会者想法的部分,所以要求在压缩时应该单独处理。 数码相机:通过人脸检测技术首先确定出视角区域内人脸的位置和大小,然后根据人脸的面部特征自动进行对焦、曝光等参数的调整。 人脸识别的第一步就是从图像中检测出人脸的大小、位置信息。早期的人脸检测由于研究水平限制只针对比较简单的图像,随着模式识别技术的发展以及自动化程度的提高,对人脸检测的实时性和准确性提出了更高的要求。所以人脸检测开始逐渐被作为一个独立的领域进行研究。人脸检

12、测研究具有重要的学术及应用价值。研究挑战性在于: 南京邮电大学全日制工程硕士研究生学位论文 第一章 绪论 2(1)人脸具有相当复杂的细节变化:不同的外貌,不同的表情,不同头部姿势等; (2)现实中人脸的遮挡情况:眼镜、头发、饰物以及其他外部物体等; (3)由于外部条件造成影响:成像角度的不同造成人脸的多姿态,光照的影响等; (4)还有可能图像的成像条件:摄像设备的焦距、成像距离,图像获得的途径等; 这些因素都为人脸检测造成大的困难。如果能够找到一些相关的算法并能在应用过程中达到可观的效果,将为成功构造出具有实际应用价值的人脸检测与识别系统提供保证。 面部是人类携带信息最丰富的部位之一,除了轮廓

13、、表情之外,还有五官的特征及分布,是人类的重要特征。对于人脸的研究主要包括有人脸检测技术(Face Detection)研究和人脸识别技术(Face Recognition)研究。而人脸检测是人脸识别(Face Recognition)的基础。如今,其不仅在理论上具有重要的研究意义,而且在现实生活中也有着重要的应用价值。 本文的研究工作是如何快速、精确地在一幅图片中检测出人脸,具有重要的现实意义。 1.2 人脸检测技术研究现状 人脸检测作为人脸信息处理中的一项关键技术,具有着广阔的应用前景,它越来越受到研究者们的关注。当今国外从事人脸检测研究机构非常多,比较著名的有MIT,CMU等;国内的清华

14、大学、中科院计算所和自动化所等都有人员从事人脸检测相关的研究。而且MPEG标准组织已经建立了人脸识别草案小组,人脸检测算法也是一项征集的内容。随着人脸检测研究的不断深入,国际上发表的相关论文数量也飞速增长,如IEEE FG(International Conference on Automatic Face and Gesture Recognition)、ICIP(International Conference on Image Processing)、CVPR(Conference on Computer Vision and Pattern Recognition)等重要国际会议上每年

15、都有大量关于人脸检测的论文4。 人脸检测实际上是一个二值的分类问题,即在一幅图像中只有人脸和非人脸之分,人脸检测的目的就是确定图像中的人脸区域和非人脸区域。随着研究人员对人脸检测问题研究的深入,人们提出了很多优秀的人脸检测方法。总体上讲,目前国内外研究人脸检测方法可以归纳为三种方法5:基于几何特征的检测方法、基于肤色模型的检测方法以及基于统计理论的检测方法6-8。 南京邮电大学全日制工程硕士研究生学位论文 第一章 绪论 31.2.1基于几何特征的检测方法9 所谓人脸几何特征是指:人脸面部器官在几何上体现出来的特征。即现实中通过肉眼观察,总结出人脸区域区别于非人脸区域的特征,如面部几何结构等。然

16、后根据被检测图像区域是否满足这些“人脸特征”从而来判定该图像区域是否包含人脸。本节分以下四个方面介绍:人脸轮廓特征、灰度分布特征、模板特征。 (1)基于人脸轮廓特征的检测方法10 轮廓是人脸头部的重要特征。边缘检测是提取人脸轮廓特征的第一步骤,通常可以采用Sobel、Canny等算子来提取图像边缘。由于噪声的存在,利用这些边缘检测算子检测到的图像边缘一般是不连续的,因此需要采用各种边缘连接算法把属于同一轮廓的各段边缘连接起来。Craw等首先在低分辨率图像中使用一个轮廓模板匹配出人脸轮廓的大致范围,然后在高分辨率图像中使用Sobel算子获得边缘的位置和方向,并连接出完整的人脸轮廓。相对于其它灰度

17、特征,轮廓特征对光照变化具有一定的鲁棒性,但在强光照变化下会产生一些伪边缘。 (2)灰度分布特征 人脸核心区域包括嘴、鼻子、眼睛。其具有独特的灰度分布特征,根据灰度分布特征可以建立若干规则,应用这些规则就可以将检测图像中是否存在人脸的问题转化为检测该图像中是否存在满足这些规则的图像块的问题。这类方法中最具有代表性的成果Yang等11提出了基于镶嵌图(Mosaic Image)又称为马赛克图的人脸检测方法。他们建立了一个基于知识的三层检测系统。Yang等先将人脸的五官区域划分为44个马赛克块,每块的灰度取块中各像素灰度的均值,使用一组规则进行检验,确定人脸候选区域,然后将人脸的区域划分为88个马

18、赛克块,重新构建镶嵌图,再使用一组规则从候选区域定位人脸区域,最后将得到的人脸区域二值化,利用边缘特征进一步验证镶嵌图方法虽然检测率不是很高,但镶嵌图和分级搜索的思想在其它人脸检测方法中得到了广泛应用。 该类方法的优点是如果使用丰富的人脸特征,能适用于复杂图像中的人脸检测,当使用人脸特征较少时,可实现实时检测与跟踪。但是该方法的缺点是在很大程度上依赖于人脸的先验知识。 (3)模板特征 模板匹配法12是指从构造人脸或某些面部器官的组合模板出发,通过模板搜索与匹配算法,结合对于模板参数的调整,比较检测区域与模板的相关性,从而达到检测的目的。 南京邮电大学全日制工程硕士研究生学位论文 第一章 绪论

19、4由于人脸区域的灰度其本身可以作为模板特征,所以,基于模板匹配方法可以有效检测到图像中的人脸。模板匹配法是利用已知的模板利用某种算法对识别图像进行匹配计算获得图像中是否含有该模板的信息和坐标;由于这种方法要求两幅图像上的目标要有相同的尺寸和光照条件,所以预处理要做尺度归一化和灰度归一化的五官特征、模板特征。由于模板本身不是很精确的模型,因此这类方法检测精度不高,并且基于模板的人脸检测方法计算量也比较大。 该类方法适于简单背景下的单人正面人脸检测,在复杂背景下或者面部有遮挡情况下很难获得理想的检测效果。 1.2.2基于肤色模型的检测方法13-17 肤色是人脸特征中最重要信息,其具有不依赖于面部的

20、细节特征如旋转,表情等变化,具有相对的稳定性并且和大多数背景物体的颜色相区别。所以利用肤色特征是人脸检测中是最常用的一种策略。肤色特征可以由肤色模型给予描述。 肤色模型,即用一种代数的或查表等形式来表达哪些像素的色彩属于肤色,或者表征出某一像素的色彩与肤色的相似程度。肤色模型可以划分为聚类模型和高斯模型两种。前者主要通过色彩空间的变换,使得肤色在某一颜色空间中呈现良好的聚类性,然后将这一聚类在颜色空间中的分布区域用一种简便的代数解析式表达。后者利用统计学的原理,认为肤色在特征空间中符合高斯分布。 基于肤色模型的人脸检测方法应用广泛,其对姿态、面部表情不敏感,在简单背景下检测率高,而其在光照和复

21、杂背景下检测效果不够理想,故其经常与其它方法相结合使用。 1.2.3基于统计理论的检测方法 基于统计理论的人脸检测方法是利用统计分析思想和机器学习的方法来寻找人脸样本与非人脸样本各自的统计特征,再用各自的特征构建分类器,用分类器完成人脸检测。由于人脸图像的复杂性,显式地描述人脸特征困难很大,因此基于统计模型的方法越来越受到人们关注。此类方法将人脸区域看作一类模式,即模板特征,使用大量的“人脸”与“非人脸”样本训练,构造分类器,之后通过判别图像中所有可能区域属于哪类模式的方法实现人脸的检测。实际上,人脸检测问题被转化为统计模式识别的二分类问题。 南京邮电大学全日制工程硕士研究生学位论文 第一章

22、绪论 5基于统计理论的人脸检测方法特点是检测精度高,但也都存在着共同的问题,一方面是用于训练输入的样本维数过高、计算量太大、不容易收敛,并且搜索的过程也会很慢;另一方面就是很难找到一个标准的非人脸的样本来适应各种情况。 基于统计理论的人脸检测方法主要有:基于特征空间的方法18、支持向量机方法、人工神经网络方法和Boosting方法19-24。 (1)基于特征空间的方法 此类方法将人脸区域图像通过某种代数方式变换到某一特征空间,根据其在特征空间中的分布规律划分 “人脸”与“非人脸”两类模式。 主分量分析(Principal-Component Analysis,PCA)25是一种常用的方法。它根

23、据图像的统计特性进行正交变换(K-L变换),以消除原有向量各个分量间的相关性。变换得到对应特征值依次递减的特征向量,即“特征脸”。人脸在特征脸空间的投影聚集比较紧密,因此利用前将若干张特征脸将人脸向量投影到主元子空间和与其正交的补空间,相应的距离度量分别称DIFS(Distance In Feature Space)和DFFS (Distance From Feature Space)26。对于人脸检测问题,由于没有考虑“非人脸”样本的分布,需要同时使用DIFS和DFFS才能取得较好的效果。 (2)支持向量机方法的检测方法 支持向量机(Support Vector Machines,SVM)是

24、V.Vapnik等27提出的基于结构风险最小化原理(Structural Risk Minimization Principle, SRM)的统计学习理论,用于分类与回归问题。SRM使VC(Vapnik Cherovnenkis)维数的上限最小化,这使得SVM方法比基于经验风险最小化(Empirical Risk Minimization Principle, ERM)的人工神经网方法具有更好的泛化能力。Osuna等28将SVM方法用于人脸检测,取得了较好的实验结果。该方法的基本思路是对每一个1919象素的检测窗口使用SVM进行分类,以区分“人脸”和“非人脸”窗口。SVM的训练使用了大量人脸样

25、本和“自举”方法收集的“非人脸”样本。SVM分类器经训练后,得到最优分类超平面,可用于图像中的面部检测。需要说明的是,长期以来SVM的训练需要求解计算复杂度极高的二次规划问题,限制了该方法的应用。Platt29,30提出的SMO(Sequential Minimal Optimization)算法解决了SVM训练困难的问题。 (3)基于人工神经网络的检测方法 人工神经网络(ANN)方法是将模式的统计特性隐含在ANN的结构和参数之中。它将人脸检测看作是区分人脸和非人脸样本的模式分类问题,通过对两种样本集进行学习以产生分类器。Rowley等31在1996年提出了基于ANN的人脸检测方法,他们采用局

26、部连接的神经网络检测人脸,将每个区域划分成多个矩形子区域以用于描述人脸的局部特征,每个区域对应一南京邮电大学全日制工程硕士研究生学位论文 第一章 绪论 6个神经网络隐含单元。该方法给出了用统计学习方法解决人脸检测问题的一般框架,但是检测速度较慢。另外,Rowley等32又将上述方法进行了扩展,并采用姿态预估计来提升检测速度。神经网络具有记忆功能,当训练样本比较全面时,神经网络能够训练出一个感知人脸复杂模式的分类器。但事先需要对大量的正反例进行学习,耗费大量时间。该方法的检测性能较强,但检测速度较慢。 (4)基于Boosting的检测方法 Boosting方法是有效的将弱分类器组合成为强分类器的

27、统计学习方法,是一种不断改善自身准确性的通用方法,也是近年来的研究趋势和热点方向。Boosting方法基本思想为对训练失败的样本赋以较大的权值,让学习算法在后续的学习中集中对比较难的训练样本进行学习,最后将由算法挑选出来的若干个分类器加权相加组成强分类器。 P.Viola等33,34在2001年提出一种基于Boosting方法的实时人脸检测系统。其首先在此需要引入积分图来计算Haar特征,从而大量减少了重复运算。第二,使用Haar-like矩形特征构建弱分类器,并将弱分类器提升为级联结构的强分类器,在此基础上构建了第一个近乎实时的正面人脸检测系统。S.Z.Li等在2004年提出了称为Float

28、Boost的学习方法。与Adaboost方法相比,FloatBoost在Adaboost方法的每一步循环后加入了一项返回机制,使得该方法直接以错误率最小化为学习目的,优于传统Adaboost方法。基于统计模型的方法是目前比较流行的方法,是解决复杂的人脸检测问题的有效途径,它具有如下优点: (1)不依赖于人脸的先验知识和参数模型,可以避免不精确或不完整的知识造成的错误;(2)采用了实例学习的方法获取模型的参数,统计意义上更为可靠; (3)通过增加学习的实例可以扩充检测模式的范围,提高检测系统的鲁棒性。 基于统计模型的方法大多适用于复杂背景图像中的实时人脸检测,但是由于其前期训练时间较长,故仍有待

29、改进。 1.2.4人脸检测方法的性能指标 人脸检测方法的性能指标主要有以下几点: (1)检测率 (detection rate):被正确检测到的人脸数与原图像内包含的人脸数的比值。检测率越高,说明检测系统对人脸的接受能力越强; (2)误检率 ( false alarm rate):被误检为人脸的非人脸子窗口数与原图像内被检测的所有人脸子窗口数的比值; (3)检测速度(detecting speed):大部分应用领域需要在线实时地检测人脸,如人脸识别、南京邮电大学全日制工程硕士研究生学位论文 第一章 绪论 7人脸跟踪、可编程视频监控等。在检测率和误检率达到满意的前提下,检测速度越快越好; (4)

30、鲁棒性 (robustness):在各种条件下,检测系统的适应能力。基于肤色模型方法无法检测灰度图像;大部分检测系统无法检测任意角度旋转的人脸,一般把旋转角度限制在一定范围内;有些检测方法受复杂背景的干扰,在背景较简单时效果好,反之较差。 这四个性能指标有些是互相制约的,如检测率和误检率就经常需要权衡,实践表明误检率随着检测率的提高而提高,检测率随着误检率的降低而降低;研究表明神经网络方法,检测率己经达到90%以上,误检率也很低,但检测速度慢是其最大缺陷;而模板匹配方法检测速度虽然快,但其距离函数在不同环境下产生的效果差异很大,如背景简单时检测效果好,背景复杂时效果很差,这就是其鲁棒性不好的表

31、现:肤色模型也有鲁棒性不好的毛病,因为肤色容易受到复杂背景、光线等条件的影响,而且对灰度图无能为力。 1.3本文的主要内容及章节安排 随着模式识别技术发展以及人机交互技术逐渐成为当前研究的热点。人脸检测问题越来越受到重视,成为模式识别与计算机视觉领域研究的一个活跃课题。人脸检测问题涉及到的内涵十分广泛,已有的方法一般都是针对某一类问题提出的。由于人脸检测问题的复杂性,实现通用的人脸检测方法还不现实,因此解决特定约束条件下,或者是某种应用背景下的人脸检测问题仍将是该领域研究的主要难点。 1.3.1本文的主要工作 本文的研究工作是如何快速、精确地在一幅图片中检测出人脸。具体研究如下: (1)研究了

32、一种基于YCbCr彩色空间的肤色检测方法。在比较肤色在各种色彩空间中的聚类性后,利用在亮度和色度分离的YCbCr色彩空间中对肤色进行分割,然后再进行二值化处理。对二值化处理后的图像进行滤波、形态学处理,以消除噪声的影响。 (2)研究一种基于Adaboost算法的人脸检测方法。详细介绍了Adaboost算法的Haar特征、积分图像、弱分类器、强分类器的概念。并针对遇到倾斜人脸时,容易出现漏检的现象,增加了新的特征模板,训练得到新的强分类器,增强了对倾斜人脸的检测效果。 (3)针对肤色检测对复杂背景下的图像误检率高和Adaboost算法对多姿态、多人脸图像检测效果不理想的问题,提出基于改进的Ada

33、boost算法和肤色检测的人脸检测方法。在Adaboost检测器前端加入了肤色检测模型,达到了优化检测的目的。 总之,本次研究利用基于肤色特征和Adaboost算法的方法实现对人脸快速而又准确的检南京邮电大学全日制工程硕士研究生学位论文 第一章 绪论 8测。单一的利用肤色特征对人脸进行检测,其检测率不高,所以要和其他检测方法相结合,同时大量实验证明:基于Adaboost算法的人脸检测具有很高的检测率,但是其训练时间也比较长。所以如何在保证其较高检测率条件下减少检测时间,也是本次研究的主要内容。 1.3.2 论文章节安排 第一章 概述了人脸检测的研究目的、意义及国内外动态并对本课题的研究内容进行

34、阐述。 第二章 介绍了基于YCbCr彩色空间的肤色检测原理,详细阐述了肤色模型颜色空间的选取及肤色图像的分割方法以及对分割后的图像进行处理的方法。 第三章 研究了基于Adaboost算法的人脸检测的原理,对该学习算法的原理做了详细的分析和研究。其中包括如何利用积分图像快速地计算Haar特征、弱分类器、强分类器以及级联分类器的训练方法。 第四章 详细分析了Adaboost算法的优缺点,针对其不足之处提出了改进方法:一是增加新的特征模板,降低对一定倾斜角度的人脸检测时的漏检率;二是利用肤色检测模型对前端优化检测器,缩短了检测时间,提高检测率。 第五章 总结与展望。对全文工作进行一个总结,并对下一步

35、人脸检测的研究方向进行了探究。南京邮电大学全日制工程硕士研究生学位论文 第二章 基于YCbCr彩色空间的肤色检测 9第二章 基于YCbCr彩色空间的肤色检测 人类面部的肤色,不依赖于面部的细节特征,肤色虽然因人而异,只要人脸不是被完全遮挡,很多研究表明肤色在色彩空间中的一定范围内还是呈聚类特性的35。因此,肤色特征具有相对的稳定性,能与大多数背景物体的颜色相区别。这在人脸检测中会起到积极的作用。所谓肤色模型,也和其他的数学建模一样,即用一种代数的或其他等形式来表达哪些像素的色彩属于肤色,或者表征出来某一像素的色彩与肤色的相似程度。这种模型主要通过色彩格式的变换,使得肤色在某一色彩空间中呈良好的

36、聚类特性, 然后将这一聚类在色彩空间中的分布区域用一种简便的代数解析式加以表达。 基于YCbCr彩色空间的肤色检测流程如图2-1所示: 图2-1 肤色检测 一般建立肤色模型时要考虑两方面的因素:(1)应选取哪种颜色空间;(2)如何利用肤色分布来精确地建立模型。 2.1 彩色空间 彩色空间也称彩色模型(又称颜色空间或彩色系统)它的用途是在某些标准下用通常可接受的方式对彩色加以说明。颜色通常用三个相对独立的属性来描述,三个独立变量综合作用,自然就构成一个空间坐标,这就是颜色空间。而颜色可以由不同的角度,用三个一组的不同属性加以描述,就产生了不同的颜色空间。但被描述的颜色对象本身是客观的,不同颜色空

37、间只是从不同的角度去衡量同一个对象。数字图像中一个像素点的颜色可以有很多种表示方法,本节介绍了常用的色彩空间,分析了肤色在各空间分布情况,并选出聚类性较好的空间。 2.1.1 RGB彩色空间 几乎所有的彩色成像设备和彩色显示设备都采用RGB(Red/Green/Blue,红绿蓝)三基色,不仅如此,数字图像文件的常用存储格式,也以RGB三基色为主,由RGB三基南京邮电大学全日制工程硕士研究生学位论文 第二章 基于YCbCr彩色空间的肤色检测 10色为坐标形成的空间称为RGB彩色空间。 根据色度学原理,自然界的各种颜色光都可由红、绿、蓝三种颜色的光按不同比例混合而成,同样,自然界的各种颜色光都可分

38、解成红、绿、蓝三种颜色光,所以将红、绿、蓝三种颜色称为三基色。 RGB彩色空间是一立方体模型。在RGB三维空间中,采用三个互相正交的坐标轴来分别对应表示红绿蓝三基色,原点对应于黑色,离原点最远的顶点对应于白色,其他颜色落在三维空间中由红绿蓝三基色组成的彩色立方体中。其他的颜色空间通常以RGB颜色空间为基础,其分量可以描述为RGB三色的线性或非线性函数。RGB颜色空间的主要缺陷是其各通道高度相关、亮度与色度混合在一起。 2.1.2 HIS彩色空间 HIS彩色空间是由Munseu提出的彩色系统格式。是以色彩的色调(hue)、饱和度(saturation)、亮度(intensity)为三要素来表示的

39、。这种设计反应了人观察彩色的方式,同时也有利于图像处理。 色调(Hue)表示颜色,颜色与彩色光的波长有关,将颜色按红橙黄绿青蓝紫顺序排列定义色调值,并且用角度值(3600)来表示。例如红、黄、绿、青、蓝、洋红的角度值分别为0、60、120、180、240、和300。 饱和度(Saturation)表示色的纯度,也就是彩色光中掺杂白光的程度。白光越多饱和度越低,白光越少饱和度越高且颜色越纯。饱和度的取值采用百分数(0%100%),0%表示灰色光或白光,100%表示纯色光。 强度(Intensity)表示人眼感受到彩色光的颜色强弱程度,它与彩色光的能量大小(或彩色光的亮度)有光,因此有时也用亮度(

40、Brightness)来表示。 通常把色调和饱和度统称为色度,用来表示颜色的类别与深浅程度。人类的视觉系统对亮度的敏感程度远强于对颜色浓淡的敏感程度,对比RGB彩色空间,人类视觉系统的这种特性采用HIS彩色空间来解释更为适合。HIS彩色描述对人来说是自然的、直观的,符合人的视觉特性,HIS模型对于开发基于彩色描述的图像处理方法也是一个较为理想的工具,例如在HIS彩色空间中,可以通过算法直接对色调、饱和度和亮度独立的进行操作。采用HIS彩色空间有时可以减少彩色图像处理的复杂性,提高处理的快速性,同时更接近人对彩色的认识和解释。 HIS彩色空间是一个圆锥型空间模型。圆锥模型可以将色调、强度以及饱和

41、度的关南京邮电大学全日制工程硕士研究生学位论文 第二章 基于YCbCr彩色空间的肤色检测 11系变化清楚地表现出来。圆锥型空间的竖直轴表示光强I,顶部最亮表示白色,底部最暗表示黑色,中间是在最亮和最暗之间过渡的灰度。 圆锥型空间中部得水平面圆周是表示色调H的角度坐标。 在处理彩色图像时,为了处理方便,经常要把RGB三基色表示的图像数据转换成HIS数据。RGB彩色空间转换到HIS彩色空间的转换公式如下: 2BGH BG= (2-1) ()()()()()212arccosRGRBRGRGGB+=+(2-2) )(31 BGRI+= (2-3) () 31min,SRGB RGB= + (2-4)

42、 2.1.3 YCbCr彩色空间36 YCbCr则是在世界数字组织视频标准研制过程中作为ITU-RBT1601建议的一部分,JPEG、MPEG均采用此格式。是DVD、摄像机、数字电视等消费类视频产品中,常用的色彩编码方案。YCbCr彩色空间中Y是指亮度分量,Cb指蓝色色度分量,而Cr指红色色度分量。人的肉眼对视频的Y分量更敏感,因此在通过对色度分量进行子采样来减少色度分量后,肉眼将察觉不到的图像质量的变化。YCbCr颜色空间同HIS空间一样,具有将亮度分量与色度分量分离的优点,并且肤色在YCbCr空间上表现出比较好的色度聚类性。不过与HIS的非线性转化不同的是,它可以从RGB格式线性转化得到。

43、因此YCbCr颜色空间经常被用于建立肤色模型。 YCbCr色彩空间也通过对RGB色彩彩空间的线性转换得到,他们的转换关系如下: 00.22900.58700.11401280.16870.33130.50001280.50000.41870.0813brYRCGCB=+(2-5) 0.004600.0063160.00460.00150.00321280.00460.00790128brRYGCBC=(2-6) 南京邮电大学全日制工程硕士研究生学位论文 第二章 基于YCbCr彩色空间的肤色检测 122.1.4彩色空间的选取 本节介绍了RGB彩色空间,HIS彩色空间,YCbCr彩色空间。RGB格

44、式是图像最常见的存储形式,但各分量之间具有较强的关联性,区分较复杂,难以满足我们寻找在不同光照下具有聚类特性的肤色模型要求。HIS彩色描述对人来说是自然的、直观的,符合人的视觉特性,对于光照等变化有一定鲁棒性,和RGB颜色空间可以相互转换,但缺点是转换呈非线性,比较复杂。 YCbCr彩色空间:此彩色空间继承了HIS空间把亮度分量和色度分量分离开来的优点且CbCr二维分量对光照比较不敏感。并且可以从RGB空间通过简单的线性变换得到。所以本文使用YCbCr彩色空间。 2.2肤色分割 2.2.1常见的肤色模型 上节得到较好的彩色空间后,接下就是建立肤色模型,所谓肤色模型实质上是利用一个代数式判断像素

45、点是否属于肤色,或者计算像素与肤色的相似程度。常用的肤色模型有色度空间模型,高斯模型和直方图模型,三者对应方法为阈值化,参数化,非参数化37。 色度空间模型将彩色图像从RGB空间转换到另一个色彩空间,根据肤色在色彩空间的聚集性,利用大量的肤色样本统计肤色点在该空间上的分布情况。通过观察统计值在各色度分量上的分布特征,规定阈值,然后用此阈值去分割待检测图像,若待检测图像的色度值落在此阈值范围内,判定该像素点为肤色点,反之为非肤色点,以此得到肤色分割的二值图像即肤色区域为白,背景区域为黑。此模型计算简单,运算速度快,但精确度往往不够理想。 高斯模型利用了统计学的原理,认为像肤色这样的符合正态分布的

46、随机样本在特征空间中的分布应该符合高斯分布。主要是计算某像素色度在色度空间的分布概率。首先需要统计计算大量肤色色度样本的均值和协方差,然后利用此模型计算输入像素点在肤色空间中的出现概率。此模型能更好的表示肤色分布,检测率也高出许多,但由于统计大量肤色色度样本,耗时较长。 直方图模型利用直方图来描述肤色在颜色空间的分布情况。通过设定阈值来进行肤南京邮电大学全日制工程硕士研究生学位论文 第二章 基于YCbCr彩色空间的肤色检测 13色与非肤色的判别。尽管在三维直方图中的效果很好,但是其训练样本数量庞大(多大合适,尚不能确定)而且需要较长的训练时间。 本文肤色检测的目的是作为后期Adaboost算法

47、的预处理,这要求肤色模型具有计算简单,运算速度快等特点。所以本文选取在YCbCr彩色空间中实现图像肤色分割。 2.2.2 YCbCr彩色空间中建立肤色模型 虽然不同的人有不同的皮肤颜色,但是研究证明了它们之间主要的区别在于亮度,不是色度空间上的不同。而在YCbCr彩色空间中,Cb和Cr分别代表色度分量,利用其分别限定双阈值将能较好的分割出肤色区域。 具体算法流程如下: (1) 输入图像,进行彩色空间转换。 获取该彩色图像每一像素R、G、B颜色分量值。对每一像素,根据RGB与YCbCr转换公式,分别计算Y、Cb、Cr的值;文献38给出了从RGB彩色空间转换到YCbCr彩色空间公式如下: 00.22900.58700.11401280.16870.33130.50001280.50000.41870.0813brYRCGCB=+(2-7) (2) 肤色点确定 在彩色平面() rbCCP,定义一个矩形区域,这个区域的点就属于皮肤的颜色,这样只要分别确定两个阈值,21 bbCC和,21 rrCC 。对于需要分类的点,如果这个点在平面() rbCCP,上的值),( rbCC在这个范围内,即: 1212bbbrrrCCCCCC (2-8) 那么就认为这个点是属于皮

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 经营企划

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报