收藏 分享(赏)

计算机科学与技术毕业论文:群体人脸检测系统的设计与实现.doc

上传人:文档投稿赚钱 文档编号:1471183 上传时间:2018-07-20 格式:DOC 页数:18 大小:4.93MB
下载 相关 举报
计算机科学与技术毕业论文:群体人脸检测系统的设计与实现.doc_第1页
第1页 / 共18页
计算机科学与技术毕业论文:群体人脸检测系统的设计与实现.doc_第2页
第2页 / 共18页
计算机科学与技术毕业论文:群体人脸检测系统的设计与实现.doc_第3页
第3页 / 共18页
计算机科学与技术毕业论文:群体人脸检测系统的设计与实现.doc_第4页
第4页 / 共18页
计算机科学与技术毕业论文:群体人脸检测系统的设计与实现.doc_第5页
第5页 / 共18页
点击查看更多>>
资源描述

1、 山 西 大 学 论 文 编号:2009241106论文题目 群体人脸检测系统的设计与实现姓 名 院系、专业 计算机与信息技术学院、计算机科学与技术 学 习 年 限 2009 年 9 月至 20013 年 7 月指 导 教 师 学 位 级 别 学 士 20013 年 5 月 18 日0群体人脸检测系统的设计与实现学生姓名: 指导教师:内容提要 人脸检测的对象主要来源是摄像头获取的图像或者本地图像,检测前对图像进行预处理,其主要操作包括对图像进行光线补偿,二值化,开闭运算等。经过预处理后图像所包含的主要信息是类人脸区域.本文通过对人脸的数学形态特征的研究来确定人脸判定的算法,其中主要有填充率,几

2、何比例,区域面积和面积比率四个方面。最终本系统的测试结果显示人脸检测率能达到85%左右。关键词 人脸检测;光线补偿;二值化;开闭运算;联通区域1. 引言1.1 研究目的和内容肤色是人类所特有的颜色特征,利用肤色来对图像进行分析具有其他方法无法比拟的潜在优势。本文研究的目的是利用人类的肤色特征,在具有复杂背景下的情况下,对肤色进行分割,分离出肤色区域,运用数学的形态学处理,对图像进行预处理,在预处理后的图像中通过对肤色区域的特征匹配,最终确定并标注人脸区域。围绕基于肤色的人脸检测,本文主要包括以下内容:(1)对图像的存储原理和像素排列进行了较为全面的研究,分析了图像像素获取的三种方法,通过对比各

3、种方法的优劣,选择最适合本系统的像素获取方法。(2)创建肤色模型进行肤色分割。颜色空间有很多种,包括RGB颜色空间,YCbCr颜色空间,HSV颜色空间,HIS颜色空间等,对比它们对肤色的敏感度和运算效率,本文最终选用RGB和YCbCr颜色空间。通过比较肤色在这两种颜色空间上的分布,采用双阈值的方法进行肤色分割。(3)使用数学方法对图片进行预处理。对图片的预处理包括腐蚀、膨胀、开运算和闭运算。其中,腐蚀运算可以有效的消除二值图像中的细小噪声并且分离细小的联通区域,极大的减少了后期对非人脸区域的处理,显著的提高运算速度;膨胀运算是和腐蚀运算相对而言的,它可以消除肤色区域中的噪声,联通因外界因素所造

4、成的同一人脸分离的区域。而开运算就是指先做腐蚀操作,再做膨胀操作;闭运算则是先做膨胀操作,再做腐蚀操作。(4)消除非人脸区域。由于人脸具有鲜明的几何特征,可以通过以下几个方面消除非人脸区域:长宽比,面积,填充率,面积比值等。通过这些操作就可以基本确定人脸区域的范围了。(5)标记人脸。经过上述的操作,剩下的基本可以确定是人脸,但是又不能完全排除非人脸区域的存在,所以最后标记不免有误检和漏检的情况。1.2 国内外研究现状目前,国外对人脸检测问题的研究很多,美国,英国等许多国家有大量的研究组从事人脸检测的研究,这些研究受到军方,警方以及一些公司的高度重视和资助。对人脸检测1问题的研究比较著名的有美国

5、麻省理工大学(MIT)的媒体实验室和人工智能实验室,卡内基梅隆大学(CMU)的机器人研究所以及Illinois大学的Beckman研究所等。自1995年以来,国外一些公司看准了人脸识别系统在商贸和保安方面的广阔应用前景,动用了大量人力和物力,独立研制或与高校合作,开发了多个人脸识别系统,其中大多数产品将人脸检测作为系统的一个重要组成部分,有代表性的有如下产品:德国Cognitec Systems公司的Face VACS人脸识别系统;美国Identix公司的FaceIt人脸识别系统;加拿大Imagis公司的ID-2000面部识别软件;美国Viisage公司的FaceTools人脸识别系统等。在国

6、内也有许多学校和单位从事人脸检测与人脸识别相关的研究。比如清华大学、北京 大学、亚洲微软研究院、中科院计算技术研究所、西北工业大学和中国科学院自动化研究所等都有人员在从事人脸检测相关的研究。国内也有一些人脸检测的研究转化为商品的实例,主要代表是考勤机和门禁卡,比如汉王的人脸识别考勤机、科密人脸识别考勤机以及,广州超越软件公司的BioFace系统等等。2. 需求分析2.1 需求产生对图像目标的检测与识别是机器识别领域中一项十分重要的研究内容,而对人脸的检测与识别又是一项十分具有现实意义的研究,人脸信息是图像和视频中最重要的开放信息源之一。通过对人脸的检测和识别可以确定个体的性别,年龄,表情,姿态

7、等信息。对人脸信息进行处理和研究已经成为现阶段基于生物特征进行的身份验证的重要组成部分之一,也是模式识别与机器视觉领域内所关注的重要问题。人脸检测是指在输入的图像信息中提取人脸的位置,姿态,大小并且标记的过程。人脸检测作为人脸识别技术中的一个关键性的问题,近年来一直备受各研究机构的重视,相关研究课题十分活跃。但是早期的人脸识别是建立在假设人脸区域已知的条件下的,所以人脸检测的研究并未受到足够的重视,近年来,随着电子商务的普及,在复杂情况下进行自动的人脸识别,首先要做的就是确定人脸区域,人脸检测的研究就显得日益迫切。同时,经过几十年的发展,人脸检测的技术已经不仅仅局限于人脸识别,在人工情感计算,

8、基于内容的检索,数字视频处理,视觉检测等方面都有着重要的应用价值1。人脸检测与识别技术的研究最早始于60年代末七十年代初,迄今己有40多年的历史,经过几十年的曲折发展已日趋成熟。作为一种重要的个人身份鉴别方法,人脸检测与识别技术可以广泛地应用于国家安全、智能门禁、视频监控、公安布控、身份验证等多种场合。与其他身份鉴别方法相比,具有直接、友好、方便和鲁棒性强等特点,因此,人脸检测与识别问题的研究不仅在模式识别中具有重大的理论意义,而且具有很强的实用价值。2.2 功能需求分析该软件的最主要的功能就是能够标记出人脸。首先系统需要通过摄像头或者本地的磁盘获取图像,然后对该图像进行预处理。预处理的过程是

9、人脸检测过程中非常重要的一个步骤,处理的好坏与否直接关系到后期的检测效果。最后对图像进行人脸标记。因此本设计所要完成的主要功能如下所示:图像获取功能:该模块主要完成的任务是从摄像头或者本地磁盘获取源图像,获取后的图像可以在系统界面预览。图像预处理功能:该模块对图像的操作主要包括光纤补偿,二值化,腐蚀膨胀运算和开闭运算等。2人脸标记功能:该模块的功能是正确标记人脸位置,用黄色矩形框圈住人脸,并且将结果在系统界面显示出来。人脸个数统计功能:该模块能统计出图像中能识别出的人脸的个数。2.3 开发环境需求分析(1)硬件环境具有可靠性,可用性和安全性,具有完善的技术支持。能够满足个人学习和设计需要。其中

10、CPU在1GHZ以上,内存在512M以上。(2)软件环境本系统需要运行在有持续工作能力、高稳定性、高度可集成的开放式标准的操作系统上,如windows操作系统。在系统开发上需要面向对象的高级程序设计语言处理软件,如visual studio2010。需要熟悉C#高级程序设计语言。2.4 可行性分析在开发人脸检测程序之前,我参考了许多前人所写过的诸多论文和源程序,在开发的过程中又加入了自己的开发思想,最终成功实现了对图片的人脸检测。在技术上对人脸进行测大致可以分为三个步骤,图像获取,图像预处理,人脸标记。其中在图像预处理上有很多的方法,我们可以根据有选择的对图像进行处理。在本系统中我选择的过程是

11、,光线补偿,二值化,腐蚀膨胀运算,开闭运算。在人脸标记过程中主要包括联通区域统计,去除假区域,标记人脸区域。在操作上使用现有已经成熟稳定的windows操作系统,微型机的硬件配置已基本满足要求,操作上完全可行。3. 群体人脸检测系统的设计3.1 系统功能模块图该系统的功能模块图如图 1 所示:图 1 系统功能模块图33.1 系统结构图本系统的结构分为图像输入,图像处理,图像输出三个模块,其系统结构图如图 2 所示:图 2 系统结构图3.2 系统流程图本系统的执行过程是自动执行的,用户不能单独执行流程图中的某一步每一次进行人脸检测都会按照下列步骤进行,系统流程图如图 3 所示:图 3 系统流程图

12、图像的所有像素点人脸检测算法 包含人脸区域在内的一系列矩形图像输入 图像处理 图像输出联通区域统计去除非人脸联通区域标记人脸区域图像二值化腐蚀膨胀运算打开图像,读取数据光线补偿43.3 基于 YCbCr 和 RGB 颜色空间的肤色建模3.3.1 RGB 色彩空间RGB色彩空间也称为红,绿,蓝色彩空间。它的三中基色是红色(波长 )70.nm,绿色( )和蓝色( )。利用这三种基色表示所有的颜色就是546.1nm435.8nmRGB色彩空间,也是现在最常用的色彩空间。在现在绝大多数有彩色显示功能的设备上,屏幕的发光原理就是根据RGB色彩空间的原理来实现的,这种颜色表示方法简单易懂,硬件上又特别容易

13、实现,所以在当今的多媒体技术中应用最多的就是RGB色彩空间。自然界中任何一种颜色都可以使用R,G,B三基色按不同的比例混合而成。三种基色的值域为0到255,当三基色的值都为0时,表示的颜色是黑色;当三基色都为最大值时,表示的颜色是白色。改变三基色中任何一个分量的值都会改变其所表示的颜色。这种颜色空间的物理特性非常明显,可以很好的应用到数据的处理上。RGB颜色的色彩表示立方体如图4所示:图 4 RGB 色彩立方体图然而,RGB色彩空间的颜色通道的相关性过高,信号感觉的不统一,色度和亮度数据的混淆使得RGB模型不能成为颜色分析和基于颜色的检测算法的最佳选择。肤色在RGB颜色空间上的分布规律性很差,

14、如果只用RGB色彩空间进行肤色建模无疑将既复杂又不好控制。3.3.2 YCbCr 色彩空间YCbCr是DVD、摄像机、数字电视等消费类视频产品中,常用的色彩编码方案。YCbCr不是一种绝对色彩空间,是YUV压缩和偏移的版本。YCbCr其中Y是指亮度分量,Cb指蓝色色度分量,而Cr指红色色度分量。人的肉眼对视频的Y分量更敏感,因此在通过对色度分量进行子采样来减少色度分量后,肉眼将察觉不到的图像质量的变化。YCbCr色彩空间具有以下优点: 具有与人类视觉感知过程相似的构成原理。 YCbCr应用十分广泛,它不只适用于电视领域,在视频编码和常用的png,jpg等图片标准中应用也十分广泛。 不同于RGB

15、的色彩空间,YCbCr色彩空间具有HIS等其他类型色彩空间把亮度信息分离出来的特点。 YCbCr色彩空间可以很容易的从RGB色彩空间转换而来。 另外,在YCbCr色彩空间上,肤色的聚类特性比较好,在分离肤色的时候更加容易5控制。3.3.3 肤色建模为了使肤色分割的过程中肤色判断的更加准确,本文采用了双阈值的肤色分割方法,即使用RGB和YCbCr两种颜色空间来判断肤色,这样可以很好的降低肤色的误判率。从一副图像中可以很容易得到它的RGB序列,通过对每一个像素点的R,G,B分量进行阈值控制就可以初步得到属于肤色的像素点。当R,G,B分量满足公式(1)时,该像素点可能是肤色: 0.3.64298.5

16、rgr同时将RGB色彩空间转换成为YCbCr色彩空间,通过公式(2)运算就可以得到Y, Cb, Cr分量的值: 1665.4812.534.968(/2)*37901*8.2RCb Gr BYcBCr色彩空间基本不受亮度变化的影响,它把亮度信息分离出来,其中Cb和Cr另个分量又相互独立,肤色在此空间上的聚类特性比较令人满意,根据肤色在YCbCr色彩空间上的聚类分布设置另外一个阈值,是肤色的像素点应该满足公式(3): 9012735Cbr这样双阈值的肤色模型已经建立完成。但是,图片的背景是十分复杂的,难免存在类似肤色的颜色存在,图像二值化以后会存在大量的噪声,这对后期的人脸检测是十分不利的,消除

17、噪声就显得尤为重要。3.4 腐蚀,膨胀,开运算和闭运算3.4.1 腐蚀运算腐蚀是一种消除边界点,使边界向内部收缩的过程。可以用来消除小且无意义的物体。在数学形态学中 A 和 B 是两个集合, A 被 B 腐蚀定义为:|()z其中 A 是被腐蚀的集合,B 称为结构元素,将结构元素 B 相对于集合 A 进行平移,只要平移后结构元素都在集合 A 中,那么这些点都是 A 经过 B 腐蚀后所得到的点。图像经过腐蚀后可以消除边界点。如果结构元素 B 选择为 3*3 的矩阵,经过腐蚀后可以使联通区域的边界向内收缩一个像素。而小于结构元素的联通区域则会被去除,这样经过多次的腐蚀就可以把图像中的绝大部分的噪声去

18、除。另外,当结构元素足够大时,腐蚀操作可以将两(1)(2)(3 )6个相互之间有细小联通的区域分开。腐蚀操作的模板卷积图如下:腐蚀操作前集合图如图5 ,腐蚀的结构元素图如图 6 所示,腐蚀操作后的集合图如图 7 所示。图 5 腐蚀操作前集合图 图 6 腐蚀的结构元素图 图 7 腐蚀操作后的集合图3.4.2 膨胀运算膨胀是将与物体接触的所有背景点合并到该物体中,使边界向外部扩张的过程。可以用来填补物体中的空洞。在数学形态学中膨胀的定义为:A 和 B 是两个集合,A 被 B 膨胀就是满足下列集合关系的元素的集合: |()zAB其中 A 是被膨胀的集合,B 是结构元素。将 B 的反射进行平移与 A

19、的交集不为空的元素的集合就是 A 被 B 膨胀的结果。膨胀操作是与腐蚀操作相对而言的,所以二值图像经过膨胀以后,可以消除联通区域内的非肤色噪点,使肤色区域更加连续。同理,如果使用3*3 的结构元素,膨胀操作可以使肤色区域向外扩张一个像素。膨胀操作的模板卷积图如下:膨胀操作前的集合图如图 8 所示,膨胀的结构元素图如图 9 所示,膨胀操作后的集合图如图 10 所示。图 8 膨胀操作前的集合图 图 9 膨胀的结构元素图 图 10 膨胀操作后的集合图73.4.3 开运算和闭运算先腐蚀后膨胀的过程称为开运算。用来消除小物体、在纤细点处分离物体、平滑较大物体的边界的同时并不明显改变其面积。先膨胀后腐蚀的

20、过程称为闭运算。用来填充物体内细小空洞、连接邻近物体、平滑其边界的同时并不明显改变其面积。通常,由于噪声的影响,图象在阈值化后所得到边界往往是很不平滑的,物体区域具有一些噪声孔,背景区域上散布着一些小的噪声物体。连续的开和闭运算可以有效地改善这种情况。有时需要经过多次腐蚀之后再加上相同次数的膨胀或者多次膨胀加上相同次数的腐蚀,才可以产生比较好的效果。比如,经过二值化以后的图像可能存在数量巨大的肤色噪声,这时通过选取适当的结构元素进行开运算就可以消除肤色噪声,而又不改变主要肤色区域的面积和形状。反之,若二值图像皮肤区域之间因外界因素而没有相互连接,选择闭运算可以连接主要肤色区域,使人脸区域更加明

21、显,为后期判断创造有利条件。4. 群体人脸检测系统的实现4.1 光线补偿考虑对图像进行光线补偿的原因是肤色的色彩信息很容易受图像采集时的光线强度,采集设备的色彩偏差和清晰程度等诸多原因的影响。这样会导致图像的整体色彩向某一方向偏差,也就是会形成我们常说的色彩偏冷,色彩偏暖,照片发黄、偏蓝等等的现象。而这些现象在图像中很常见,因此进行光线补偿就显得很有必要。光线补偿的具体做法是先将整幅图像每个像素点的亮度从高到低进行排列,取前 5%的像素,将这些像素作为光线补偿的“参考白” ,同时将这 5%的像素的 RGB 分量都设置成为255。然后,用前 5%像素的亮度的平均值除以 255 就可以得到光线补偿

22、系数。最后扫描整幅图像的每个像素,让每个像素的 RGB 分量都乘以光线补偿系数,如果大于 255,则将此分量的值设置成为 255,否则,保持原来的值不变。经过此处理就可以使整幅图片的亮度进行线性放大。但是不是每一副图像都需要进行光线补偿,有的图像亮度本来就很高,如果对亮度正常的图像进行光线补偿,效果会适得其反。它有可能会使颜色较浅的肤色变成白色,从而会造成图像二值化的时候对肤色区域的误检。因此,我们需要对光线补偿系数设置一个阈值,如果计算出的光线补偿系数小于此阈值,则不进行光线补偿。光线补偿的算法框图如图 11 所示:Y计算图片的光线补偿系数补偿系数阈值进行光线补偿N开始8图 11 光线补偿算

23、法框图光线补偿前后的对比图如图 12 所示,从图中可以明显看出,光线补偿后图像的整体亮度有明显提高。图 12 光线补偿前后对比图4.2 图像二值化对于一副彩色图像,可以直接根据每个像素点的值来判断此像素点是否为肤色,本文采取的判断方法是双阈值的判断方法。使用 RGB 和 YCbCr 双颜色空间来进行肤色判定,直接对彩色图像进行肤色判定最常用的方法是使用 YCbCr 颜色空间,但是这样的判定结果不是特别精确,需要再增加一个阈值来提高判定结果,虽然肤色在 RGB 颜色空间上的聚类分布不是很规则,但是增加 RGB 肤色判定确实能够提高肤色的判断率。具体的实现过程是:顺序的扫描每个像素点,首先把 RG

24、B 颜色空间转换为 YCbCr 颜色空间,得到 Cb,Cr 两个分量的值,利用前面肤色建模中的两个阈值判定,如果两个条件都符合,就断定此像素点属于肤色,将它的 RGB 分量分别置为(255,255,255 ) (白色) ,否则,此像素点就不是肤色,将 RGB 分量置为(0,0,0) (黑色) 。当所有的像素点扫描完毕时,图像二值化就完成了,图像中所有的肤色均为白色,而非肤色就变为黑色。图像二值化前后对比图如图 13 所示,从这幅图可以看出人物的脸部区域都变为白色,裸露出的其他的皮肤也变为白色,并且还有背景的类肤色区域。图 13 图像二值化前后对比图结束94.3 腐蚀与膨胀算法分析图像膨胀在数学

25、形态学中的作用是把图像周围中的背景点合并到物体中去。如果两个物体的距离足够近,膨胀则可以联通这两个区域。膨胀对填补图像中的黑色孔洞很有用。我们可以自定义结构元素来达到不同的膨胀结果。通常,结构元素有水平形,垂直形,十字形和方形等,膨胀可以分为四方向膨胀,八方向膨胀和两方向膨胀等。具体用到膨胀的时候应该根据需要选择合适的结构元素,就可以达到预期的效果。本系统采用的是十字形四方向膨胀算法。也就是在当前点的上下左右四个像素点,如果有一个是白色就把当前点填充成白色,否则就填充成黑色。本系统中膨胀的主要作用是连接脸部区域内不连续的皮肤块。图像腐蚀在数学形态学中的作用是消除物体的边界点。同样,腐蚀所用的结

26、构元素和膨胀的一样,根据选用的结构元素不同,腐蚀也分为四方向腐蚀,八方向腐蚀和两方向腐蚀。图像经过腐蚀可以把小于结构元素的物体消除掉,所以选择特定的结构元素就可以消除特定大小的物体。另外,腐蚀操作可以把两个具有细小连接的物体分离,比如图像中有两个人脸挨着,经过腐蚀操作就可以把二值化后的图像中两个人脸分离。本系统所采用的是十字形四方向腐蚀。意思就是,在当前点的上下左右四个像素点中,如果全部都是白色,则将此点填充成白色,否则就填充成黑色。一般情况下,为了保持图像中联通区域的大小和形状不会发生太大的变化,腐蚀和膨胀都是配合使用的,即使用的多少次的腐蚀(膨胀)就使用多少次的膨胀(腐蚀) 。二值化的图像

27、往往存在较多的噪声,我们可以通过先腐蚀后膨胀来去掉噪声,也就是进行开运算。相反,先膨胀后腐蚀称为闭运算。通过闭运算可以消除图像中的散点和毛刺,使图像趋于平滑。在实际使用中一次开运算和闭运算往往包含了多次腐蚀和膨胀,才能达到预期的效果。在算法设计上,本系统所采用的是自动的开运算和闭运算,通过统计该二值图像中联通区域的个数来决定使用开运算还是闭运算,开运算和闭运算算法框图如图 14 所示:图 14 开运算和闭运算算法框图对二值图像进行开运算和闭运算的前后对比图如图 15 和 16 所示:开始结束开运算 闭运算统计联通区域个数联通区域是否过多Y N10图 15 开运算前后效果对比图图 16 闭运算前

28、后效果对比图4.4 联通区域统计算法分析在图像二值化以后由于图像的复杂性会出现很多的或大或小的联通区域,为了凸显出人脸区域要进行开运算和闭运算,但是至于选择何种运算和图像中联通区域的个数有很大的关系,比如图像中联通区域过多时则是因为噪声的缘故,这时应该选择开运算来去除噪声;如果联通区域在可以接受的范围内则需要进行闭运算,使图像更加平滑,去除毛刺。另外在最后的人脸标记的时候也需要标注图像中的类人脸区域这样才能使用矩形标出。所以,联通区域的统计起着承前启后的作用。联通区域统计算法分为两个阶段,算法的具体框图如图17所示。第一阶段。对二值图像进行一次扫描。按4邻域连通规则,标记所有像素点的待合并连通

29、域标号。同时,按一定的规则,标记待合并连通域标号的共同连通域标号。由于4邻域的模板核过小。无法一次正确标记所有的目标,会有大量等价标号存在。用共同连通域标号标记各等价标号所属的共同连通域。第二阶段。扫描临时连通域标号矩阵。纠正矩阵中的临时连通域标号,即用共同连通域标号替换各像素点的临时连通域标号,实现连通域的合并。合并时,按共同连通域标号出现的次序,重新定序,确保目标连通域标号连续。合并后,矩阵中的像素点连通域标号即是最终所得的目标连通域标号。扫描图像,确定临时联通区域标号合并等价的临时联通区域标号纠正临时联通区域标号开始11图 17 联通区域统计算法框图4.5 去除非人脸区域人脸图像往往是很

30、复杂的,肤色不仅包括脸部区域,还包括裸露在外面的手臂,胳膊,脖子等,在背景中又存在很多的类肤色区域,而在图像二值化的时候这些因素是无法避免的,这就导致了图像中会存在较多的类人脸区域,会给最后的人脸标记造成很大的困扰。好在人脸具有明显的数学形态学特征,本文采取了一下四个方面来判定是否是人脸,并去除非人脸区域:长宽比,填充率,区域面积和待判定人脸区域的面积和平均面积的比值。人脸在长宽比上具有很明显的特征,考虑到图像中人脸和颈部往往相连,人脸外接矩形的长宽比一般都在 0.6 到 2 之间,这样可以有效的去除图像中水平或者垂直的长条形非人脸区域,比如手臂。在人脸区域的外接矩形中,人脸区域面积所占矩形面

31、积的比例也是在一定范围内的,一般情况下填充率在 0.4 到 0.9 之间的可能就是人脸区域,此限定条件可以去掉图像中斜着的长条形类肤色区域和无法去除又相互连接的大的噪声区域。而区域面积的限制可以去除那些符合人脸标准但是因为面积太小而不是人脸的类人脸区域,本文中所用的阈值是 400 个像素。然而,有的非人脸区域可以满足上述三个条件,比如裸露的手部区域,从而可能发生误判的操作,为了解决这个问题,本系统所采用的方法是判断当前区域面积与所有经过上述三部筛选之后的类人脸区域面积的平均值的比值是否在阈值范围内。本系统所采用的阈值是 0.5 到 2。去除非人脸区域的算法框图如图 18 所示:长宽比是否符合联

32、通区域统计得到每个像素的联通区域标号结束开始填充率是否符合区域大小是否符合NNNYYY12图 18 去除非人脸区域算法框图去除非人脸区域算法的前后效果对比图如图 19 所示:图 19 去除非人脸区域前后效果对比图4.6 标记人脸区域在去除人脸区域后,剩下的区域就基本可以确定是人脸,这一步要做的就是用矩形框标记人脸区域。由于之前已经统计出了联通区域,其中包括每个区域的上下左右的边界,所以很容易就能确定矩形框的四条边,修改图像对应的 RGB 的值就可以显示出矩形框。标记效果图如图 20 所示,其中图(a)是单人脸标记效果图,图(b)是多人脸标记效果图。(a)单人脸标记效果图 (b)多人脸标记效果图

33、图 20 人脸标记效果图4.7 实验结果分析面积比率是否符合去除非人脸区域结束NY13本系统所用的图片大多数来自网络上的图片和数码相机拍摄的图片。包括各种环境下,各种尺寸,各种背景的人脸图像,下面将从人脸正确检测率,误检率和漏检率三方面进行分析。人脸的正确检测率取决于多方面因素,如图像中人脸的分布,背景中类肤色区域的分布等因素。在单人脸图像检测中,我选取了不同背景和尺寸的 24 张图片,其中结果如表 1 所示:表 1 单人脸检测结果表图片数 人脸数 正确检测数 检测率 误检数 误检率 漏检数 漏检率24 24 22 92% 1 4% 2 8%在多人脸检测中我选了 24 张图片进行测试测试结果如

34、表 2 所示:表 2 多人脸检测结果表图片数 人脸数 正确检测数 检测率 误检数 误检率 漏检数 漏检率24 457 391 85% 78 17% 66 15%漏检,误检案例分析。正常情况下,图像中肤色区域应该是和周围的非肤色区域有着明显边界的,但是特殊情况下背景中的类肤色区域太多,会导致人脸检测错误。无法进行人脸检测的二值图片如图 21 所示:图 21 无法进行人脸检测的二值图片人脸漏检的情况通常出现在人脸和周围肤色区域比如手臂或者其他人脸等类肤色区域过度相连,二值化后会形成一个非人脸的联通区域,这样的联通区域不能通过腐蚀和膨胀来消除,从而会造成人脸的漏检,如图 22 就是人脸漏检的情况。1

35、4图 22 人脸漏检的图片人脸误检在人脸识别中也很常见,比如裸露的手掌或者图像中形状比较规则的类肤色区域块,它能满足四个判定条件中的每个条件,但是却不是人脸。如图 23 所示:图 23 人脸误检的图片通过对以上方面的分析,本系统在对单人脸的图片进行检测时有更高的检测率,由于多人脸图片中的背景一般比较复杂,本系统在多人脸检测上的鲁棒性表现的不是很好,有一定的误检率和漏检率。整体来说基本达到了预期要求。4.8 系统的组成与操作本系统的操作界面简单明了,主要包括摄像头采集图像的动态显示视频框,打开和关闭摄像头以及保存预览按钮,人脸检测按钮和人脸检测结果显示的图片框。主界面如图 24所示,系统运行界面

36、如图 25 所示。15图 24 系统主界面图 25 系统运行界面5. 总结与展望本系统基本实现了人脸检测的预计功能,具有较好的鲁棒性,检测率能基本达到要求。需要改进的地方有以下几点: 对图片的要求比较高,图片的清晰度对检测效率有很大的影响,当图片过于模糊时会导致检测失败。 对图片中人脸的姿态限制较大,如果人脸姿态或者表情过于夸张会导致人脸检测错误,对复杂情况反应不够灵敏。 系统运行速度较慢,实时性不好,其中运算时间最长的部分是腐蚀和膨胀,算法不够精简。基于上述问题,在今后的学习和研究过程中,应该加入图片的锐化等其他的图像处理算法,在人脸区域判定时要尝试其他更为复杂精确的判定方法,精简膨胀腐蚀算

37、法,提高系统的实时性。16参考文献:1D. J. Beymer. Face recognition under varying poseM. AI Memo 1461, Center for Biological and Computational Learning, M.I.T., Cambridge, MA, 1993. 2R. Brunelli and T. Poggio. Face recognition: Features versus templatesJ. IEEE Transactions on Pattern Analysis and Machine Intelligence

38、, 1993,15(10):10421052.3胡晓燕.基于肤色的人脸检测算法的研究D.成都:四川大学,2004.4赵春江.C#数字图像处理算法典型实例M.人民邮电出版社,20095 Rabia Jafri , Hamid R. Arabnia. A Survey of Face RecognitionJ. Journal of Information Processing Systems, 2009,5(2):10-12.6黄玉程,胡国清.人脸识别系统中图像噪声去除方法研究J.微计算机信息,2005,21(12);187-188.7 刘明宝, 姚鸿勋, 高文. 彩色图像的实时人脸跟踪方法J.

39、 计算机学报, 1998, 21(6): 527-532.8 孙宁,邹采荣,赵力.人脸检测综述J.电路与系统学报.2006,11:103-110,115. 9 梁路宏,艾海舟,徐光佑,张钹.人脸检测研究综述J.计算机学报.2002,5:1-10.10 李云峰,杨益,田俊香. 人脸识别的研究进展与发展方向J.高新技术.2008,5:10-12.Design and Implementation of faces detection systemStudent:Zheng Zhensi Tutor:Gao TaipingAbstract The main source of the face de

40、tection images is from camera and local hard disk. Pretreatment is necessary before the test which contains light compensation, binarization and open-close operation. The main information of the preprocessed image is face-alike region. By studying on the mathematical morphological characteristics of the face I decide which method to use. The methods include fill rate, geometric proportions, area, and area ratio four aspects. Finally, the test results show that the face detection rate can reach 85%.Key Words Face Detection; Light Compensation; Binarization; Open-close Operation ; Unicom Area

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 学术论文 > 毕业论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报