1、人脸图像识别系统设计 冷凯群 北京工业大学软件学院 摘 要: 人脸识别技术在生产、生活中的应用日益增多, 本文设计并实现了一套准确快速的人脸图像识别系统。利用图像处理和计算机视觉相关算法, 判断图像中是否有人脸, 并给出存在人脸的数量和位置, 以及建立人员身份信息简历 SQL 数据库, 然后基于 PCA 及 BPNN 等算法来提取图像特征并通过脸与脸的匹配度进行识别。关键词: 人脸识别; 图像处理; 特征提取; BPNN; 1 引言现代计算机与通信技术的进步, 促使人脸识别通信于生产、生活中的应用日益增多, 而人脸识别技术的准确性和快捷性也更显重要。目前, 人脸识别方法又可分为统计学的方法与类
2、神经网络的方法等二种1。以统计学的方法作为识别工具的研究中, Andreas Ess 提出以光流 (optical flow) 的概念计算脸部的运动, 继而用脸部的运动为特征执行人脸识别工作2。而神经网络类识别工具随着个人计算机硬设备的提升而有日渐增多的现象。常用以作为识别的类神经网络为竞争型网络 (Competitive Network) 、反向传递网络 (Back Propagation Network) 等。人脸识别实际上就是在寻找一种信息唯一的人脸描述方式, 但是要找到一种能够不受各种因素影响的描述方式非常地困难, 无论是最早使用的几何描述还是后来比较常用的代数描述, 都不可避免地存在
3、各种干扰。基于对国内外研究现状及技术产品的分析, 本文结合实际使用需要, 设计并实现了一套准确快速的人脸图像识别系统, 具有重要的理论及实践意义。2 功能模块设计2.1 人脸数据模块人脸数据模块需要存储和处理的数据主要包含人脸图像数据及人物信息数据。系统采用文档的形式来管理人脸图像, 并将人脸图像保存于云服务器中。为了提高数据库的存储效率, 先对 SQL Server2010 数据库进行范化处理, 并且其只存放各个图像的对应地址以及人物的信息表, 以保证该模块的灵活性与可扩展性。2.2 图像预处理模块图像预处理模块主要包括彩色图像灰度化和直方图均衡化, 如图 1 所示。由图可以看出, 灰度图像
4、进行均衡化操作后, 直方图的范围明显增大, 原先灰度值密集部分被拉伸的同时灰度值的稀疏部分被压缩, 从而总体上增强了图像对比度, 并突出了图像的细节特征。2.3 人脸检测与识别模块本文采用 Open CV 训练人脸检测分类器, 其主要涉及 15 个传统的 Haar 特征及4 个 Haar_T 特征。人脸识别采用基于传统 LBP 算子改进后的 WSS-LBP 算子来提取图像特征, 其所需的数据维度更低, 并且图像纹理特征的利用率也得以提高。图 1 图像预处理 下载原图3 人脸图像识别算法3.1 基于 K-L 变换的人脸图像识别为了去除噪声, 先对垂直灰度投影曲线做平滑处理, 然后确定人脸的左右边
5、界, 设左右边界的大小为 , 该区域的水平灰度投影即为脸的上下边界。然后根据脸上的眼睛、鼻、口等器官, 对该矩阵区域进行分块处理。接下来, 根据数据库中的人脸图像信息及人员身份信息, 对图像的灰度值进行处理后, 基于 K-L 算法对人脸图像数据进行特征提取。3.2 PCA 方法基于主成分分析 (PCA) 的人脸识别系统软件主要包括特征空间建立和人脸识别两大模块。从人脸样本库中获取数据, 通过 PCA 方法得到新的特征向量和特征值, 当有待识别人脸输人时, 将之转化为一维矢量, 将样板库中的各人脸样本和待识别人脸数据向同一个特征空间进行投影, 样板库中的某一人脸与待识别人脸的投影特征距离最小的那
6、个就认为是对应于待识别人脸那个人3。3.3 基于 BPNN 的算法要建构一个反向传递神经网络 (BPNN) , 有三个重要架构参数应先予设计与决定:(1) 隐藏层的层数隐藏层是 BPNN 的精髓所在, 没有隐藏层的网络, 无法建立输入与输出间的非线性映像关系, 而隐藏层过多, 网络构架复杂且收敛速度减缓。一般的 BPNN 有一个或二个隐藏层, 不但网络架构较为简单, 且亦有较佳的收敛性质, (2) 隐藏层的神经元个数隐藏层的神经元个数与隐藏层的层数有异曲同工之妙, 太多或太少都不能满足要求。一般而言, 当所仿真的问题模型噪声高, 则隐藏层的神经元个数不需多;若所仿真的问题模型较复杂, 非线性程
7、度高, 神经元个数以较多为佳。同时, 我们可以观察学习样本与验证样本的输出误差, 来防止发生过度学习的现象。(3) 学习速率网络的键结值和偏权值的变化量由学习速率与负梯度乘积决定, 学习速率愈大, 则其变化量愈大。学习速率太大, 可能造成网络不稳定而发生振荡现象;学习速率太小, 将使网络收敛时间变长。一般, 可在网络学习过程初期, 先给定较大的学习速率, 再逐次等比减小的方式, 以期能获得较佳的收敛速度。4 数据库设计鉴于人脸五官会随表情变化而改变形状, 运用模糊理论的概念及向量量化的原理, 无须精确计算每个器官边线的坐标位置及其大小形状。作法系将正规化后的人脸影像, 依人脸五官的模糊位置划分
8、成 53 个向量区域, 以轮廓边线所形成的像素数代表其信息量, 推测信息量可能较多的位置, 区域范围愈小, 反之, 推测信息量可能较少的位置, 区域范围则愈大。采用像素密度 (pixels density) 的方法, 将每个向量区域取其信息量与该区域面积的比值, 为其特征值。5 结论鉴于人脸识别在当今生活及生产中的位置日益重要, 本文结合实际使用需要, 设计了一套准确快速的人脸图像识别系统。利用图像处理和计算机视觉相关算法, 判断图像中的人脸信息, 然后结合人员身份信息简历 SQL 数据库, 然后基于 PCA 及 BPNN 等算法来提取图像特征并通过脸与脸的匹配度进行识别。本系统可广泛应用于公安、金融、网络安全、信息安全和考勤等多个领域。参考文献1张三友, 王磊.基于 Android 的人脸识别系统设计与实现J.软件导刊, 2016, 04:87-89. 2沈开荣, 张根源, 吴飞龙.基于人脸识别的校车考勤系统设计J.电子测试, 2016, 08:9-11. 3陈钊.基于 DCT 和 LDA 融合方法的人脸识别系统设计与实现D.吉林大学, 2015.