1、目录第一章 绪论 - 1 -1.1 人脸识别的意义 .- 1 -1.2 人脸识别的现状 .- 2 -1.2.1 人脸识别研究问题 .- 2 -1.2.2 数据库 .- 5 -1.3 本论文的内容 .- 7 -第二章 变电站视频监控系统 - 8 -2.1 视频监控技术的发展 .- 8 -2.2 变电站视频监控系统 .- 8 -2.2.1 变电站视频监控系统的组成 .- 8 -2.2.2 厂站端设备功能 .- 9 -2.2.3 通信通道 - 10 -2.2.4 集控端设备功能实时视频监控 - 10 -2.3 本章小结 - 12 -第三章人脸图像的预处理 - 13 -3.1 预处理的基本概念 .-
2、13 -3.2 图像的归一话 .- 13 -3.3 二值化 - 16 -3.4 本章小结 .- 16 -第四章 核方法的特征提取 - 17 -4.1 核方法的基本概念 - 17 -4.2 核的主成分分析法(KPCA) .- 18 -4.2.1 主成分分析法 - 18 -4.2.2 核的主成分分析法(KPCA) - 19 -4.2.3 基于 KPCA 的人脸识别算法 - 21 -4.3 线性判别分析法(LDA) - 21 -4.3.1LDA 的基本原理 - 22 -4.3.2 基于 LDA 的人脸识别计算步骤 - 23 -4.4 核 FISHER 判别法(KFDA) .- 24 -4.4.1 核
3、 Fisher 判别法原理 .- 24 -4.4.2 核 Fisher 判别法算法 - 26 -4.5 本章小结 .- 27 -参考文献 - 29 -附录 - 31 -第一章 绪论1.1 人脸识别的意义人脸识别的研究开始于 20 世纪 70 年代 1,2,至今为止已有了 30 多年的历史,随着人们对人机交换、图像理解、自动身份识别的要求的提高,人脸识别技术得到了飞速的发展。但促使人脸识别发展的原因是计算机硬件成本的降低。在“911”恐怖事件发生后,由于各方面关于人脸识别的研究成果也层出不穷。人们之所对人脸识别问题加以重视,因为它具有重大的研究意义,它潜在着巨大的应用前景和科学的发展。人脸识别是
4、根据场景中的静态图像或视频,利用给定的人脸数据库信息,通过计算机提取的人脸特征来鉴别或确认该场景中人的身份的过程,它与其它人体生物特征识别技术相比具有结果直观、隐蔽性好的优越性,是最直接的手段,易于为用户所接受。特别是在非接触环境和不惊动被检测人的情况下,人脸识别技术的优越性远远超过已有的指纹识别、签名识别等其他生物特征识别技术。模式识别、图像处理和计算机视觉领域的一个热点研究方向便是人脸识别,与指纹识别、掌纹识别、语音识别、虹膜识别等其他生物特征相比,人脸图像更加容易得到,在视频会议、身份识别、访问控制、档案管理、电子相册、基于对象的图像和视频检索等方面有着广泛的应用。人脸识别是指计算机根据
5、一定的算法,对新获得的图像与计算机中已有的经过机器学习的图像库进行匹配比较后,做出测试图像中身份判断的识别过程。人脸识别是一个交叉的学科,囊括了数学中的高等代数、统计学、微分几何,计算机学科中的计算机视觉、智能系统、模式识别,以及医学中的神经生理学、心理学等研究领域的学科。指纹、掌纹、声音、DNA、签名、步态等特征都可被用来尝试进行身份的鉴定研究,但是在各种生物特征中,人脸特征有自己的特点,人脸是一个人区别于他人的最自然、最主要的特征。人脸特征同时还具有唯一性,一个人与他人的脸部特征是不同的,即使是双胞胎的人脸也有区别,这说明用人脸区分不同的人是合理可以行的。另一方面,人脸图像相对于其他生物特
6、征来说更容易获取,法律上也没有障碍。所有这些,使得人脸识别成为近几年来图像处理领域中最活跃的分支之一。表明人脸识别别成为一项富有挑战性的研究课题,并将在不久的将来将更加普遍的运用于生活之中。人脸识别多用于视频安全验证,例如:嫌疑犯照片的识别匹配;信用卡、驾驶执照、护照与个人身份的识别;银行、商场安全系统;公众场合监视;专家识别系统;基于目击线索的人脸重构;嫌犯电子照片簿;随着年龄增长的人脸推测等。1.2 人脸识别的现状1.2.1 人脸识别研究问题 人脸识别至今已有了 30 多年的发展,在技术上已经达到了一定的成熟度,也有一些公司开始在企业系统中加入了人脸识别这一环节,如 Identix 公司的
7、FaceIt 系统、 Viisage 公司的 Vissage Face TOOLS 系统等,这些商业系统的成功也预示着人脸识别系统存在着巨大的市场需求和广阔的应用前景。常见的人脸识别基本算法可分为几类:基于几何特征的人脸识别、基于子空间分析的人脸识别、基于模板匹配的人脸识别、基于隐马尔可夫模型的人脸识别、基于神经网络的人脸识别和基于 3 一 D 的人脸识别等。 (1)基于几何特征的方法这类识别方法首先将人脸用一个几何特征矢量表示,进而用模式识别中的层次聚类思想设计分类器对人脸进行识别。在这种基于几何特征的识别中,识别总归为特征矢量之间的匹配,基于欧氏距离的判决 3是最常用的识别方法。侧影识别是
8、最早的基于几何特征的人脸识别方法,主要是从人脸侧面轮廓线上提取特征点人手。基于几何特征的识别方法具有的优点: 符合人类识别人脸的机理,易于理解; 对每幅图像只需存储一个特征矢量,存储量小; 对光照变化不太敏感。但同时存在如下问题: 从图像中抽取稳定的特征比较困难,特别是当特征受到遮挡时; 对强烈的表情变化和姿态变化的鲁棒性较差; 一般几何特征只描述了部件的基本形状与结构关系,忽略了局部细微特征,造成部分信息丢失。其典型的算法主要有活动轮廓模型和可变形模板模型等。(2)基于子空间分析的人脸识别子空间方法的基本思路是将高维的人脸图像特征通过空间变换(线性或非线性)压缩到一个低维的子空间进行识别。最
9、初的子空间被看作一组正交归一的基本向量。20 世纪 80 年代末,研究人员将 KL 变换的思想引入图像表达领域,开发出一种最小均方误差意义下描述人脸图像的最优技术。由此,利用重构权向量作为识别用的特征,提出“特征脸”识别技术 4。从所提取特征的角度来看,基本的线性子空间方法中包含表达性特征提取方法和鉴别性特征提取方法 2 类。表达性特征提取方法中有 2 类代表性技术: 主成分分析(PCA); 独立分量分析(ICA)。PCA 方法实际上是在二阶统计量上的去相关 5,而 ICA 则是在所有阶统计量上的去相关,从而使信号的二阶统计量和高阶统计量都得到了有效利用,其基本思想是通过线性变换,从训练样本中
10、找到一组互相独立的基(独立分量),并以此来描述样本数据。ICA 方法可以看成是 PCA 方法的泛化,在人脸识别中有广泛的应用。在基于线性子空间的人脸识别中,实际上是把人脸图像中存在的表情、姿态及光照等复杂的变化进行了线性简化,因此不可能得到人脸充分的描述。(3)基于模板匹配的人脸识别这类方法的基本思想是将人脸灰度图像当作数据库中的模板 6,然后通过计算未知样本和已知模板间的归一化相关来进行人脸识别,对全局模板整个人脸或局部模板眼睛、鼻子和嘴巴都进行了尝试。他们在一个由个人组成的人脸数据库上将该方法与基于几何特征的方法进行了比较,实验结果表明:在人脸尺度、光照、姿态条件稳定的情况下,模板匹配方法
11、取得的识别精度更高。模板匹配方法虽然简单直观,但由于特征向量维数通常就是人脸图像像素个数,因此 2 个样本之问的相似性的计算量很大。在实际应用中,当模板数据库中的人数较多时,该方法的识别速度将是难以忍受的。此外,由于该方法需要将图像数据作为模板文件存储起来,又造成了存储的不紧凑性问题。目前已应用于人脸识别中的非线性子空间方法有核主分量分析、核 Fisher 判别分析和核独立分量分析等。(4)基于隐马尔可夫模型的人脸识别在人脸识别中识别的对象应该包括人脸各个器官的数值特征及各个器官联系特征信息。而隐马尔可夫模型(HMM) 7提供了解决这一问题的方法,按照这种模型,观测到的特征被看成是另一组不可观
12、测“状态”产生的一系列实现。因而可以将不同的人用不同的 HMM 参数来表征,而同一个人由于姿态和表情变化产生的多个观测序列可以通过同一个 HMM 模型来表征。最早由Samaria提出了关于人脸的隐马尔科夫模型 8.隐马尔科夫过程是一个双重的随机过程:一个潜在的过程称为“状态”过程;另一个可观测过程称为“观测序列” ,观测序列是由隐含的状态过程决定的。基于HMM的人脸识别方法能够允许人脸有表情变化和较大幅度的头部转动,具有较高的识别率,但同时提取特征和训练模型参数时却需要较大的运算量,因而应用较少。(5)基于神经网络的人脸识别 9所谓人工神经网络,是一种模仿生物神经网络行为特征的分布式并行信息处
13、理算法结构的动力学模型。将人工神经网络应用于人脸识别,一个直观的想法是建立一个神经网络,其中每个神经元对应图像中的一个像素。神经网络在训练最优参数时必须有多样本输入,因此对单样本人脸识别问题是无能为力的。(6)基于 3 一 D 的人脸识别 10,11目前的人脸识别主要还是针对二维图像或二维动态视频序列进行研究,二维图像识别技术在其他领域己有很多的应用,但是由于人脸是个塑变体,使得通过二维图像识别技术对人脸识别存在困难。另外,基于二维图像的人脸识别,不可避免受到环境光线、背景、视角等和人脸的姿态、表情、遮挡等不利影响,因而其识别精度很难有进一步的提高。(7)基于核方法的人脸识别核方法是当前人脸识
14、别领域中一个迅猛发展的新方向。它的主要思想最初是由 V.Vapnik12提出并应用于支持向量机(SVM )中的。之后,Schlkopf 等人13将核机器学习方法应用于特征提取中,提出了核主成分分析(KPCA) ,试验结构表明 KPCA 不仅能够提取非线性特征,而且具有更优的识别结果。尽管核方法在人脸识别等模式识别领域应用的非常广泛和成功。但是,在现在核机器学习方法中,构造特征空间 F 中的核矩阵 K 所耗费的计算复杂度非常高。因为核函数 需要计算两个向量间的内积,当向量的维数很高时(如人脸识jixK,别中的训练样本的维数普遍高达上万维) ,计算 K 所需的计算量为 14,另2nNO一方面造成核
15、矩阵的不可逆。因此,当采用核方法对人脸进行表征与分类时,随着训练样本集的增大,相应计算量也增加,效率也随之降低,而很多实际的模式分类任务要求系统具有较高的效率。从应用角度分析,有必要对核方法进行改进,以提高其效率。研究基于核的人脸识别算法,设计对其改进的方案或算法以克服由核函数引发的计算代价大、特征提取和识别速度缓慢的缺陷,进而提升人脸识别的效率、满足实际应用对实时性的要求,有重要的实际意义。1.2.2 数据库目前,人脸识别技术已经从实验室中的原型系统逐渐走向商用,出现了大量的人脸识别算法和若干商业系统。然而,人脸识别的研究仍旧面临着巨大的挑战,人脸图像中姿势、光照、表情、饰物、背景、时间跨度
16、等因素的变化对人脸识别算法的鲁棒性有着负面的影响,一直是影响人脸识别技术进一步实用化得主障碍。多数人脸识别算法的研究,开发和测试需要更多的人脸图像来克服上述障碍,主要包括两方面:人脸库所包含的人数,人脸库中每个人所具有在不同条件下的人脸图像数。人脸图像库在提供标准的人脸图像训练、测试集合的同时,还应该能对影响人脸识别性能的不同情况进行模拟,以方便研究人员针对不同的关键问题进行重点研究。目前人脸识别领域常用的人人脸数据库主要有 15.16:1、FERET 人脸数据库由 FERET 项目创建,包含 14,051 张多姿态、光照的灰度人脸图像,是人脸识别领域应用最广泛的人脸数据库之一。其中的多数人是
17、西方人,每个人所包含的人脸图像的变化时单一。2、Yale 人脸数据库Yale 人脸数据库包括 15 个人,没人有 11 幅 128*128 大小的正面图像,图像包括了不同表情、不同光照、睁眼或闭眼以及戴与不戴眼镜等各种情况。如下图 1.1 所示。图 1.1 Yale 人脸数据库3、PIE 人脸数据库由美国卡耐梅隆大学创建,包含 68 为志愿者的 41,368 张多姿态、光照和表情的面部图像。其中的姿态和光照变化图像也是在严格控制的条件下采集的,目前已经逐渐成为人脸识别领域的一个重要的测试集合。如下图 1.2 所示。图 1.2 PIE 人脸数据库4、ORL 人脸数据库ORL 人脸数据库是目前使用
18、最广泛的人脸数据库之一。该数据库包括不同时段的背景为黑色的人脸脸部表情和细节,是由 40 个人,没人 10 幅 112*92 大小的正面人脸图像组成。其中有些拍摄于不同时期,光照条件几乎无变化,大多数为表情和姿势的变换。如下图 1.3 所示。图 1.3 ORL 人脸数据库5、BioID 人脸数据库由德国 Humanscan 公司创建。其中包含 23 个人,共 1,521 幅灰度人脸图像的分辨率为 384*286。如下图 1.4 所示。图 1.4 BioID 人脸数据库 目前越来越多的数据库被创建,并成功应用于人脸识别中,本文就人脸数据库举了比较常用的几个人脸数据库,以供大家对人脸数据库的一些知
19、识点进行基本的了解。1.3 本论文的内容本文主要涉及的是变电站监控系统中的基于核函数的人脸识别,主要包括以下几部分:第一部分部分主要讲述变电站的主要内容,主要包括以以邪恶有关于变电站监控系统的组成,从前端到后台是通过设备传输信道协议来完成图像的采集和存储分类,以方面对变电站各种图像信息的收集,为以后可能出现的事故进行调查。从中引出本文重要的人脸识别技术。第二部分主要讲述的是人脸识别中的预处理,它是人脸识别中重要的组成部分,它对提取的图像先进行处理,以便下面进行的人脸识别的提取提取,它是人脸识别不可缺少的一部分,如果不进行预处理,那么人脸识别在后期的一系列工作后,所得到的最终结果的识别率将大大下
20、降。第三部分重点讲述人脸识别技术,先从比较成熟的主成分分析法(Principle Components Analysis,PCA),线性判别分析(Linear Discriminant Analysis,LDA)这两种人脸识别方法进行一些体统的了解,再在此基础上引入核方法,通过与核方法的结合形成核的主成分分析法(Kerenl Principle Components Analysis,KPCA)和核的线性判别分析( Kerenl Linear Discriminant Analysis,KLDA ),对此进行进一步的了解和叙述,相较于传统的 PCA、LDA的方法所带来的优点,同时也提高了人脸识
21、别的分辨率,从而进一步来完善人脸识别。第二章 变电站视频监控系统2.1 视频监控技术的发展视频监控的发展经历 3 个阶段: 1、本地模拟信号监控系统;2、基于 PC插卡的数字监控系统;3、基于嵌入式技术的网络数字监控系统。(1)本地模拟信号监控系统该系统主要由摄像机、视频矩阵、监视器、录像机等组成,把摄像机上的视频通过模拟视频线连接到监视器上,再利用视频矩阵主机,采用键盘进行切换和控制,采用磁带式录像机进行长时间录像;远方远图象采用模拟光纤传输,利用光端机进行视频的传输。(2)基于 PC 插卡的数字监控系统( DVR)该系统由 PC 机插视频卡构成,在厂站端,有若干个摄像机,各种检测、报警探头
22、与数据设备,通过各自的传输线路,现今采用光纤的 E1 通道传送图像,在集控端通过解码器、监视器、数数据前置机、数据业务台、视频调配服务器、图像监控台及一些附加设备等组成, 完成对图像信息的解压接收, 实现对所辖无人值班变电站的日常巡视、监控。(3)基于嵌入式技术的网络数字监控系统 该系统无需 PC 机来处理模拟视频信号,而是把摄像机输出的模拟视频信号通过嵌入式视频编码器直接转换成 IP 数字信号。从视频监控的发展趋势看,网络化、数字化和智能化是今后的主要的发展趋势。随着技术的进步,应用的方便性、可用性等的发展,视频监控系统将朝前端一体化、视频数字化、监控网络化、系统集成化等方向发展。本文工作主
23、要是围绕嵌入式技术的往里数字监控系统展开,对其中的人脸识别做具体的研究。2.2 变电站视频监控系统2.2.1 变电站视频监控系统的组成监控系统主要由三大部分组成: 厂站端(现场)设备部分、通信通道部分、集控端设备部分。1、厂站端厂站端主要包括:视频信号采集设备(高速智能球机)、网络硬盘录像机、抗干扰及防雷装置、线缆2、集控端集控端主要包括:流媒体服务器、管理服务器、视频浏览终端、以太网交换机、流媒体服务器软件、管理服务器软件、视频浏览终端软件等。3、通信通道接口转换设备(E1 网桥设备)包括变电站和中调机架式 E1 网桥。系统结构图如下图 2.1 所示图 2.1 系统结构图2.2.2 厂站端设
24、备功能(1)视频信号采集设备(高速智能球机)不论一体化智能球机的外观如何,是多少倍的镜头,具有多少预置位,分为两大类:一类是步进电机球机,如 SAE、PELCO 、BOSCH(PHILIPS)、GE(KALATEL)等;另一类是直流电机球机(无极变速电机球机) ,如SAE、 VCL、AD 等。一体化智能球形摄像机作为监控系统的前端设备,成像清晰、聚焦准确迅速;一体化智能球机可以在进行水平 360 度连续旋转时准确无误地传递视频信号、控制信号;一体化智能球机云台可以进行水平和垂直运动。(2)网络硬盘录像机硬盘录像机的处理器和操作系统是网络硬盘录像机系统稳定的关键。目前有很多网络硬盘录像机采用 X
25、86 通用处理器和通用 WONDOWS 操作系统,这样的网络硬盘录像机往往在运行一段时间后故障率非常高,稳定性很差。网络硬盘录像机是从不支持网络功能的硬盘录像机发展而来的,部分网络硬盘的录像机的网络功能较差,不支持网络多播功能。(3)抗干扰及防雷装置从设备角度来看:不仅设备具有强抗电磁干扰能力,设备的通信接口采用光电隔离器件,具有很强的抗脉冲干扰能力,再者室内可安装智能球机来抗雷击。从视频电缆传输的方面来说:传输电缆采用 757 的金属屏蔽视频。线通过与大地相接的热镀锌管屏蔽视频传输电缆,可以有效的保证视频电缆的传输距离和视频的质量。从整个系统来说:系统还可以通过配置相应的防雷模块来保护相应的
26、接口,防止雷击破坏设备。2.2.3 通信通道从厂站端到集控端之间的通信信道如下:1、SDH 光传输系统提供 E1 接口,网络硬盘录像机提供网络接口,通过E1 转以太网的转换器(E1 网桥) 实现接口转换。2、在集控端,通过接口转换器,将 E1 信号恢复为以太网信号,接入以太网交换机。通过 E1 网桥和现有的 SDH 光传输设备可以为电网重要变电站集中视频监控系统提供传输通道。2.2.4 集控端设备功能实时视频监控(1)流媒体服务器流媒体服务器主要用于对客户端视频流的转发,在有流媒体服务器的情况下,所有视频浏览客户端的视频流都来自流媒体服务器,主要用于解决网络传输带宽的问题。(2)管理服务器管理
27、服务器的主要功能为:监控区域、监控点设备及用户信息表的管理和维护;用户权限的认证机制;异常事件、报警信号的转发机制;日志管理(操作、报警及异常事件日志的记录、查询与维护);巡检和校时服务;报警管理。(3)视频浏览终端视频浏览终端用于对变电站现场视频的浏览,可以实现对变电站现场的摄像机的控制,可以控制摄像机云台的转动、调整摄像机的焦距和光圈、可以设置摄像机的预置位,可以查询历史告警记录,支持电子地图。视频浏览终端可以配置多套。(4)电子地图系统具有电子地图功能,具备操作权限的管理人员或操作员可在电子地图上通过鼠标点击图标等操作,实现调用单路视频、镜头分组、报警信息、多层地图等功能,并能对站端云台
28、镜头和开关设备进行远程操作。电子地图采用树形目录结构多级电子地图方式,立体展现布防区域。对地图中的对象分两种方式表达,一是在多级树形结构中,按类型分类,二是在地图在图标标注,克服一般软件只能在地图中标注的缺点。支持双显功能,即一个显示器显示图像,另一个显示器显示地图。克服一般软件视频图像与地图相互遮挡的缺点。设备类型明确分类,信息完备,一目了然,每个地图层中所布的如摄像头、报警输入均列在树形结构中,方便用户查看。报警联动功能清晰表达,当有报警发生时,自动转到目标所在的地图中,并居中显示,延时 1 分钟闪烁标识(时间可设定),树形结构中对应的标识自动展开,并以方框标识,同时图标会加红色标记。(5
29、)SCADA 系统系统可在调度监控中心与电力调度 SCADA 系统互联实现电力调度系统与视频监控系统联动。电力调度中心向各变电站发送操作指令时,本系统通过对指令的分析,可以获取对应刀闸的开关操作。当事故或意外情况发生时,系统自动将摄像机切换至指定位置并弹出对应画面,同时进行声音提示并启动录像功能以便进行故障分析时作为参考。系统除与 SCADA 系统进行联动外,还可以与火灾报警等系统实现联动,实时监听火灾报警信息,与 SCADA 系统处理方式相同,当事故发生时系统自动将摄像机切换至指定位置并弹出对应画面,同时进行声音提示并启动录像功能。2.3 本章小结本章主要讲述变电站监控系统中的一些主要内容,
30、包括视频监控系统的组成,各个组成部分的一些设备,各部分的联系和所起到的作用,对变电站视频监控系统做一个系统的介绍。通过厂站端采集所有图片,最后汇总到集控端,集控端可以对所有图片进行查看也可以控制厂站端的摄像头的运作,而人脸识别只是期中的一部分。通过厂站端采集的人的正面脸部图像再在集控端通过与数据库里的人脸图像进行比较。第三章 人脸图像的预处理3.1 预处理的基本概念 预处理就是对图像先进行预先处理,但在处理过程中不会增加图像中的信息,反而有可能图像的损失一些信息。预处理的目的:改善图像的数据,抑制不需要的变形或增强某些对后处理重要的图像特征。预处理的方法:图像的复原,图像的增强,图像的几何校正
31、;预处理步骤包括:尺寸归一、灰度归一预处理的算法:人脸的定位:保留眼睛、鼻子、嘴巴等关键部位。图像的归一:包括几何归一和灰度归一。3.2 图像的归一话1、几何归一化几何归一:图像大小校正、平移、旋转、翻转。(1)大小校正:就是把原始图像中包含的人脸校正到统一的大小,主要依据是人眼的坐标。人眼是人脸很重要的一个部分,通过预处理内容能够保证两眼间距离相等。从而其他部分如:嘴、鼻、脸颊等的位置也保持在相对标准的位置。(2)平移:就是将图像中的所有点都按照指定的平移量水平。垂直移动,通过平移可以消除人脸左右偏移对后续识别环节的影响。(3)旋转:就是把原始图像中人脸图像进行平面内的旋转,其目的是使两眼间
32、的连线保持在水平的位置。(4)翻转:考虑到一些人脸图像可能存在上下颠倒的问题,通过翻转可以使目标图像中的人脸保持正面。2、灰度归一化灰度归一: 其 它如 果VARMjiIVARMjiIjigO2, ,其中 Mo、VARo 是理想的均值和方差,通常两者都取 100;对于一个 mn 大小的灰度图像 I(i,j):均值 Mo,方差 VARonj1m-i,)1/(Mojoi2i2VAR灰度归一的目的:减少因光照变化导致的灰度变化对正确识别的影响。3、直方图均衡化直方图均衡化:实际任为多值图像,即多个灰度级的单色图像。直方图均衡化认为是图像的灰度密度函数的近似,灰度直方图是一个离散函数,它表示数字函数每
33、一灰度级与该灰度级出现频率的对应关系。基本思想:把原始图像的直方图变化为均匀分布的形式,增加了像素灰度值的动态范围从而达到增强图像整体对比度的效果。假设一幅数字图像的像素总数为 N,有 L 个灰度级具有第 k 个灰度级的灰度 的像素共有 个,则第 k 个灰度级或者说 出现的频率 kSknkSnSpk)(k=0,1, ,L-1) 垂足 f= ,各线段的长度与 成正比。kSk直方图变换函数 EH(g)= =EH( )是变换后的灰度级tEH(g):EH(s)在 0sL-1 范围内是一个单值单增函数保证:原图像的灰度级在变换后仍保持从黑道白(或白到黑)的排列顺序。对 0sL-1 有 0EH(s)L-1
34、保证:变换前后灰度值动态范围的一致性。 kiski SPNn00EH(S)tk其中 k=0,1, ,L-1; 1步骤:第一步:计算出原始图像的所有灰度级 ;kS第二步:统计原始图像各灰度级的像素数 ;n第三步:计算原始图像的直方图 ;kp第四步:计算原始图像的累积直方图 ;t第五步:取整计算 ;Nktk1in第六步:定义映射关系: ;ktS第七步:统计新直方图各灰度级的像素数 ;kn第八步:计算新的直方图: Ntpki从原始图像(图 3.1)及其直方图(图 3.2) ,均衡化后的图像(图 3.3)以及直方图(图 3.4)可以看出,均衡化图像灰度分布更加均匀,可以在一定程度上减轻光照变化对识别的
35、影响。图 3.1 原始图像 图 3.2 原始图直方图 图 3.3 均衡化后的图像 图 3.4 均衡后的直方图3.3 二值化用扫描仪或摄像头获取的原始图像的灰度图像,经过灰度直方图线性变换以后的图像仍然是多值图像。所谓多值图像,就是指具有多个灰度级的单色图像。威为了突出图像调整和便于进行调整提取,需要将多值图像转换为二值图像。二值图像也就是只具有黑白两个灰度级的图像,它是数字图像的一个重要子集。将图像进行二值化处理后,可得到灰度值仅为 0,1 的二值化图像。3.4 本章小结本章对人脸识别系统中人脸图像预处理进行了简单的归纳总结。针对人脸识别系统中需要对训练图像和待分类图像进行预处理步骤,本文介绍
36、了几何归一化、灰度归一化等常用的图像预处理步骤。图像预处理虽然可能削弱图像的自身和外在因素对算法识别结果的影响,但是如果预处理过度,那么这种影响可能是负面的。 第四章 核方法的特征提取4.1 核方法的基本概念核方法 17是一系列的先进非线性数据处理技术的总称,其共同特征是这些数据处理方法都应用了核映射。从本质上讲,一个分类问题在原始数据空间线性不可分,核方法就是采用非线性映射将原始数据由数据空间映射到高维的特征空间,使得数据在这个空间中线性可分,进而在特征空间进行对应的线性操作。由于运用了非线性性映射,而且这用非线性映射往往是非常复杂的,从而大大增强了非线性数据的处理能力。核方法实现了数据空间
37、、特征空间和类别空间之间的非线性变换。设 和 为数据空间的样本点,数据空间到特征空间的映射函数为 ,核ixj方法的基础是实现了向量的内积变换:jijiji xxKx, (4.1)通常,非线性变换函数 相当复杂,而运算过程中实际用到的核函数则相对简单多了。,K核函数方法的特点:1、核函数的计算量和特征空间的维数无关。2、无需知道非线性变换函数 的形式及参数。3、不同的和函数确定了不同的非线性变换函数。4、核函数方法可以和不同的算法结合起来使用,可以形成基于核函数的不同技术,而在本文中主要采用的为 KPCA,KFDA 这两结合技术。5、核函数的确定比较容易,只要满足 Mercer 的条件的任意对称
38、函数都可以作为核函数。常用的核函数有:多项式核函 dbyxK,(4.2)高斯核函 2,yxeK(4.3) 多层感知器函 cyxvyxKtanh,(4.4)4.2 核的主成分分析法(KPCA)4.2.1 主成分分析法主元分析法( PCA 方法) 18 是基于 K-L 变换的统计学分析方法, 是多元分析中常见的技术. 利用人脸结构的相似性, 假设所有的人脸都可以处在一个低维的线性空间, 并且不同的人脸在这个低维的空间里具有可分性. 其原理是将高维向量通过一个特殊的特征向量矩阵投影到一个低维的向量空间中,表征为一个低维向量. 同时希望表征的低维向量能保持识别所需要的信息. 主元分析法主要作用就是用来
39、降低数据的维数.因而,主成分分析法主要考虑样本矩阵的协方差矩阵。具体步骤如下:假设 X 是一个 N1 的随机向量,即 X 的每个元素 都是一个随机变量。ixX 的均值 可以用 K 个这样的样本向量来估计,xmkiixXKm1(4.5) 协方差矩阵可根据公式(4-6)估计,TxikiTxxx mXKmXEC1(4.6)由公式(1.2)可知,协方差矩阵是一个 NN 的实对称矩阵,其对角线元素为各个随机变量的方差,非对角线元素为各随机变量的协方差。K-L 变换用矩阵 A 来定义一个线性变换,它可以将任意向量 X 通过下面线性变换得到一个向量 yxmX (4.7)其中 A 的各行为 的特征向量, 的特
40、征向量按照这样的规则构成:先将xSxS的特征值按大小降序排列,特征向量按照对应的特征排列的顺序排列。由于xSK-L 变换所得的向量 y 具有零均值特征性,则可得 y 的协方差矩阵 与 X 的协yS方差矩阵的 关系为:xSTxyAs(4.8)其中 A 为 的特征矩阵的转置, 是对角线矩阵且其对角线上的元素为xSyS的特征值。则有xSNyS21(4.9) 有公式(1.5)可知,向量 y 的各个元素之间互不相关,从而说明线性变换 A 去掉了变量之间的相关性。由于是对称矩阵 的特征向量,且和列均正交归一,xS即 TA1则 K-L 逆变换为: xmAyX(4.10) 这也正是对原向量进行重构的过程,在实
41、际使用 K-L 逆变换时,如果选取较大的特征值对应的特征向量,而舍弃那些在所有特征值中所占比重较小的特征值所对应的特征向量,这样既可以降低变换后向量 y 的维数,又可以近似重建向量 X。取矩阵 A 的前 M 列(MN)构成 新的矩阵 ,则向量通过矩阵 得NAA到的变换向量 y 就减小为 维,即1xmX(4.11) X 的近似重建为xTyA(4.12) 近似重建的均方差为NMiiiNi 11(4.13) NiMiie1(4.14) 均方误差 为被舍弃特征向量对应特征值的代数和,均方误差越小,重建数据与元数据越近似。4.2.2 核的主成分分析法(KPCA)核主成分分析法 19是主成分分析法的非线性
42、推广,它通过非线性映射,将原始数据从数据空间映射到特征空间,然后再特征空间中利用统计主成分分析求出最佳投影方向,从而获得非线性特征。在实际应用中借助核函数来实现映射和内积运算。KPCA 的基本思想就是通过一个非线性映射 ,将输入数据映射到一个特征空间 F,再在特征空间 F 上进行线性主成分分析。lkx,21假设它们已经去均值,即满足条件: 01ilix(4.15)在特征空间 F 中的协方差矩阵:Tiilixs1(4.16)接着就在该高维特征空间进行线性主成分分析现求 s 的特征值 和特征向量 ,求解下列特征方程:s (4.17)根据再生核理论,特征向量 一定位于由 张成的空间内, 可以lx,1
43、由 的线性组合表示:lx,1liixa1(4.18)其中, 为常数。lia,1定义一个 l的核矩阵 K:jijijTiij xKxx,(4.19)将式(4.16) 、式(4.18) 、式(4.19)代入式(4.17)得:al (4.20)这样求解式 特征向量 V 的问题就转化为求解特征方程 的vs alK特征向量 a。对式 (4.20)的求解,即可获得要求的特征值和特征向量,对于测试样本在特征空间向量上 的投影为:jvxaxvilijj 1(4.21)这样得出原始图像的投影特征向量。最初的和变换并不能保证(4.15)成立,因此有必要对核矩阵 K 进行去均值,此时式(4.20)中的 K 用 代替
44、,表达式如下:njlnmijlnimjliijij K111,2(4.22)其中 I 为 的矩阵,且满足 (l 为训练样本数目) 。 ljiI,的正交特征向量 所对应的最大的 m 个正特征值为 ,smv,1 m1对应于 的正交特征向量为 ,则有:Ku,jQujj 2,(4.23)其中, lx,1将映射的样本 投影到特征向量空间 ,得到 KPCA 的转换特mv,1征向量 ,计算方法如下:TmyY,1mPx,21 (4.24)则xQuxyTjTjj mjxKKlj ,1,121 (4.25)4.2.3 基于 KPCA 的人脸识别算法根据上面的 KPCA 的原理和算法,下面讲述一个 KPCA 的人脸
45、识别步骤:首先,将原始输入空间 中的 l 和训练样本集 ,通过式(4.2)中lRlx,1的多项式核函数非线性映射到高位空间,得到训练集的和矩阵2,jijiij xxK(4.26)然后,按式(4.22)计算得到归一后的核矩阵最后,计算 的特征值和特征向量,取其最大的 m 个特征值所对应的正交K特征向量 。根据式(4.25),得投影后的样本:mu,1jymjjTjj ,21,21 (4.27)上述通过 KPCA 得到人脸非线性投影后的高位空间中的样本 Y,最后可通过分类器进行分类识别。4.3 线性判别分析法(LDA)基于 PCA 的特征提取方法,将高维图像投影到由所有样本协方差矩阵的特征向量组成的
46、子空间上,达到很好的去相关降维效果,并且能很好的重构原图像,它是以所有样本的最优重建为目的,就描述人脸主要特征而言是最优的。然而,在人脸识别中,反映人脸主要特征的信息,未必正好就是区别不同人脸最有用的信息,目前没有相关理论能够证明 PCA 提取的特征对样本的区分有很大作用,所以综合考虑待识别人脸各类别的特征,并从中提取最有利于增大类聚合性和异类可分离性的信息,对识别有极其重要的意义。基于线性判别分析的特征提取方法正是为此目的而展开的,这种方法以样本的可分性为目标,寻找一组线性变换使得同一个类别的所有样本尽可能聚集在一起,而不同类别的样本尽量分开,也就是寻找使得样本类间散度和样本类内散度的比值达
47、到最大的一个子空间。因此,从理论上说,LDA 比 PCA 更适合于人脸识别。4.3.1 LDA 的基本原理经典的 LDA 采用的是 Fisher 判别准则函数 20,因此也称为 FLD。它最早由 Fisher 在 1936 年提出,基本思想就是寻找使 Fisher 准则达到极大值的向量作为最佳投影方向,使投影后的样本达到最大的类间离散度和最小的类内离散度,使投影后样本具有最佳的可分离性,数学形式上,最佳投影方向 w,使得sJwTbF(4.28)最大。下面具体讲述 Fisher 的原理和步骤。设 空间中, 为 l 个人脸模式类,共 N 个样本,总体样本集为mR,1为第 i 类样本集, 为第 i 类样本数, 为iiiNxXxX,1 i ijx第 i 类的第 j 个样本。其中 i 样本均值向量为:lixNXEmXii ,21,(4.29)样本类间离散度矩阵 、类内离散度矩阵 和总体散度矩阵 分别定义为:bSwStSTiliibm1(4.30)TiijliijNjliwxsSi11(4.31)TiNiit mxS1(4.32)样本的总体均值为:XxNE1(4.33)由定义可知, 、 、及 均为非负定矩阵,且满足 。类内bSwtS bwtS散度矩阵 反映了各分量到其所在类中心的平均平方距离,类间散度矩阵 反w映了各类中心到总体中心的平均平方距离。(4.28)式中的是广义的