1、基于 LDA 的人脸识别成员及各自任务:程鑫:LDA 基本算法姜华杰:LDA 改进算法赵铖:背景和 LDA 的相关应用摘 要线性决策分析是人脸识别技术中应用最广泛的算法之一。本文主要介绍了fisher 算法的原理。Fisher 算法的核心思想是寻找最佳投影向量,使类内离散度达到最小,类间离散度达到最大,通过对样本空间进行投影,从而达到分类的目的。应用 LDA 算法会遇到小样本问题,使得计算复杂度提高。本文针对小样本问题,介绍了 LDA 的改进算法,并证明了类内离散的矩阵的零空间的最大特征值对应的特征向量即为最佳投影向量。关键词:LDA 人脸识别 信用评估目 录第一章 背景 4第二章 LDA 的
2、基本算法 52.1 两类 LDA 算法的原理52.2 多类 LDA 算法的原理7第三章 LDA 的改进算法 103.1 问题的提出与解决办法103.2 传统 LDA 的方法与潜在问题103.3 改进的 LDA 算法11第四章 相关应用 154.1 标准化 LDA 进行人脸识别154.2 线性判别分析在个人性用评估中的应用18参考文献 22基于 LDA 的人脸识别- 4 -第一章 背景LDA:Linear Discriminant Analysis (线性判别分析)简称判别分析,是统计学上的一种分析方法,用于在已知的分类下遇到有新的样本时,选定一个判别标准,以判定如何将新样本放置于哪一个类别之中
3、。这种方法主要应用于人脸识别,以及医学的患者疾病分级、经济学的市场定位、产品管理及市场研究等范畴。关于 LDA 分析的研究应追溯到 Fisher 在 1936 年发表的经典论文( Fisher R A. The use of multiple measurements in taxonomic problems) ,其基本思想是选择使得 Fisher 准则函数达到极值的向量作为最佳投影方向,从而使得样本在该方向上投影后,达到最大的类间离散度和最小的类内离散度。在 Fisher思想的基础上,Wilks 和 Duda 分别提出了鉴别矢量集的概念,即寻找一组鉴别矢量构成子空间,以原始样本在该子空间内
4、的投影矢量作为鉴别特征用于识别。1970 年 Sammon 提出了基于 Fisher 鉴别准则的最佳鉴别平面的概念。随后,Foley 和 Sammon 进一步提出了采用一组满足正交条件的最佳鉴别矢量集进行特征抽取的方法。1988 年 Duchene 和 Leclercq 给出了多类情况下最佳鉴别矢量集的计算公式。2001 年 Jin 和 Yang 从统计不相关的角度,提出了具有统计不相关性的最优鉴别矢量集的概念。与 F-S 鉴别矢量集不同的是,具有统计不相关性的最优鉴别矢量是满足共轭正交条件的,该方法被称为不相关的鉴别分析或 JinYang 线性鉴别法。以上提到的各种方法仅适用于类内散布矩阵非
5、奇异(可逆)的情形,但实际应用中存在着大量的典型的小样本问题,比如在人脸图像识别问题中,类内散布矩阵经常是奇异的。这是因为待识别的图像矢量的维数一般较高,而在实际问题中难以找到或根本不可能找到足够多的训练样本来保证类内散布矩阵的可逆性。因此,在小样本情况下,如何抽取 Fisher 最优鉴别特征成为一个公认的难题。基于 LDA 的人脸识别- 5 -第 2 章 LDA 的基本算法LDA 的基本思想是找到合适的向量,使得样本特征经过向量映射后获得最大的类间离散程度和最小的类内离散程度。给定 m 个 n 维特征的训练样例 (i 从 1)()()()( ii2i1i,.nxx到 m) ,每个 对应一个类
6、标签 。我们就是要学习出参数 ,使得(i)x(i)y(g 是 sigmoid 函数) 。我们先从只有两类的况开始考虑,然后再)(iiTy)(来考虑多类时的情况。2.1 两类 LDA 算法的原理给定特征为 d 维的 N 个样例, ,其中有 个样例属于类别)()(21)(,.idiixx1N,另外 个样例属于类别 ,两类个数之和为 N。原始特征数为 d,我们想将1C22C其降到一维,而又要保证类别能够“清晰”地反映在低维数据上,也就是这一维就能决定每个样例的类别。我们需要找到一个最佳投影向量 w,使得样例 x 在 w方向上投影之后,能够容易区分它们的类别,样例 x 在最佳投影向量 w 上的投影表达
7、式为xwTy(1)这里的 y 是 x 投影到直线上的点到原点的距离。什么是最佳的投影方向呢?首先要使投影之后的得到的样本中心点尽量的分离,定量表示也即是:)()(2121TwJ(2)此处 是每类样例的均值(中心点) ,这里 i 只有两个,iixN1(3) 是 x 投影到 w 后的样本点均值,i基于 LDA 的人脸识别- 6 -iTxiyi wNii 1i(4)但是仅仅只是样本点的中心分离是不够的,各类的样本元素还需要紧凑,也即是每个类的元素离其中心点的距离要尽量的小。也即是样本点之间的方差要小,方差越大,样本点越难以分离。因此,我们引入了散列值,对投影之后的类求散列值,即是iwyiiS22)(
8、(5)从公式中可以看出,只是少除以样本数量的方差值,散列值的几何意义是样本点的密集程度,值越大,越分散,反之,越集中。而我们想要的投影后的样本点的样子是:不同类别的样本点越分开越好,同类的越聚集越好,也就是均值差越大越好,散列值越小越好。那么,我们可以使用 J(w)和 S 来度量,最终的度量公式是21)(SwJ(6)将 的表达式带入散列值的式子可以得到 i iii wx TiiTwxiTwyii wxS )()()( 222 (7)定义上式中中间那部分为:iwxTiiiS)((8)这个公式的样子不就是少除以样例数的协方差矩阵,称为散列矩阵(scatter matrices) 。对于只有两类的情
9、况下,定义21Sw(9)称为类内散列矩阵。同时,基于 LDA 的人脸识别- 7 -wSwBTTT )(- 21212121 )()(10)称为类间散列矩阵。 那么 J(w)最终可以表示为wSJTB)((11)现在,我们需要通过上面的式子,求出 w 使得 J(w)最大。由于我们只是需要知道 w 的方向,所以为了方便求解,我们令 ,那么加入拉格朗日乘子后,求导wSdcBTBT02)1()((12)其中用到了矩阵微积分,求导时可以简单地把 当做 看待。如果wST2可逆,那么讲求导后的结果两边都乘以 ,得wS1wSBw1(13)从中可以看出 w 是矩阵 的特征向量。 这个公式称为 Fisher lin
10、ear B1discrimination。由于 ,那么 ,带TBS)-(2121)( wTBS)()( 212121-)-(w入最后的特征公式得, SwB)( 21w1-(14)而 w 扩大缩小任何倍不影响结果,因此可以约去两边的未知常数 和 ,得:w)(21wS(15)W 即是我们最终需要找到的投影向量。2.2 多类 LDA 算法的原理基于 LDA 的人脸识别- 8 -针对两类的情况,我们将 d 维降到一维,但是在多类的情况下,一维已经不能满足需求。假设我们有 C 个类别,需要 K 维向量(或者叫做基向量)来做投影。将这 K 维向量表示为 。我们将样本点在这 K 维向量投影后的kwW.,21
11、,结果表示为 ,有一下公式成立ky,.21xTTiiy,(16)同两类的情况一样,仍然从类间散列度和类内散列度来考虑,度量 。 其)( wJ中 和 与上节的意义一样, 是类别 i 里的样本点相对于该类中心点 的散iwSwiS i列程度。 变成类别 i 中心点相对于样本中心点 的协方差矩阵,即类 i 的散1B 列程度。 , 的计算公式不变,仍然类似于类内部样本点的协方差矩ciwiS1i阵,其中iwxTiii )((17)需要变,原来度量的是两个均值点的散列情况,现在度量的是每类均值BS点相对于样本中心的散列情况。类似于将 看作样本点, 是均值的协方差矩阵,iu如果某类里面的样本点较多,那么其权重
12、稍大,权重用 Ni/N 表示,但由于对倍数不敏感,因此使用 。)(wJiNCi TiiBNS1)-((18)其中:iwxxiN1(19)上面讨论的都是在投影前的公式变化,但真正的 的分子分母都是在投影)(wJ后计算的。下面我们看样本点投影后的公式改变:基于 LDA 的人脸识别- 9 -这两个是第 i 类样本点在某基向量上投影后的均值计算公式。iyiN1(20)yN1(21) 下面两个是在某基向量上投影后的 和wSBCiwyTiiiS1)-((22)Ci TiiBNS1)-((23) 综合各个投影向量(w)上的 和 ,更新这两个参数,得到wSBWSTw(24)WSBT(25)其中,W 是基向量矩
13、阵, 是投影后的各个类内部的散列矩阵之和, 是wS B投影后各个类中心相对于全样本中心投影的散列矩阵之和。回想我们上节的公式 ,分子是两类中心距,分母是每个类自己的散列度。)(J现在投影方向是多维了(好几条直线) ,分子需要做一些改变,我们不是求两两样本中心距之和,而是求每类中心相对于全样本中心的散列度之和。然而,最后的 J(w)的形式是WSwJwTBB)((26)由于我们得到的分子分母都是散列矩阵,要将矩阵变成实数,需要取行列式。又因为行列式的值实际上是矩阵特征值的积,一个特征值可以表示在该特征向量基于 LDA 的人脸识别- 10 -上的发散程度。因此我们使用行列式来计算。整个问题又回归为求
14、 J(w)的最大值了,我们固定分母为 1,然后求导,得出最后结果iwiBS(27)与上节得出的结论一样iiBwS1(28)最后还归结到了求矩阵的特征值上来了。首先求出 的特征值,然后取BS1w前 K 个特征向量组成 W 矩阵即可。由于 中的 秩为 1,因此 的秩至多为 C(矩阵的秩小于等于各个BS)(i BS相加矩阵的秩的和) 。由于知道了前 C-1 个 后,最后一个 可以有前面的 来ici线性表示,因此 的秩至多为 C-1。那么 K 最大为 C-1,即特征向量最多有 C-1B个。特征值大的对应的特征向量分割性能最好。然而 不一定是对称阵,因此得到的 K 个特征向量不一定正交,这也是BS1w与
15、 PCA 不同的地方1。基于 LDA 的人脸识别- 11 -第 3 章 LDA 的改进算法3.1 问题的提出与解决办法LDA 的基本思想是找到合适的向量,使得样本特征经过向量映射后获得最大的类间离散程度和最小的类内离散程度。但是,当样本数量小于样本特征维数时,样本的特征矩阵可能变成奇异矩阵,在这种情况下执行 LDA 时会使计算时间复杂度变得非常大。近年来,许多研究人员已经注意到小样本对 LDA 的影响,并提出了不同的解决方法。一种解决方法是降低样本维度2。Goudail 等人通过计算每个样本中的25 个局部自相关系数来降低样本特征的维度3;Swets and Weng 等人通过 PCA方法来降
16、低样本维度。另一种方法是通过线性算法来降低计算的复杂度。这就是我们下面要探讨的改进 LDA 算法。3.2 传统 LDA 的潜在问题在进行线性决策分析之前,必须获得人脸特征,因此要通过形态学滤波器分离人脸,构建出人脸数据库4。通过此方法提取的人脸特征主要包括眼睛,鼻子和嘴三部分。人脸特征的生成主要通过像素聚类的方法实现。在进行像素聚类之前,必须将人脸图像转化成标准大小。通过 K 均值聚类法将像素点聚为 m 类,从而将 INPP的灰度特征矩阵转换为 INM的特征矩阵,其中 N 表示图像数量,P*P 表示图像的大小。像素聚类的目的是降低特征的维度,提取图像的几何特征,并没有考虑类别之间的区分性,而真
17、正区分各类别的是 LDA。它通过寻找投影向量,使得映射后的样本特征获得最小的类内离散程度和最大的类间离散程度。假设训练集包含 K 各类,每个类中包含 M 个样本,LDA 方法要找的映射矩阵At,使得: mktkXA(29) 其中, 表示从第 K 类的第 m 个样本中提取的 n 维特征向量, 表示kXmmkX经过 n*d 的特征矩阵 A 映射后得到的向量。寻找矩阵 A 的方法是通过 fisherkm准则:qSFwTB)((30)其中, ,KkTkBn xxSq1)(,KkMmTmkwXS1 )(基于 LDA 的人脸识别- 12 -Sb和 Sw分别代表类内离散的矩阵和类间离散度矩阵。其中, Mmk
18、kX1KkMmkX1(31)此问题最终转换成了凸优化问题:nqF)(axrg(32)通过将所有特征向量映射到 q 上,使得样本获得最小的类内离散度和最大的类间离散度。通过线性算法的求解,可得到 q 是 的最大特征值对应的特征BS1w向量。当样本数量小于样本特征维数时,S w会变为奇异矩阵,在求解 时会有较1wS高的时间复杂度,这就是小样本引发的问题。为了解决小样本问题,Liu 等人提出了改进的 fisher 准则函数5: nnqq FF)(maxrg)(axrg(33)下面介绍两个定理:通过上述两个定理,可以将 F(q)转换成 F(q)进行求解。传统的求解方法是寻找(S b+Sw)-1*Sb的
19、最大特征值对应的特征向量,但是在小样本的情况下会有较高是时间复杂度。一种改进的方法是计算计算 St(St=Sb+Sw)的零空间,这样上式的分母趋于 0,分子不为 0,F(q)趋于无穷大。这种方法有如下问题:1.判别向量集的正确性。2.算法的稳定性。3.奇异值问题。3.3 改进的 LDA 算法基于 LDA 的人脸识别- 13 -图 1 改进 LDA 算法示意图假设人脸数据库包含 K 个类别,每类中含有 M 个样本,令 表示第 k 类中kXm第 m 个样本的特征向量。 和 分别表示类间和类内离散度,总的离散度bSv。vbtS通过 1 可知,我们要寻找向量 q,使得 ,此时 取得最大值0qSWt )
20、q(F1。通过 2 可知,最佳投影向量 q 是 零空间的线性组合。定理 1 可以保证任意v基于 LDA 的人脸识别- 14 -q 包含于 并且 ,都可以使 获得最优值,但无法保证 取0V0qbSt )q(F0qbSt得最大值。通过定理 2 可知,样本的特征向量通过 变换后 ,使得 获得最TQ0vS)q(F大值 1。因此,我们要从中选择一个映射向量,使得类间离散度达到最大。基于这种思想,我们可以采用主元分析(PCA)方法。PCA 的基本思想是寻找一个投影向量,使得样本特征经过投影后保留最多的原始信息。通过 PCA 方法得到的投影向量是 的 L 个最大特征值对应的特征向量 。tS ),( TQSS
21、Sttbvbt 通过定理 3 可知,由 PCA 方法找到的投影向量具有最优的线性区分特性。算法流程图如下:基于 LDA 的人脸识别- 15 -开始输入 N 个 n 维特征向量计算类内离散度 S w 和类间离散度 S bR a n k ( S w ) = n q = ( i n v ( S b + S w ) ) * S b是进行奇异值分解S w = U V 否V = V , V V Q = V r + 1 , V r + 2 . V n 计算S b = Q Q S b Q Q 计算 S b 最大 L 个特征值对应的特征向量 , 组成L D A 的判别向量结束图 2 LDA 算法流程图基于 LD
22、A 的人脸识别- 16 -第 4 章 LDA 的改进算法4.1 标准化 LDA 进行人脸识别人脸识别在安全系统和人机交互等方面有着巨大的应用前景,当用统计方法解决人脸识别问题是,一再碰到的问题是维数问题,线性判别分析是其中较为常用的方法。Fisher 准则函数就是为了发现这样的投影方向,使得样本类间离散度和样本类内离散度的比值最大。下面介绍一种利用 LDA 进行人脸识别的例子:采用的方法是将样本类间离散度投影到样本类内离散度的零空间,然后选择相对投影后的样本类间离散度的较大特征值向量作为变换矩阵。样本类间离散度矩阵定义为:ci TiiuPS1b)((34)样本类间离散度矩阵定义为:iciSP1
23、w(35)其中, iTii CuxE|i(36)Fisher 准则函数: WSJTbwtopmaxrg)( WSTbwtoparg)(37)通过线新代数理论,我们知道 就是满足如下等式的解opt),.21(wb miSi (38) 传统 LDA 对样本类间离散度的定义还有一点不足,该定义使得所有样本均值和各个类均值尽可能的分开,但却可能造成各个类均值相互接近,也就引起了相邻类的大量样本的重叠。考虑一个从 d 维空间投影到一维空间的例子。图一画出了 4 个类,每个类一共有 100 个测试样本,其均值就是所有测试样本的中心。根据(1)定义的样本类间离散度,导出投影方向 A,但如果所有样本从二维空间
24、投影到该方向,转化为 1 维空间,类别 1,3 的样本就会有较大的重叠。针对这个基于 LDA 的人脸识别- 17 -问题,我们重新定义样本类间离散度Tjijiciijijj uwpS)()(1b (39) )()(ij jiTji uu(40)加权函数: 2ijij1)((41) 图三所示的投影方向 B 就是从式(5) 、 (6) 、 (7)推导出的新的投影方向。显然,在判别能力上该方向优于投影 A,特别是原来较为相近的三个类能够更好的分类。图三 不同定义的样本类间离散度导出不同的投影方向本文新提出的基于 LDA 的方法-标准化 LDA 的基本不走如下:步骤一:根据式(35) 、 (36)定义
25、样本类内离散度;步骤二:根据(38) 、 (39) 、 (40)定义样本类间离散度;步骤三:保留样本类内离散度的零空间,因为它们包含了对判别最有帮助的信息 ;)(,0wIVsTT步骤四:将样本类间离散度投影到样本类内离散度的零空间, VsTbb步骤五:特征分解投影之后的样本类间离散度,对解对应 m 个较大特征值的特征向量, ,其中, 是对角矩阵,对角元素是按照降序排列的iUsTbi基于 LDA 的人脸识别- 18 -步骤六:最后的投影方向即LDA 降维转换矩阵为 VUA由上述过程可知 , 因此 , 和 的比值达到最大 , AssTTb,0wsTbTw即我们的求解使得Fisher 准则函数取得了
26、最大值。我们在Olivetti2Oracle Research Lab (ORL )数据库上进行实验。 ORL 数据库包括400 个人脸图像:40 个人每个人10 幅图像,其中包括姿态、光照和表情的差别。不经过任何预处理过程,对每个人随机选取5 幅图像作为训练集,另外5 幅作为测试集。 我们与其他三种算法进行比较。 算法1 是传统的PCA ,该算法利用所有样本的协方差矩阵决定最后的投影方向;算法2 是PCA + LDA,该算法首先利用PCA 降低维度,使得样本类内离散度矩阵不再是退化的。第三种算法是Yu 和Yang提出的,该算法首先删去样本类间离散度矩阵的零空间,然后在非零空间里求对应样本类内
27、离散度矩阵较小特征值的特征向量,并将此作为最后的投影方向。 图四 所示为识别率随维数变化的曲线图。图四: 识别率随维数变化曲线图四 显示出本文提出的标准化LDA 具有最好的识别率。 不同于PCA + LDA ,该方法直到维数取到39 才达到最好的识别率,而本文算法在维数达到15 之后,就一直保持着非常高的识别率。这显示了本文算法的有效性。因为对一个具有较多类别的识别系统而言,标准化LDA 算法只需要取较少的维数就可以达到较好的性能。基于 LDA 的人脸识别- 19 -Yu 和Yang 的LDA 方法在维数等于20 的时候获得最大值,之后识别率开始降低,这是因为第一次降维移走样本类间离散度的零空
28、间之后,子空间维度仅为39 ,限制了进一步的判别分析。另一个实验是识别率对不同数目的训练样本。根据图四所示实验结果,我们选取4 种算法各自的最好参数: PCA , PCA + LDA 和本文的标准化LDA都选取39 作为维数, Yu 和Yang 的LDA 算法选取20 为最后子空间的维度。 固定维度参数,将每个类别的训练样本从2 变化到9 。图五所示为最后的实验结果比较。 可以看到,不管训练集中有多少图像,标准化LDA 的算法都比其他的算法有更好的性能。图五:识别率随训练样本数目变化曲线4.2 线性判别分析在个人信用评估中的应用伴随着我国商业银行个人信贷业务的不断开展,个人信用评估的重要作用日
29、益加强。个人信用评估是一种建立数学模型并应用计算机技术对个人的信用信息进行统计、计算及量化分析的方法。经历了最初简单的判别方法到今天包括线性规划、分类树、神经网络 k-近邻判别在内的诸多数量方法的过程,其中判别式分析是最先被才用呢并被国外商业银行广泛使用的方法。下面将介绍 LDA 如何在个人信用评估中发挥作用的。表一:个人信用评估的指标体系及对应的变量变量 具体特征是否获得贷款 Y 否(0) ,是(1)年龄 1X处理后为: )60(21XX基于 LDA 的人脸识别- 20 -性别 2X女性(0) ;男性(1) (离散;单调增)婚否 3未婚(0) ;已婚(1) (离散;单调增)工作稳定情况 4失
30、业无救济(0) ;失业有救济、退休(1) ;个体经营(2) ;中小企业(3) ;大型国有、股份制(4) ;政府公务员,事业单位(5) (离散;单调增)职位 5X其他(0) ;部门经理以上(1)在职工作时间 6实际工作时间个人变量受教育程度 7初中及以下(1) ;高中(2) ;大专、本科(3) ;硕士及以上(4)(离散;单调增)住房 8X没有(0) ;有(1) (离散;单调增)本人月收入(元)9( 0) ; 5001300(1 ) ;13002000(2) ;520003000(3) ;30004000(4) ;40008500(5) ;850020000(6) ; (7)2家庭月收入(元)10
31、X(1) ;10602500(2) ;25004000(3) ;40006000(4) ;60008000(5) ;800017000(6) ;1700040000(7) ; (8)0是否有来自金融资产的收入 1无(0) ;有(1) (离散;单调增)是否有其他固定资产 12X无(0) ;有(1) (离散;单调增)与本银行业务关系是否密切 13从无往来(0) ;一般(持卡/贷款/中间业务)(1) ;密切(持卡/贷款/中间业务且经常) (2) (离散;单调增)在本银行是否有存款 14X无(0) ;有(1) (离散;单调增)经济变量是否有其他贷款 15无(0) ;有(1) (离散;单调增)由于他们的
32、分析是基于不同的数据资料进行的,因此表中的数据只能在同一行内进行比较而不能跨行比较,虽然这种分析的结果不能完全作为评判某种方法优劣的依据,但是从他们的研究结果中我们可以对这些方法的准确率有一个大致的判断,其中线性判别式方法的准确程度基本可以与其他方法持平。说明其还是基于 LDA 的人脸识别- 21 -具有适用性的。表二:输出结果一览表变量 系数 标准偏差 t 检验值 显著性概率常数 2.112 0.162 13.061 0.0007x-0.296 0.047 -6.308 0.0009-0.136 0.033 -4.066 0.000120.236 0.071 3.321 0.001x-1.6
33、82E-040.000 -2.736 0.0084-7.067E-020.032 -2.192 0.031依据“5C”原则,即个人特性、贷款数额、资产、能力和形势的基础上筛选出那些相关性较强并容易获取的的变量,建立本文的指标体系,具体如表二所示,以此作为进一步选择变量的基础。表一体现了各变量的特点及函数关系,其中对一些初始的变量进行了处理,例如年龄变量 ,我们由长期观察的数据得知其与还款的可能性可能成二次函1X数、正态分布、折现或直线关系。经过对各种函数拟合结果的验证,我们发现二次函数的拟合优度明显增大,于是得出: )601(x21x对于那些难以获取和数据分布不理想的变量,例如有无信用不良记录
34、、是否抵押遗产等, 在指标体系设定中进行了剔除, 因此没有体现在表中。线性回归模型的建立和应用:上述的指标体系表明, 是否获得贷款 与 所表示的指标变量之间存在一Yix定的依赖关系, 据此建立多元回归模型, 表示为:15210.XXY(42) 这里采用某商业银行住房抵押贷款的资料, 选取251个样本, 使用SPSS软件采用显著性逐级检验分析的方法计算和输出结果。输出结果表明 、7X、 、 和 为通过显著性检验的指标。通过计算, 可以得出最后实验回9X124X基于 LDA 的人脸识别- 22 -归模型方程为: 129741 36.01.296.067.04682.1. XXEXY (43)通过计
35、算结果和回归方程我们可以看出, 个人是否获得贷款Y与年龄 、工1作稳定情况 、受教育程度价 、本人月收人 、是否有其他固定资产 联4X7X9X2X系相对较大, 而与性别、婚否、职位、工作时间等联系相对很小, 基本符合我国国情和实际情况。这里, 为了进一步验证模型的实用性, 另外选取个样本数据对回归方程进行检验。这里我们对输出结果取整, 取整的方法是当输出 时, 取1;反之则取0。CY对贷款发放控制的越严格, 的取值越大。在本文的检验中, 取0.5, 结果错分C率为 , 可以接受。%5显然, 我们可以利用上述方法对是否给一个特定的贷款申请者发放贷款做出判断。在具体应用中,最简单的办法就是利用上面
36、得到的回归方程, 依据银行掌握的贷款申请者的信息, 计算 , 当计算结果大于或者等于设定的 时, 就可以YC给该贷款申请者发放贷款, 反之则不能发放。基于 LDA 的人脸识别- 23 -参考文献1 K. Fukunaga, Introduction to Statistical Pattern Recogni-tion, Academic Press, New York, 1990.2 F. Goudail, E. Lange, T. Iwamoto, K. Kyuma, N. Otsu,Face recognition system using local autocorrelations
37、andmultiscale integration, IEEE Trans. Pattern Anal. Mach. Intell. 18 (10) (1996) 1024-1028.3 D. Swets, J. Weng, Using discriminant eigenfeatures for image retrieval, IEEE Trans. Pattern Anal. Mach. Intell.18 (8) (1996) 831-836.4 C.C. Han, H.Y. Mark Liao, G.J. Yu, L.H. Chen, Fast face detection via morphology-based pre-processing, Pattern Recognition 1999, to appear.5 K. Liu, Y.Q. Cheng, J.Y. Yang, X. Liu, An efficient algorithm for Foley-Sammon optimal set of discriminant vectors by algebraic method, Int. J. Pattern Recog. Artif. Intell. 6 (5) (1992) 817-829.