局部二值淘汰模式进行人脸图像协同表达.doc-道客多多

资源描述

1、局部二值淘汰模式进行人脸图像协同表达袁永顺江苏科技大学计算机学院摘要：传统的协同表达方法通常会受到样本数据的冗余带来的不确定性因素的影响。近来, 为了获得更好的识别效果, 一些改进方案通过利用更有效的训练样本集来提高协同表达方法的分类性能。在本文中, 我们基于局部二值特征 (Local Binary Pattern, LBP) 提出了一种优化的协同表达分类模型。该方法以分块图象为基础获得训练样本的 LBP 特征, 然后以全局图像为单位, 利用淘汰策略获得了更具鉴别性的 LBP 特征训练集, 最终利用协同表达方法进行分类。此方法有两种优势, 其一、利用了 LBP 特征的旋转不变性的优势

2、, 克服了人脸弱姿态变化对分类效果的影响;其二、优化淘汰策略弱化了冗余样本对表达方法的消极影响。该方法在两个常用人脸数据库 (ORL, FERET) 上进行了实验对比, 获得了更好的分类性能。关键词：协同表达; 局部二值模式; 人脸识别; 图像处理; 样本优化; 作者简介：袁永顺 (1991) , 男, 江苏丰县人, 硕士研究生。研究方向:模式识别、稀疏表示。收稿日期：2016-11-02Using a block local binary elimination pattern to perform collaborative representation for face recogni

3、tionYUAN Yong-shun School of Computing, Jiangsu University of Science and Technology; Abstract： Traditional collaborative representation methods usually suffer from uncertainty resulted by data redundancy. Recently, in order to obtain better recognition result, some improvement solutions through the

4、 use of more effective training samples set to improve the classification performance of collaborative representation methods. In this article, we put forward an optimization model based on local binary pattern.The method gets LBP features in blocks and uses the whole image for the unit, making use

5、of the elimination strategy to obtain more diagnostic LBP features of training set. Finally collaborative representation method is used for classification. This method has two advantages, first, the use of the advantages of rotation invariance of LBP features overcome the weak face pose variation on

6、 the classification effect; Secondly, optimizing selection strategy to weaken the negative impact to the method. It is conducted on two commonly used face database (ORL, FERET) and receives a better classification performance.Keyword： collaborative representation; local binary pattern; face recognit

7、ion; image processing; sample optimization; Received： 2016-11-02随着数学的发展, 线性表达学习方法受到了关注并取得了一定的成果。协同表达作为其中的一种策略, 已经成功的应用于多个领域, 显示出了稀疏表达学习在实际应用的巨大潜力和优势。协同表达的基本思想是用所有类别的所有训练样本对测试样本进行线性表达。通过评估每一类训练样本对测试样本的表达能力, 将测试样本划分到表达能力最强即贡献值最大的那一类中。尽管协同表达可以有效的挖掘出样本集的协同特性, 它却没法处理由于光照、表情和姿态所导致的同一类样本图像间的巨大差异。为了解决这个问题,

8、Rodriguez 和 Sapiro1研究了稀疏表达框架下的鉴别字典并且对图像编码后进行分类。Thiagarajan2针对有监督和无监督学习提出了多核稀疏表达, 与此同时, Yang3利用 gabor occlusion dictionary来解决人脸遮挡问题, 目的在于减少计算量。另外, Yang4还将特征的相似性和区别性引入到协同表达中, 提出了一种更通用的模型。Liu5通过评估测试样本的重建误差来提高协同表达的准确率。最近徐勇在6-10中提出了一系列简单但有效的模型来获得较好的识别效果。通过上面的研究, 我们自然的得出一个结论:传统的表达学习方法通过对训练字典的稀疏学习可以获得有鉴别性的

9、信息。然而, 如果这些算法没有得到不同类别各自的属性信息的话, 可能是因为冗余和不确定度, 导致测试样本没法被分类器精确的分类。尽管在表达学习分类模型上的研究较多, 然而利用 LBP 特征挑选有竞争力的样本然后结合淘汰的策略, 却没有引起太多的关注。为此, 我们提出了 LBP 特征和表达学习相结合进行人脸识别的一种新的协同表达方法。它可以被视作一种评估方法, 将表达学习模型和评估方法的优点结合起来。这篇论文的贡献体现在 4 个方面, 首先, 我们获取所有训练样本的分块后 LBP 特征;接着我们利用LBP 特征和欧式距离来获得与测试样本最相近的训练样本, 即优质样本;然后我们利用这些获得的更有竞

10、争力的样本来对测试样本进行线性表达。最后我们回归到分块, 用一种块与块比较然后综合判断的方式来给出最终的分类结果。和传统的表达分类方法相比, 该方法采用 LBP 特征来获得所有类别中更具竞争力的训练样本, 据此来减少表达学习中的误差。在优化样本中, 这可以视作一种有意义的淘汰策略。1 LBP 训练样本优化1.1 原始 LBP局部二值模式 (LBP) 11算子是统计特征的一种, 其特点是快速简单, 并且提取的特征鲁棒性很强。LBP 算子首先应用在纹理提取方面, 后来它的应用扩展到了诸多领域。200412第一次将局部二值模型应用于人脸识别, 取得了较好的效果。但是原始的 LBP 算子面临一个问题:

11、作为局部特征提取算子, 其不包含全局信息, 这限制其在人脸识别领域的进一步应用。为了解决这个难题, 众多学者进行了研究。论文13采取的是分块策略:即根据先验知识, 对人脸区域进行划分。根据区域的不同配以不同的权值, 其中有效特征密集的双目和嘴部的区域权重最大, 其余区域权重较小。然后将小块的特征直方图进行特征融合, 最后分类, 大大提高了人脸的识别率。1.2 统一模式 LBP二值模式的数量与 LBP 算子的采样点个数 P 存在指数关系, 模式总数为 2。如果采样点个数为 8, 则模式总数为 2;如果采样点个数为 32, 则模式总数为 2。由此可见, LBP 模式较多, 如果全部使用, 则信息将

12、产生冗余, 并不利于分类。而且计算量过大, 难以在实际中应用。通常的做法是利用直方图工具来统计各类模式出现的次数。大量的研究表明, 代表图像基本属性的模式出现的十分频繁, 有时候高达 90%以上。将这类模式统一称为统一模式14。公式定义如下该模式的特点是在一串二值编码中, 0 到 1 的变化最多有两个。例如 11111111有零个码元变化;00111111 有一个码元变化;00011100、11110001 有两个码元变化。采样点为 P、半径为 R 的统一模式可以用 LBPP, R表示。对于 P=8, R=1, 原始的 LBP 有 256 种模式, 而 LBPP, R只有 59 种统一模式,

13、运算量大大降低。根据上文的讨论可知, 在利用 LBP 算子提取人脸特征时, 首先将人脸图像划分为 uv 区域, 其中 u 和 v 都是恰当的正整数。经实验发现, 当 u=v=5, 即划分为 25 块时, 分类效果最好。每一个小区域利用 LBP 统一模式进行特征提取。i=1, 2, , 25, Pi代表第 i 个小区域的 LBP 特征。然后将这些小区域的 LBP 直方图串联起来, 得到特征融合后的 LBP 特征。这样一个人脸样本就唯一对应一个 LBP 向量 P (1475*1) 。据此我们就可以利用 LBP 特征进行样本优化。m 是训练样本的总数, p j (j=1, 2, , m) 代表每一个

14、训练样本 xj (j=1, 2, , m) 所对应的 LBP 特征向量。P 代表的是测试样本的 LBP 特征向量。这样, 在测试样本和每一个训练样本之间我们就产生了 m 个度量。然后我们对这些得到的 m 个度量进行降序排列, 得到根据公式 (5) , 借助于欧式距离我们选择最优的 L 个度量来优化训练样本。所以, x 1, x2, , xL这些与测试样本联系更紧密, 更具竞争力的样本最终被挑选了出来。然后我们利用这些具有更好表达能力的训练样本重建测试样本来进行更有效的分类。1.3 利用优质样本进行分类下一步就是根据所提出的 L-CRC 算法, 用上文得到的 L 个最近邻的训练样本来线性表示测试

15、样本。假设以下等式是成立的xi (i=1, 2, , L) 是 L 个最优训练样本, i (i=1, 2, , L) 是系数。这里, 公式可以重写为= 1, , L, X=x 1, , xL。如果 X是非奇异矩阵, 可以解出=Xy, 否则, = (XX+I) Xy, 是很小的正常数, I 是单位矩阵。由于测试样本的最优训练样本有可能是来自于不同的类别, 在表达测试样本中我们会计算来自于同一类别的最优训练样本贡献值的和, 然后将测试样本划分到具有最大贡献值的那一类中。更具体地说, 如果来自于第 K 类样本的最优样本为 s t, 则在表达测试样本中, 它们的贡献值可以表示为所以 yk和 y 的偏差

16、可以表示为显然, 上面的公式用一种公平的方式来评估测试样本和每一个yk。越小的偏差 Dk意味着在表达测试样本中有更大的贡献。然后我们将测试样本 y 分到产生最小偏差的那一类中。2 算法分析在本章节中, 我们将讨论所提出算法的特性和原理。算法的基本思想是利用训练样本集中具有最优表达能力的子集对测试样本进行线性表达。目的是找到对测试样本更好的表达, 来达到更好的分类效果。根据特征提取的相关理论, 来自同一类的样本应该具有相似的特征。这启示我们利用 LBP 直方图来直观的反映样本的特征。在本方法中, 我们利用 LBP 算子来提取样本的特征, 目的是对训练样本进行淘汰。首先, 我们对样本进行分块。根

17、据我们的实验结果发现, 当样本分成 5*5 的区域时, 能够达到最好的效果。然后用统一模式直方图提取每一个人脸区域块的特征。这样我们就得到了 25 个 59*1 的向量。每一个向量代表对应小区域的 LBP 特征。然后将这 25 个向量串联起来, 就得到了一个1475*1 的向量。该向量表示整个图像的 LBP 特征。这样, 对图像样本的讨论自然就转换到了对其 LBP 特征的讨论。一般来说, 两个样本间的距离越小, 两者的相似度越大。在前面的章节中, 我们已经讨论了利用 LBP 特性来分析样本之间相似性程度的可行性。在这个阶段, 我们会更多的阐述我们是如何利用 LBP特征直方图来优化训练样本的。具

18、体来说, 每个图像的 LBP 特征直方图可以看作一个一维的向量。所以评估两幅图像的相似程度可以很容易的转换成评估他们对用的 LBP 特征直方图, 也即对两个一维向量进行评估。和其他的距离度量方式相比, 基于 LBP 特征直方图的评估在时间消耗和空间复杂度方面获得了较好的平衡。有两方面的原因, 首先, 对于一个 1475 维的一维向量, 其复杂在容忍的范围内。另一方面, 在特征提取方面, 我们做了两个工作, 一是分块, 二是特征融合。这就使的该 1475*1 的向量最大程度的保留了原始的信息, 所以在利用该特性进行训练样本优化时, 能够极大的减少信息的损失。3 实验结果分别在 ORL 和 FER

19、ET 人脸库进行了对比实验。选取的方法有主成份分析 (PCA) 、局部二值模式 (LBP) 、协同表达分类 (CRC) 。实验结果呈现在图 1 和表 1中。4 结论文中提出了一种利用 LBP 特征并结合综合判定的新的表达学习方法。所提出的方法目的在于利用拥有最佳表达贡献值的更具竞争力的样本来对测试样本进行线性表达。通过 LBP 算子的特征提取, 所有训练样本的重要特征信息被提取然后评估。紧接着我们可以配合着欧式距离度量来获得与测试样本最近接近的样本, 从而获得良好的分类效果。我们相信我们优异的分类性能可以激发在特征提取、协同表达和综合判断方面更多更有意义的探索, 找到更好表达学习分类的解决方案

20、。图 1 不同方法在 ORL 上的识别效果下载原图表 1 FERET 人脸库上不同样本、不同方法的识别率下载原表参考文献1Rodriguez F, Sapiro G.Sparse representations forimage classification:Learning discriminative andreconstructive nonparametric dictionariesR.Minnesota Univ Minneapolis, 2008. 2Thiagarajan J J, Ramamurthy K N, Spanias A.Multiple kernel spa

21、rse representations forsupervised and unsupervised learningJ.IEEETransactions on Image Processing, 2014, 23 (7) :2905-2915. 3Yang M, Zhang L.Gabor feature based sparserepresentation for face recognition with gaborocclusion dictionaryM.Computer Vision ECCV2010.Springer Berlin Heidelberg, 2010. 4Yang

22、M, Zhang L, Zhang D, et al.Relaxedcollaborative representation for pattern classifica-tionC/Computer Vision and Pattern Recognition (CVPR) , 2012 IEEE Conference on.IEEE, 2012:2224-2231. 5Liu Z, Pu J, Huang T, et al.A novelclassification method for palmprint recognitionbased on reconstruction error

23、and normalizeddistanceJ.Applied Intelligence, 2013, 39 (2) :307-314. 6Xu Y, Zhang D, Yang J, et al.A two-phase testsample sparse representation method for use withface recognitionJ.Circuits and Systems for VideoTechnology, IEEE Transactions on, 2011, 21 (9) :1255-1262. 7Xu Y, Zuo W, Fan Z.Supervised

24、 sparserepresentation method with a heuristic strategy andface recognition experimentsJ.Neurocomputing, 2012 (79) :125-131. 8Xu Y, Fang X, Li X, et al.Data uncertainty inface recognitionJ.IEEE transactions oncybernetics, 2014, 44 (10) :1950-1961. 9Xu Y, Li X, Yang J, et al.Integratingconventional an

25、d inverse representation for facerecognitionJ.IEEE Transactions on Cybernetics, 2014, 44 (10) :1738-1746. 10Xu Y, Zhang B, Zhong Z.Multiple representationsand sparse representation for image classificationJ.Pattern Recognition Letters, 2015 (68) :9-14. 11Ojala T, Pietikinen M, Harwood D.Acomparative

26、 study of texture measures withclassification based on featured distributionsJ.Pattern recognition, 1996, 29 (1) :51-59. 12Ahonen T, Hadid A, Pietikinen M.Facerecognition with local binary patternsC/Europeanconference on computer vision.Springer BerlinHeidelberg, 2004:469-481. 13Ahonen T, Hadid A, P

27、ietikainen M.Facedescription with local binary patterns:Applicationto face recognitionJ.IEEE Transactions onPattern Analysis and Machine Intelligence, 2006, 28 (12) :2037-2041. 14Ojala T, Pietikainen M, Maenpaa T.Multireso-lution gray-scale and rotation invariant textureclassification with local bin

28、ary patternsJ.IEEETransactions on Pattern Analysis and MachineIntelligence, 2002, 24 (7) :971-987. 15Zhang L, Yang M, Zhang D, et al.Collaborativerepresentation based classification for facerecognitionR.2012. 16Yang M, Zhang L, Yang J, et al.Regularizedrobust coding for face recognitionJ.ImageProcessing, IEEE Transactions on, 2013, 22 (5) :1753-1766.

展开阅读全文