收藏 分享(赏)

【最新密码】泰首智能Gface5人脸识别算法介绍.doc

上传人:weiwoduzun 文档编号:5730017 上传时间:2019-03-15 格式:DOC 页数:4 大小:226KB
下载 相关 举报
【最新密码】泰首智能Gface5人脸识别算法介绍.doc_第1页
第1页 / 共4页
【最新密码】泰首智能Gface5人脸识别算法介绍.doc_第2页
第2页 / 共4页
【最新密码】泰首智能Gface5人脸识别算法介绍.doc_第3页
第3页 / 共4页
【最新密码】泰首智能Gface5人脸识别算法介绍.doc_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

1、泰首智能 Gface5 人脸识别算法的简介1 身份证识别模块和与身份核查设备的集成图 1 身份证识别模块示意图第二代身份证采用非接触式 IC 卡技术的二代证,可以实现个人身份信息的交流,二代证读取系统包括身份证卡、阅读器和应用软件三大部分组成。该模块通过标准协议读取身份证信息以及存在芯片的照片文件,同时启动核查设备的摄像头,抓取当前用户的实时视频以及人脸图像,最后通过 USB 口将身份证照片和摄像照片传给中心 CPU 或处理单元,用于下一步处理。2 基于深度学习的人脸比对框架在实际应用中,利用人脸验证技术可以确认身份证、护照、驾驶证等证件的真假,可以鉴别某个人是否是合法人员;可以在火车站、地铁

2、站、飞机场等人流量大的地方快速搜索指定嫌疑人。从技术研究上分析,人脸识别验证可以成为整个自动人脸识别系统的最后一个步骤。根据人脸图像特征的提取结果,将待验证的人脸和人脸数据库中的人脸数据进行比较,判断出待检验人脸身份信息。简单来说,就是两张人脸图像的对比,判定是否为同一人。图 2: 基于深度学习的人脸比对如图 2 所示,对于数据库中的一组人脸图像,基于深度学习的方法进行人脸特征学习,根据人脸特征进行验证模型拟合(如:支持向量机、最近邻算法、欧式距离等)判断是否是同一个人脸图像。在人脸多属性识别的基础上,每个身份 ID 的多属性(如:年龄、姿态和表情等)与深度神经网络学习得到的人脸特征一一对应,

3、然后利用深度学习到的高维特征向量,进行人脸验证。每个属性的人脸特征向量,对应着神经网络中损失函数之前的全链接层 fc2,其神经元的参数即为深度学习得到的人脸特征。由于每一张人脸图像对应着多个属性信息(如人脸表情特征、年龄特征等),可以更加准确的描述人脸图像特征,有效的从多个角度进行人脸验证。3 基于多属性的跨年龄、姿态和光照深度网络构建在身份比对系统中,采集到的人脸图像,往往是多姿态、多表情、光照环境变化大,并且图像的分辨率偏低,造成人脸图像识别性能的下降,而如何联合考虑多种人脸属性因素是人脸识别中最为突出的难题。而现有的一些机器学习方法(如支持向量机、核函数、流形学习等)大多是浅层结构。脑科

4、学研究表明,浅层结构难以有效地表示人脸识别中非线性的复杂变化,尤其当人脸图像受分辨率低、多姿态变化、年龄跨度大、环境光照变化大等的影响。针对二维视觉信号,深度学习可通过学习一种深层非线性的二维卷积神经网络结构,实现复杂函数逼近,表征输入视觉信号的丰富含义,并体现了他对于输入视觉样本数据的强大的本质特征抽取能力。本项目在人脸图像检测和特征点检测的基础上,基于深度学习卷积神经网络框架,进行身份 ID、年龄、性别、表情和姿态等多人脸属性/任务的深度学习研究。其中本项目所采用的深度学习卷积神经网络,是具有易扩展、快速的Caffe 框架。Caffe 是纯粹的 C+/CUDA 架构,支持命令行、Pytho

5、n 和 MATLAB接口;可以在 CPU 和 GPU 直接无缝切换。基于多个人脸属性的深度神经网络框架,可以同时规则化学习多属性/任务的卷积神经网络,有效防止由于高效的神经网络学习能力引起的过拟合现象。每个人脸属性对应着一个损失函数(如softmax 损失函数、L2 损失函数等),深度卷积神经网络通过反向传播梯度下降法,最小化多个损失函数来共同优化深度卷积神经网络的共有部分。基于多人脸属性的深度学习,一方面能够高效优化卷积神经网络参数,防止因为拟合一种人脸属性而引起的过拟合现象,另一方面仅利用一个神经网络流程,就可以同时得到多个人脸属性,可以有效的从多个方面进行人脸身份 ID 的识别。图 3

6、多属性深度网络架构在图 3 基于深度学习的人脸属性识别框架中,输入是 256*256*3 的人脸图像,在经过深度卷积神经网络学习后,对应着人脸身份、年龄、性别和表情等的识别结果。整个神经网络中有 6 千万个神经网络参数和 65 万个神经元,包含5 个卷积层,其中有几个卷积层有 max-pooling 层,有一个多人脸属性公用的全连接层 fc1 (fully connected layer), 每个人脸属性分别对应着一个全连层 (fc2) 和一个 N-way softmax 层. 在深度学习过程中,用到的两个策略:一方面为了加速深度学习,使用 GPU 硬件和非饱和神经元: ;另()max(0,)

7、.f一方面为了减少全连接层中的过拟合现象,利用一种最近发现的规则化方法dropout 策略和扩大数据策略。其中 dropout 方法是对输入网络的样本进行权值更新时,隐含节点都是以一定概率随机出现,因此不能保证每 2 个隐含节点每次都同时出现,这样权值的更新不再依赖于有固定关系隐含节点的共同作用,阻止了某些特征仅仅在其它特定特征下才有效果的情况;扩大数据策略是对训练数据进行左右对称以及平移变换,将训练数据增加为原来的 N 倍。在深度学习中,利用反向传播算法来更新网络参数,即通过迭代优化网络的权值使得输出与输入之间的实际映射关系与所期望的映射关系一致,采用梯度下降算法通过调整各层权值求目标函数最

8、小化。4 光照处理和模糊人脸重构针对复杂光照下,光照不均的人脸图像进行光照补偿,采用一种基于 OTSU多阈值分割思想的自适应 Gamma 校正新算法。该算法利用 OTSU 分割算法将人脸光照图像进行划分,最大程度的降低了光照不均匀人脸图像对人脸识别精度的影响,将得到的不同区间的阈值采用二叉树进行存储,然后再基于 Gamma 校正算法使用迭代算法得到质量最佳的图像。为了解决光照不均造成人脸误判率高的问题,提出了一种基于光照类型估计的自适应人脸预处理方法。另外,提出了一种针对 Local Binary Pattern (LBP) 局部二值模式和 Local Ternary Pattern (LTP

9、)局部三值模式的改进算法。首先利用 OTSU 多阈值分割和累计直方图相关算法对捕获到的人脸图像进行类型归类。然后根据分类后的图像类型来判断是否要进行自适应 Gamma 校正处理。最后将输入的所有类型图像执行 DOG(Difference of Gaussian)滤波和均衡化操作,最终输出处理后的人脸图像。由于摄像头和物体的距离较远,被拍摄物体又在运动过程中,移动视频监控系统中拍摄到的人脸往往不清晰,缺少细节信息从而大大影响识别系统的准确性。目前该领域的一些算法主要通过主成分分析(PCA)来重建清晰人脸,然而 PCA 是基于整体人脸的,通常容易受遮挡影响。本项目将尝试把人脸分为不同的小部分,对每部分通过训练图象进行重建的方法得到清晰人脸。在学习过程中,我们将首先把人脸的每个部分表示为模糊训练图象的线性组合,然后把组合系数作用在对应的清晰图象上合成清晰人脸。目前该领域的研究还处于起步阶段,本项目的实施有助于创新成果的产生。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报