当前位置：和泉文库 > 电气与自动化 > 浏览文档

机器感知与模式识别：深度信念网络的二代身份证异构人脸核实算法

文件格式：PDF，文件大小：1.14MB，售价：3.12元

文档详细内容（约8页）

第10卷第2期智能系统学报 Vol.10 No.2 2015年4月 CAAI Transactions on Intelligent Systems Apr.2015 D0:10.3969/j.issn.1673-4785.201405060 网络出版地址：http://www.enki..net/kcms/detail/23.1538.TP.20150326.1015.003.html 深度信念网络的二代身份证异构人脸核实算法张媛媛，霍静，杨婉琪，高阳，史颖欢 (南京大学计算机软件新技术国家重点实验室，江苏南京210023) 摘要：二代身份证人脸核实问题是指判断二代身份证人像和身份证使用者当前头像是否为同一人。具体来说，即将二代身份证模糊人像和实际在光照、背景等因素不可控环境下拍摄的若干张二代证使用者的视频人像作匹配，判断是否为同一个人。由于低分辨率模糊图像和清晰视频图像属于2种不同的图像模态，因此该问题属于异构人脸识别问题。考虑到跨模态人脸图像的差异，传统的特征抽取方法很难抽取判别性特征来描述不同模态图像，使得传统方法难以达到精准辨别。针对这个问题，提出了一种新的基于深度学习的解决方法，其基本思想是通过深度信念网络(DBN)的非监督贪心逐层训练来提取人脸图像的高层特征，结合传统的图像预处理和相似性度量技术，达到人脸核实的目的。通过在256人的真实二代证数据集上和传统特征降维方法PCA,LDA进行比较，证实了所提出方法在准确率上相比PCA有约12%的提升，相比LDA有约8%的提升。实验同时表明，针对数据量增大的情况，基于深度学习的解决方法要优于传统的人脸识别方法。关键词：人脸核实；多模态；深度学习；深度信念网络中图分类号：TP391文献标志码：A文章编号：1673-4785(2015)02-0193-08 中文引用格式：张媛媛，霍静，杨婉琪，等.深度信念网络的二代身份证异构人脸核实算法[J].智能系统学报，2015,10(2)：193 200. 英文引用格式：ZHANG Yuanyuan,HUO Jing,YANG Wangi,etal.A deep belief network-based heterogeneous face verification method for the second-generation identity card[J].CAAI Transactions on Intelligent Systems,2015,10(2):193-200. A deep belief network-based heterogeneous face verification method for the second-generation identity card ZHANG Yuanyuan,HUO Jing,YANG Wanqi,GAO Yang,SHI Yinghuan (State Key Laboratory for Software Technology,Nanjing University,Nanjing 210023,China) Abstract:The objective of the face verification method for the second-generation identity card is to determine whether the original head-photo stored in the corresponding identity card image and the currently captured head photo of the card-holder by using a video camera image actually belongs to the same person or not.To obtain a good verification result for the heterogeneous face verification method is a very challenging task because the two different types of ima- ges belong to two different modalities (e.g.,different image resolutions,different illumination conditions).Consider- ing the difference of trans-modal face images,it is hard to use traditional feature extraction methods to extract dis- criminative feature for description of images with different modes.Traditional feature extraction methods cannot distin- guish images exactly.In this paper,a deep learning-based face verification method is proposed.The proposed deep learning-based face verification method integrates the deep belief network (DBN),which employs unsupervised greedy layer-by-layer training for high-level feature extraction of face photo and combines the popularly used image preprocessing and similarity measurement technologies to realize the purpose of face verification.The results were e- valuated on a real dataset with two different modalities of 256 different people.This method outperforms the traditional principal component analysis(PCA)and linear discriminant analysis (LDA)methods with 12%and 8%improve- ments in terms of the verification accuracy,respectively.The results validated the advantage of the proposed method, especially when the amount of entries increases. Keywords:face recognition;multimodes;deep learning;deep belief network 收稿日期：2014-05-28.网络出版日期：2015-03-26. 目前，中国公民广泛使用第2代身份证作为身基金项目：国家自然科学基金资助项目(61035003,61175042). 通信作者：张媛媛.E-mail:zhangyuanyuan2013nju@gmail..com. 份识别的手段。然而，随着近年来社会对于治安监

第１０卷第２期智能系统学报Ｖｏｌ．１０ №．２２０１５年４月ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓＡｐｒ．２０１５ＤＯＩ：１０．３９６９／ｊ．ｉｓｓｎ．１６７３⁃４７８５．２０１４０５０６０网络出版地址：ｈｔｔｐ：／／ｗｗｗ．ｃｎｋｉ．ｎｅｔ／ｋｃｍｓ／ｄｅｔａｉｌ／２３．１５３８．ＴＰ．２０１５０３２６．１０１５．００３．ｈｔｍｌ深度信念网络的二代身份证异构人脸核实算法张媛媛，霍静，杨婉琪，高阳，史颖欢（南京大学计算机软件新技术国家重点实验室，江苏南京２１００２３）摘要：二代身份证人脸核实问题是指判断二代身份证人像和身份证使用者当前头像是否为同一人。具体来说，即将二代身份证模糊人像和实际在光照、背景等因素不可控环境下拍摄的若干张二代证使用者的视频人像作匹配，判断是否为同一个人。由于低分辨率模糊图像和清晰视频图像属于２种不同的图像模态，因此该问题属于异构人脸识别问题。考虑到跨模态人脸图像的差异，传统的特征抽取方法很难抽取判别性特征来描述不同模态图像，使得传统方法难以达到精准辨别。针对这个问题，提出了一种新的基于深度学习的解决方法，其基本思想是通过深度信念网络（ＤＢＮ）的非监督贪心逐层训练来提取人脸图像的高层特征，结合传统的图像预处理和相似性度量技术，达到人脸核实的目的。通过在２５６人的真实二代证数据集上和传统特征降维方法ＰＣＡ、ＬＤＡ进行比较，证实了所提出方法在准确率上相比ＰＣＡ有约１２％的提升，相比ＬＤＡ有约８％的提升。实验同时表明，针对数据量增大的情况，基于深度学习的解决方法要优于传统的人脸识别方法。关键词：人脸核实；多模态；深度学习；深度信念网络中图分类号：ＴＰ３９１文献标志码：Ａ文章编号：１６７３⁃４７８５（２０１５）０２⁃０１９３⁃０８中文引用格式：张媛媛，霍静，杨婉琪，等．深度信念网络的二代身份证异构人脸核实算法［Ｊ］．智能系统学报，２０１５，１０（２）：１９３⁃ ２００．英文引用格式：ＺＨＡＮＧＹｕａｎｙｕａｎ，ＨＵＯＪｉｎｇ，ＹＡＮＧＷａｎｑｉ，ｅｔａｌ．Ａｄｅｅｐｂｅｌｉｅｆｎｅｔｗｏｒｋ⁃ｂａｓｅｄｈｅｔｅｒｏｇｅｎｅｏｕｓｆａｃｅｖｅｒｉｆｉｃａｔｉｏｎｍｅｔｈｏｄｆｏｒｔｈｅｓｅｃｏｎｄ⁃ｇｅｎｅｒａｔｉｏｎｉｄｅｎｔｉｔｙｃａｒｄ［Ｊ］．ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓ，２０１５，１０（２）：１９３⁃２００．Ａｄｅｅｐｂｅｌｉｅｆｎｅｔｗｏｒｋ⁃ｂａｓｅｄｈｅｔｅｒｏｇｅｎｅｏｕｓｆａｃｅｖｅｒｉｆｉｃａｔｉｏｎｍｅｔｈｏｄｆｏｒｔｈｅｓｅｃｏｎｄ⁃ｇｅｎｅｒａｔｉｏｎｉｄｅｎｔｉｔｙｃａｒｄＺＨＡＮＧＹｕａｎｙｕａｎ，ＨＵＯＪｉｎｇ，ＹＡＮＧＷａｎｑｉ，ＧＡＯＹａｎｇ，ＳＨＩＹｉｎｇｈｕａｎ（ＳｔａｔｅＫｅｙＬａｂｏｒａｔｏｒｙｆｏｒＳｏｆｔｗａｒｅＴｅｃｈｎｏｌｏｇｙ，ＮａｎｊｉｎｇＵｎｉｖｅｒｓｉｔｙ，Ｎａｎｊｉｎｇ２１００２３，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：Ｔｈｅｏｂｊｅｃｔｉｖｅｏｆｔｈｅｆａｃｅｖｅｒｉｆｉｃａｔｉｏｎｍｅｔｈｏｄｆｏｒｔｈｅｓｅｃｏｎｄ⁃ｇｅｎｅｒａｔｉｏｎｉｄｅｎｔｉｔｙｃａｒｄｉｓｔｏｄｅｔｅｒｍｉｎｅｗｈｅｔｈｅｒｔｈｅｏｒｉｇｉｎａｌｈｅａｄ⁃ｐｈｏｔｏｓｔｏｒｅｄｉｎｔｈｅｃｏｒｒｅｓｐｏｎｄｉｎｇｉｄｅｎｔｉｔｙｃａｒｄｉｍａｇｅａｎｄｔｈｅｃｕｒｒｅｎｔｌｙｃａｐｔｕｒｅｄｈｅａｄｐｈｏｔｏｏｆｔｈｅｃａｒｄ⁃ｈｏｌｄｅｒｂｙｕｓｉｎｇａｖｉｄｅｏｃａｍｅｒａｉｍａｇｅａｃｔｕａｌｌｙｂｅｌｏｎｇｓｔｏｔｈｅｓａｍｅｐｅｒｓｏｎｏｒｎｏｔ．Ｔｏｏｂｔａｉｎａｇｏｏｄｖｅｒｉｆｉｃａｔｉｏｎｒｅｓｕｌｔｆｏｒｔｈｅｈｅｔｅｒｏｇｅｎｅｏｕｓｆａｃｅｖｅｒｉｆｉｃａｔｉｏｎｍｅｔｈｏｄｉｓａｖｅｒｙｃｈａｌｌｅｎｇｉｎｇｔａｓｋｂｅｃａｕｓｅｔｈｅｔｗｏｄｉｆｆｅｒｅｎｔｔｙｐｅｓｏｆｉｍａ⁃ ｇｅｓｂｅｌｏｎｇｔｏｔｗｏｄｉｆｆｅｒｅｎｔｍｏｄａｌｉｔｉｅｓ（ｅ．ｇ．，ｄｉｆｆｅｒｅｎｔｉｍａｇｅｒｅｓｏｌｕｔｉｏｎｓ，ｄｉｆｆｅｒｅｎｔｉｌｌｕｍｉｎａｔｉｏｎｃｏｎｄｉｔｉｏｎｓ）．Ｃｏｎｓｉｄｅｒ⁃ ｉｎｇｔｈｅｄｉｆｆｅｒｅｎｃｅｏｆｔｒａｎｓ⁃ｍｏｄａｌｆａｃｅｉｍａｇｅｓ，ｉｔｉｓｈａｒｄｔｏｕｓｅｔｒａｄｉｔｉｏｎａｌｆｅａｔｕｒｅｅｘｔｒａｃｔｉｏｎｍｅｔｈｏｄｓｔｏｅｘｔｒａｃｔｄｉｓ⁃ ｃｒｉｍｉｎａｔｉｖｅｆｅａｔｕｒｅｆｏｒｄｅｓｃｒｉｐｔｉｏｎｏｆｉｍａｇｅｓｗｉｔｈｄｉｆｆｅｒｅｎｔｍｏｄｅｓ．Ｔｒａｄｉｔｉｏｎａｌｆｅａｔｕｒｅｅｘｔｒａｃｔｉｏｎｍｅｔｈｏｄｓｃａｎｎｏｔｄｉｓｔｉｎ⁃ ｇｕｉｓｈｉｍａｇｅｓｅｘａｃｔｌｙ．Ｉｎｔｈｉｓｐａｐｅｒ，ａｄｅｅｐｌｅａｒｎｉｎｇ⁃ｂａｓｅｄｆａｃｅｖｅｒｉｆｉｃａｔｉｏｎｍｅｔｈｏｄｉｓｐｒｏｐｏｓｅｄ．Ｔｈｅｐｒｏｐｏｓｅｄｄｅｅｐｌｅａｒｎｉｎｇ⁃ｂａｓｅｄｆａｃｅｖｅｒｉｆｉｃａｔｉｏｎｍｅｔｈｏｄｉｎｔｅｇｒａｔｅｓｔｈｅｄｅｅｐｂｅｌｉｅｆｎｅｔｗｏｒｋ（ＤＢＮ），ｗｈｉｃｈｅｍｐｌｏｙｓｕｎｓｕｐｅｒｖｉｓｅｄｇｒｅｅｄｙｌａｙｅｒ⁃ｂｙ⁃ｌａｙｅｒｔｒａｉｎｉｎｇｆｏｒｈｉｇｈ⁃ｌｅｖｅｌｆｅａｔｕｒｅｅｘｔｒａｃｔｉｏｎｏｆｆａｃｅｐｈｏｔｏａｎｄｃｏｍｂｉｎｅｓｔｈｅｐｏｐｕｌａｒｌｙｕｓｅｄｉｍａｇｅｐｒｅｐｒｏｃｅｓｓｉｎｇａｎｄｓｉｍｉｌａｒｉｔｙｍｅａｓｕｒｅｍｅｎｔｔｅｃｈｎｏｌｏｇｉｅｓｔｏｒｅａｌｉｚｅｔｈｅｐｕｒｐｏｓｅｏｆｆａｃｅｖｅｒｉｆｉｃａｔｉｏｎ．Ｔｈｅｒｅｓｕｌｔｓｗｅｒｅｅ⁃ ｖａｌｕａｔｅｄｏｎａｒｅａｌｄａｔａｓｅｔｗｉｔｈｔｗｏｄｉｆｆｅｒｅｎｔｍｏｄａｌｉｔｉｅｓｏｆ２５６ｄｉｆｆｅｒｅｎｔｐｅｏｐｌｅ．Ｔｈｉｓｍｅｔｈｏｄｏｕｔｐｅｒｆｏｒｍｓｔｈｅｔｒａｄｉｔｉｏｎａｌｐｒｉｎｃｉｐａｌｃｏｍｐｏｎｅｎｔａｎａｌｙｓｉｓ（ＰＣＡ）ａｎｄｌｉｎｅａｒｄｉｓｃｒｉｍｉｎａｎｔａｎａｌｙｓｉｓ（ＬＤＡ）ｍｅｔｈｏｄｓｗｉｔｈ１２％ａｎｄ８％ｉｍｐｒｏｖｅ⁃ ｍｅｎｔｓｉｎｔｅｒｍｓｏｆｔｈｅｖｅｒｉｆｉｃａｔｉｏｎａｃｃｕｒａｃｙ，ｒｅｓｐｅｃｔｉｖｅｌｙ．Ｔｈｅｒｅｓｕｌｔｓｖａｌｉｄａｔｅｄｔｈｅａｄｖａｎｔａｇｅｏｆｔｈｅｐｒｏｐｏｓｅｄｍｅｔｈｏｄ，ｅｓｐｅｃｉａｌｌｙｗｈｅｎｔｈｅａｍｏｕｎｔｏｆｅｎｔｒｉｅｓｉｎｃｒｅａｓｅｓ．Ｋｅｙｗｏｒｄｓ：ｆａｃｅｒｅｃｏｇｎｉｔｉｏｎ；ｍｕｌｔｉｍｏｄｅｓ；ｄｅｅｐｌｅａｒｎｉｎｇ；ｄｅｅｐｂｅｌｉｅｆｎｅｔｗｏｒｋ收稿日期：２０１４⁃０５⁃２８．网络出版日期：２０１５⁃０３⁃２６．基金项目：国家自然科学基金资助项目（６１０３５００３，６１１７５０４２）．通信作者：张媛媛．Ｅ⁃ｍａｉｌ：ｚｈａｎｇｙｕａｎｙｕａｎ２０１３ｎｊｕ＠ｇｍａｉｌ．ｃｏｍ．目前，中国公民广泛使用第２代身份证作为身份识别的手段。然而，随着近年来社会对于治安监

·194 智能系统学报第10卷控的逐步重视，基于计算机辅助的面向第2代身份过降维的方法来提取人脸图像特征，包括主成分分证的人脸核实问题成为许多研究者关注的问题。析(PCA)[4、线性判别分析(LDA)[O、局部保持投早期的人脸核实研究大都针对受控环境下的人影(locality preserving projection,LPP)I]等，然而上脸识别问题，该问题目前已经可以被较好地解决。述方法皆属于浅层学习模型8】，其局限性在于有限但在拍照环境不确定、用户不配合、年龄更替等不可样本和计算单元情况下对复杂分类问题的函数表示控环境下，人脸核实的正确率急剧下降。因此，目前能力有限，难以发现最具有判别能力的特征。此外，大部分的研究开始关注不受控环境下的人脸核实问对于异构人脸核实问题，图像模态导致的差异通常题，该问题的主要难点在于环境、光照、姿态、年龄更伴随个体不同导致的人像差异，大部分传统方法无替等因素引起的人脸外观急剧变化，从而导致识别法考虑模态的差异进行特征提取，从而在此应用上困难2。会失效[)」 1 相关工作近年来，随着深度学习概念的提出，以深度信念网络(deep belief networks,DBN)为代表的深度神经本文重点研究了二代身份证的人脸核实问题，网络模型，以其揭示数据中所隐藏的有用信息，而受该问题属于不受控环境下的人脸核实问题。如图到研究者们广泛的关注【山」 1,判断二代身份证的模糊人脸图像和二代身份证使 DBN模型是一种逐层贪婪预训练的深层神经用者的清晰视频人脸图像是否属于同一个人。在这网络模型，它克服了传统神经网络在训练上的难度，个问题中，影响核实系统性能的因素主要有：通过多层来获得更加抽象的特征表达，挖掘隐藏在 1)模态差异。二代身份证上人像属于低分辨图像的像素特征之上的高维抽象特征。因此，针对率图像模态，而现实情境下的视频人像属于清晰图二代身份证的人脸核实问题，在特征抽取部分首次像模态；使用了基于DBN的非监督贪心逐层预训练的方法 2)人脸内部变化。年龄增长导致的面部变化、进行权值初始化，结合传统的图像预处理和相似性人脸的表情变化和装饰物等；度量技术，通过深层模型的特征抽取，学习到对数据 3)外在环境因素。如拍摄地点不同而造成的有更本质的刻画的特征，继而提升人脸核实问题的光照问题、角度问题等。准确性。不同于已有的不受控环境下的人脸核实问题，传统的人脸识别方法关注解决受控环境下的人二代身份证的人脸核实问题由于涉及到匹配清晰和脸识别，近年来，研究者们更多地关注不受控环境下模糊2种不同模态的人像，该问题属于异构的人脸的人脸识别问题24。其中，异构人脸识别问题是核实问题。由于模态不同导致的人脸图像之间的差一个研究热点。异通常很大，因此对于异构人脸核实问题，想要达到一般来说，针对异构人脸图像的识别技术通常精确判别十分困难。分为2类：1)通过某种方法将由视图导致的人像特征差异减小，如针对近红外异构人脸数据集，Klare 等5)提出了对红外线人像(NR)和可见光人像 (VIS)进行随机子空间投影和稀疏表示来进行匹配的方法，Yi等[6]提出典型相关分析方法来学习NIR 和VIS人像间的相似性：2)通过将其中一种模态的 (a)视频图像 (b)二代证图像人像转化为其他模态的人像，再进行匹配，如针对近图1异构情境下的人脸核实红外异构人脸数据集，Wang等I]提出了合成和分 Fig.1 Heterogeneous face verification 析的方法将NIR人像转变为合成的VIS人像，Chen 对于传统的人脸核实算法，其基本假设是在进等[8]使用局部线性嵌入算法将NIR人像转变为行人脸区域提取后，同一个个体内部的人像差异小 VIS人像。于不同个体间的人像差异)，其解决手段主要为通深度学习是基于Hubel-Wiesel仿生学模型，通

控的逐步重视，基于计算机辅助的面向第２代身份证的人脸核实问题成为许多研究者关注的问题。早期的人脸核实研究大都针对受控环境下的人脸识别问题，该问题目前已经可以被较好地解决。但在拍照环境不确定、用户不配合、年龄更替等不可控环境下，人脸核实的正确率急剧下降。因此，目前大部分的研究开始关注不受控环境下的人脸核实问题，该问题的主要难点在于环境、光照、姿态、年龄更替等因素引起的人脸外观急剧变化，从而导致识别困难［１⁃２］。１相关工作本文重点研究了二代身份证的人脸核实问题，该问题属于不受控环境下的人脸核实问题。如图１，判断二代身份证的模糊人脸图像和二代身份证使用者的清晰视频人脸图像是否属于同一个人。在这个问题中，影响核实系统性能的因素主要有：１）模态差异。二代身份证上人像属于低分辨率图像模态，而现实情境下的视频人像属于清晰图像模态；２）人脸内部变化。年龄增长导致的面部变化、人脸的表情变化和装饰物等；３）外在环境因素。如拍摄地点不同而造成的光照问题、角度问题等。不同于已有的不受控环境下的人脸核实问题，二代身份证的人脸核实问题由于涉及到匹配清晰和模糊２种不同模态的人像，该问题属于异构的人脸核实问题。由于模态不同导致的人脸图像之间的差异通常很大，因此对于异构人脸核实问题，想要达到精确判别十分困难。图１异构情境下的人脸核实Ｆｉｇ．１Ｈｅｔｅｒｏｇｅｎｅｏｕｓｆａｃｅｖｅｒｉｆｉｃａｔｉｏｎ对于传统的人脸核实算法，其基本假设是在进行人脸区域提取后，同一个个体内部的人像差异小于不同个体间的人像差异［３］，其解决手段主要为通过降维的方法来提取人脸图像特征，包括主成分分析（ＰＣＡ）［４⁃５］、线性判别分析（ＬＤＡ）［６］、局部保持投影（ｌｏｃａｌｉｔｙｐｒｅｓｅｒｖｉｎｇｐｒｏｊｅｃｔｉｏｎ，ＬＰＰ）［７］等，然而上述方法皆属于浅层学习模型［８］，其局限性在于有限样本和计算单元情况下对复杂分类问题的函数表示能力有限，难以发现最具有判别能力的特征。此外，对于异构人脸核实问题，图像模态导致的差异通常伴随个体不同导致的人像差异，大部分传统方法无法考虑模态的差异进行特征提取，从而在此应用上会失效［９］。近年来，随着深度学习概念的提出，以深度信念网络（ｄｅｅｐｂｅｌｉｅｆｎｅｔｗｏｒｋｓ，ＤＢＮ）为代表的深度神经网络模型，以其揭示数据中所隐藏的有用信息，而受到研究者们广泛的关注［１０⁃１１］。ＤＢＮ模型是一种逐层贪婪预训练的深层神经网络模型，它克服了传统神经网络在训练上的难度，通过多层来获得更加抽象的特征表达，挖掘隐藏在图像的像素特征之上的高维抽象特征。因此，针对二代身份证的人脸核实问题，在特征抽取部分首次使用了基于ＤＢＮ的非监督贪心逐层预训练的方法进行权值初始化，结合传统的图像预处理和相似性度量技术，通过深层模型的特征抽取，学习到对数据有更本质的刻画的特征，继而提升人脸核实问题的准确性。传统的人脸识别方法关注解决受控环境下的人脸识别，近年来，研究者们更多地关注不受控环境下的人脸识别问题［１２⁃１４］。其中，异构人脸识别问题是一个研究热点。一般来说，针对异构人脸图像的识别技术通常分为２类：１）通过某种方法将由视图导致的人像特征差异减小，如针对近红外异构人脸数据集，Ｋｌａｒｅ等［１５］提出了对红外线人像（ＮＩＲ）和可见光人像（ＶＩＳ）进行随机子空间投影和稀疏表示来进行匹配的方法，Ｙｉ等［１６］提出典型相关分析方法来学习ＮＩＲ和ＶＩＳ人像间的相似性；２）通过将其中一种模态的人像转化为其他模态的人像，再进行匹配，如针对近红外异构人脸数据集，Ｗａｎｇ等［１７］提出了合成和分析的方法将ＮＩＲ人像转变为合成的ＶＩＳ人像，Ｃｈｅｎ等［１８］使用局部线性嵌入算法将ＮＩＲ人像转变为ＶＩＳ人像。深度学习是基于Ｈｕｂｅｌ⁃Ｗｉｅｓｅｌ仿生学模型，通 ·１９４· 智能系统学报第１０卷

第2期张媛媛，等：深度信念网络的二代身份证异构人脸核实算法 ·195· 过“逐层初始化”建立的多层人工神经网络模型。 p(v,h)= 深度学习的实质是通过构建具有很多隐层的机器学习模型和海量的训练数据，来学习更有用的特征。式中：Z=∑e,为能量函数的指数函数的和。 e,h 区别于浅层学习，深度学习的不同在于：1)强调了有了联合概率，很容易得到模型结构的深度，通常有4层、5层甚至10层的隐藏层节点；2)明确了特征学习的重要性，即通过逐 ∑ew p()= 层特征变换，将样本在原始空间的特征表示变换到 ∑e 一个新的特征空间，从而使分类或者预测更加容易。 p(h)= ∑eo 在人脸核实问题上，Sun等鬥提出将卷积神经网络 (convolutional neural networks,CNN)和限制性玻尔 ∑eow e-E(e,h) 兹曼机(restricted Boltzmann machines,RBM)相堆 p(vh)= 叠，利用CNN的二维特征提取和RBM的一维特征 ∑.e 抽象的特性，在LFW(labeled faces in the wild e8(,i) p(hv)= (1) home)[2o0)数据集上用以自然环境下的人脸核实问 ∑e时题，核实结果准确率为86.88%的。本文相对于以往此外，从统计学的概念出发，定义自由能量函数：工作的主要创新是首次将深度学习引入到异构人脸 FreeEnergy(o)=-ln∑.e- (2) 核实问题上，解决了判别性特征难以提取的问题。自由能量函数是描述整个系统状态的一种测 2 DBN的基本原理度。系统越有序或者概率分布越集中，每个训练样本经过RBM网络编码到隐藏节点的取值概率也越 2.1RBM模型集中，系统的能量就越小，此时RBM系统能够更好 RBM是一个层内节点相互独立，层间节点的联地拟合数据分布。合概率分布满足Boltzmann分布的二部图模型。如图联合(1)、(2)可以得出 2,下层是可视层，即输入数据层，可视节点用v∈R Inp(v)=-FreeEnergy(v)-In Z (3) 表示，其偏置为b∈R',上层是隐藏层，隐藏节点用h 式(3)两边做个累加，可得 ∈R表示，其偏置为c∈R,可视层和隐藏层之间的 ∑.lnp(u)=-∑FreeEnergy(u)-∑，lnZ 连接权值用W∈R“表示。对于图像而言，像素层对应于可视层，特征描述子对应于隐藏层2。可看出一个系统自由能量的总和最小的时候，隐藏变量正是ΠⅡp()最大的时候，也就是说，用极大似然估计去求得∏p()的参数能让RBM系统的自由能量总和达到最小，此时RBM系统能够最好地拟合数据分布。可视变量定义Πp()的似然函数为图2RBM模型 Fig.2 RBM model L(0)= 六2gpe9 受统计学中能量泛函的启发，RBM模型引入了式中：N为节点的个数，0={W,b,c}为RBM模型能量函数，可视节点和隐藏节点的联合组态(v,h) 的参数。的能量函数为用极大似然估计去求参数，可得到 E(w,h)=- aL(-Eh]-Enh aw 依据Boltzmann分布，可视节点和隐藏节点的式中：Epa[h,]为独立数据期望，Ep[,h:]为模联合概率分布为型期望。其中，模型期望的获得是十分困难的，其时

过“逐层初始化” 建立的多层人工神经网络模型。深度学习的实质是通过构建具有很多隐层的机器学习模型和海量的训练数据，来学习更有用的特征。区别于浅层学习，深度学习的不同在于：１）强调了模型结构的深度，通常有４层、５层甚至１０层的隐藏层节点；２）明确了特征学习的重要性，即通过逐层特征变换，将样本在原始空间的特征表示变换到一个新的特征空间，从而使分类或者预测更加容易。在人脸核实问题上，Ｓｕｎ等［１９］提出将卷积神经网络（ｃｏｎｖｏｌｕｔｉｏｎａｌｎｅｕｒａｌｎｅｔｗｏｒｋｓ，ＣＮＮ）和限制性玻尔兹曼机（ｒｅｓｔｒｉｃｔｅｄＢｏｌｔｚｍａｎｎｍａｃｈｉｎｅｓ，ＲＢＭ）相堆叠，利用ＣＮＮ的二维特征提取和ＲＢＭ的一维特征抽象的特性，在ＬＦＷ（ｌａｂｅｌｅｄｆａｃｅｓｉｎｔｈｅｗｉｌｄｈｏｍｅ）［２０］数据集上用以自然环境下的人脸核实问题，核实结果准确率为８６．８８％的。本文相对于以往工作的主要创新是首次将深度学习引入到异构人脸核实问题上，解决了判别性特征难以提取的问题。２ＤＢＮ的基本原理２．１ＲＢＭ模型ＲＢＭ是一个层内节点相互独立，层间节点的联合概率分布满足Ｂｏｌｔｚｍａｎｎ分布的二部图模型。如图２，下层是可视层，即输入数据层，可视节点用ｖ ∈ Ｒｌ表示，其偏置为ｂ ∈ Ｒｌ，上层是隐藏层，隐藏节点用ｈ ∈ Ｒｓ表示，其偏置为ｃ ∈Ｒｓ，可视层和隐藏层之间的连接权值用Ｗ∈Ｒｌ×ｓ表示。对于图像而言，像素层对应于可视层，特征描述子对应于隐藏层［２１］。图２ＲＢＭ模型Ｆｉｇ．２ＲＢＭｍｏｄｅｌ受统计学中能量泛函的启发，ＲＢＭ模型引入了能量函数，可视节点和隐藏节点的联合组态（ｖ，ｈ）的能量函数为Ｅ（ｖ，ｈ）＝－ ∑ ｌｊ＝１ｂｊｖｊ－ ∑ ｓｉ＝１ｃｉｈｉ－ ∑ ｌｊ＝１ ∑ ｓｉ＝１ｖｊｈｉｗｉｊ依据Ｂｏｌｔｚｍａｎｎ分布，可视节点和隐藏节点的联合概率分布为ｐ（ｖ，ｈ）＝１Ｚｅ－Ｅ（ｖ，ｈ）式中：Ｚ＝ ∑ｖ，ｈｅ－Ｅ（ｖ，ｈ），为能量函数的指数函数的和。有了联合概率，很容易得到ｐ（ｖ）＝ ∑ｈｅ－Ｅ（ｖ，ｈ） ∑ｖ，ｈｅ－Ｅ（ｖ，ｈ）ｐ（ｈ）＝ ∑ｖｅ－Ｅ（ｖ，ｈ） ∑ｖ，ｈｅ－Ｅ（ｖ，ｈ）ｐ（ｖｈ）＝ｅ－Ｅ（ｖ，ｈ） ∑ｖｅ－Ｅ（ｖ，ｈ）ｐ（ｈｖ）＝ｅ－Ｅ（ｖ，ｈ） ∑ｈｅ－Ｅ（ｖ，ｈ）（１）此外，从统计学的概念出发，定义自由能量函数：ＦｒｅｅＥｎｅｒｇｙ（ｖ）＝－ｌｎ∑ｈｅ－Ｅ（ｖ，ｈ）（２）自由能量函数是描述整个系统状态的一种测度。系统越有序或者概率分布越集中，每个训练样本经过ＲＢＭ网络编码到隐藏节点的取值概率也越集中，系统的能量就越小，此时ＲＢＭ系统能够更好地拟合数据分布。联合（１）、（２）可以得出ｌｎｐ（ｖ）＝－ＦｒｅｅＥｎｅｒｇｙ（ｖ）－ｌｎＺ（３）式（３）两边做个累加，可得 ∑ｖｌｎｐ（ｖ）＝－ ∑ｖＦｒｅｅＥｎｅｒｇｙ（ｖ）－ ∑ｖｌｎＺ可看出一个系统自由能量的总和最小的时候，正是 ∏ｖｐ（ｖ）最大的时候，也就是说，用极大似然估计去求得 ∏ｖｐ（ｖ）的参数能让ＲＢＭ系统的自由能量总和达到最小，此时ＲＢＭ系统能够最好地拟合数据分布。定义 ∏ｖｐ（ｖ）的似然函数为Ｌ（θ）＝１Ｎ∑ Ｎｎ＝１ｌｏｇｐθ（ｖ（ｎ））式中：Ｎ为节点的个数， θ ＝｛Ｗ，ｂ，ｃ｝为ＲＢＭ模型的参数。用极大似然估计去求参数，可得到 ∂Ｌ（θ） ∂Ｗｉｊ＝ＥＰｄａｔａ［ｖｊｈｉ］－ＥＰθ ［ｖｊｈｉ］式中：ＥＰｄａｔａ［ｖｊｈｉ］为独立数据期望，ＥＰθ ［ｖｊｈｉ］为模型期望。其中，模型期望的获得是十分困难的，其时第２期张媛媛，等：深度信念网络的二代身份证异构人脸核实算法 ·１９５·

·196 智能系统学报第10卷间与隐藏节点个数成指数关系。因此，Hinton等[2) 2.2RBM学习算法提出了CD,(contrastive divergence)方法来模拟梯度整个RBM的训练过程如下，这里用到了CD1。的计算，整个算法过程如图3。一层的RBM模型训练完毕后，固定其权值W 负例样本对和正例样本对及偏置值b、c:,隐藏层的输出h:作为原输入信息负例样本对和正例样本对负例样本对的第1个表达，将隐藏层的输出h,作为其上层RBM 负例样本对的输入，同样训练RBM模型，就会得到第2层的参 ,:+■ 阈值theta 正例样本对数及其输出，其输出就作为原输入信息的第2个表正例样本对红达a]。如此不断往上叠加RBM,就得到了DBN的相似性度量预处理i 初步模型。特征表示正例样本对以上在DBN模型的构建中统称为预训练阶段。 IFr18 工红幻 IEEEEEEE1E I,幻预训练将网络参数训练到一组合适的初始值，从这正例样本对 0上：0卫组初始值出发会令代价函数达到一个更低的值2。 1 、”I8010 DBN模型经过这种方式的训练后，再根据重构误差，使用传统的全局学习算法，比如BP算法对整个模型进行微预训练 BP微调 DBN 调，从而使模型收敛到局部最优点。模型 RBM训练算法符号说明：可视节点j,可视节点预处理 50张视屏图像+ 的偏置b,可视节点值为1的条件概率 1张二代证图像 P(x2=1h,),sign为S型函数，W为连接权值，隐藏节点i,隐藏节点的偏置c:,隐藏节点值为1的条件概率Q(h:=1x,)、Q(h2=1x2)。图3系统框架算法过程 Fig.3 System framework 输入：可视节点值x1, 实验证明，CD,是一种很好的求解对数似然函输出：隐藏节点值h2o 数关于未知参数梯度的近似的方法。 for所有隐藏节点ido CDk算法 1)计算Q(h.=1x,)(若为二值单元，则Q值输人：RBM(V1,2,…,VmH1,2,…,Hn), 输出：梯度估计△w,.△b,△c:。即为sign(c:+∑，Wrxy) forj=1,2,…,m,i=1,2,…,n, 2)从Q(h:lx,)中采样h:∈{0,1 初始化△0g=Ab,=△c:=0forj=1,2,…,m, end for i=1,2,…,n。 for所有可视节点jdo for所有的vdo 3)计算P(xg=1h,)(若为二值单元，则Q值 (o)←U 即为sign(6,+∑，Wgh)) for t=0,...-1do 4)从P(x=1h)中采样x2∈{0,1} fori=1,2,…,ndo采样h(t) end for p(h:v) for所有隐藏节点ido forj=1,2,…,mdo采样“)~p(yh0) 5)计算Q(h2=1x2)(若为二值单元，则Q值 forj=1,2,…,m,i=1,2,…,ndo 即为sign(c:+∑W*)） △0g←-△wg+p(h:-1o)o-p(h,= end for 1) 6)W←-W+E(h1x1'-Q(h2=1x2)x2') 46,←46+@- 7)b←-b+ε(x1-x2) △c:←△c:+p(h=1vo)-p(h,=1v) 8)c←-c+e(h1-Q(h2=1x2))

间与隐藏节点个数成指数关系。因此，Ｈｉｎｔｏｎ等［２２］提出了ＣＤｋ（ｃｏｎｔｒａｓｔｉｖｅｄｉｖｅｒｇｅｎｃｅ）方法来模拟梯度的计算，整个算法过程如图３。图３系统框架Ｆｉｇ．３Ｓｙｓｔｅｍｆｒａｍｅｗｏｒｋ实验证明，ＣＤｋ是一种很好的求解对数似然函数关于未知参数梯度的近似的方法。ＣＤｋ算法输入：ＲＢＭ（Ｖ１，２，…，Ｖｍ，Ｈ１，２，…，Ｈｎ），输出：梯度估计 Δｗｉｊ，Δｂｊ，Δｃｉ。ｆｏｒｊ＝１，２，…，ｍ，ｉ＝１，２，…，ｎ，初始化 Δｗｉｊ＝ Δｂｊ＝ Δｃｉ＝０ｆｏｒｊ＝１，２，…，ｍ，ｉ＝１，２，…，ｎ。ｆｏｒ所有的ｖｄｏｖ（０） ← ｖｆｏｒｔ＝０，．．．ｋ－１ｄｏｆｏｒｉ＝１，２，…，ｎｄｏ采样ｈｉ（ｔ）～ｐ（ｈｉｖ（ｔ））ｆｏｒｊ＝１，２，…，ｍｄｏ采样ｖ（ｔ＋１）ｊ～ｐ（ｖｊｈ（ｔ））ｆｏｒｊ＝１，２，…，ｍ，ｉ＝１，２，…，ｎｄｏ Δｗｉｊ ← Δｗｉｊ＋ｐ（ｈｉ＝１ｖ（０））ｖ（０）ｊ－ｐ（ｈｉ＝１ｖ（ｋ））ｖ（ｋ）ｊ Δｂｊ ← Δｂｊ＋ｖ（０）ｊ－ｖ（ｋ）ｊ Δｃｉ ←Δｃｉ＋ｐ（ｈｉ＝１ｖ（０））－ｐ（ｈｉ＝１ｖ（ｋ））２．２ＲＢＭ学习算法整个ＲＢＭ的训练过程如下，这里用到了ＣＤ１。一层的ＲＢＭ模型训练完毕后，固定其权值Ｗｉｊ及偏置值ｂｊ、ｃｉ，隐藏层的输出ｈｉ作为原输入信息的第１个表达，将隐藏层的输出ｈｉ作为其上层ＲＢＭ的输入，同样训练ＲＢＭ模型，就会得到第２层的参数及其输出，其输出就作为原输入信息的第２个表达［２３］。如此不断往上叠加ＲＢＭ，就得到了ＤＢＮ的初步模型。以上在ＤＢＮ模型的构建中统称为预训练阶段。预训练将网络参数训练到一组合适的初始值，从这组初始值出发会令代价函数达到一个更低的值［２４］。经过这种方式的训练后，再根据重构误差，使用传统的全局学习算法，比如ＢＰ算法对整个模型进行微调，从而使模型收敛到局部最优点。ＲＢＭ训练算法符号说明：可视节点ｊ，可视节点的偏置ｂｊ，可视节点值为１的条件概率Ｐ（ｘ２ｊ＝１ｈ１），ｓｉｇｎ为Ｓ型函数，Ｗｉｊ为连接权值，隐藏节点ｉ，隐藏节点的偏置ｃｉ，隐藏节点值为１的条件概率Ｑ（ｈ１ｉ＝１ｘ１）、Ｑ（ｈ２ｉ＝１ｘ２）。算法过程输入：可视节点值ｘ１，输出：隐藏节点值ｈ２。ｆｏｒ所有隐藏节点ｉｄｏ１）计算Ｑ（ｈ１ｉ＝１ｘ１）（若为二值单元，则Ｑ值即为ｓｉｇｎ（ｃｉ＋ ∑ｊＷｉｊｘ１ｊ））２）从Ｑ（ｈ１ｉｘ１）中采样ｈ１ｉ ∈ ｛０，１｝ｅｎｄｆｏｒｆｏｒ所有可视节点ｊｄｏ３）计算Ｐ（ｘ２ｊ＝１ｈ１）（若为二值单元，则Ｑ值即为ｓｉｇｎ（ｂｊ＋ ∑ｊＷｉｊｈ１ｉ））４）从Ｐ（ｘ２ｊ＝１ｈ１）中采样ｘ２ｊ ∈ ｛０，１｝ｅｎｄｆｏｒｆｏｒ所有隐藏节点ｉｄｏ５）计算Ｑ（ｈ２ｉ＝１ｘ２）（若为二值单元，则Ｑ值即为ｓｉｇｎ（ｃｉ＋ ∑ｊＷｉｊｘ２ｊ））ｅｎｄｆｏｒ６）Ｗ ← Ｗ＋ ε（ｈ１ｘ１ ′ －Ｑ（ｈ２＝１ｘ２）ｘ２ ′）７）ｂ ← ｂ＋ ε（ｘ１－ｘ２）８）ｃ ← ｃ＋ ε（ｈ１－Ｑ（ｈ２＝１ｘ２）） ·１９６· 智能系统学报第１０卷

第2期张媛媛，等：深度信念网络的二代身份证异构人脸核实算法 ·197. 2)根据重构误差采用BP算法对整个模型进行 3人脸核实问题的解决方案反向调节。人脸核实问题的解决算法流程如图3，实线箭整个深度学习模型可以看成是一个特征抽象的头部分为系统训练，虚线箭头部分为系统测试：过程，即将原来40×40的图像经过一系列抽象，摒 1)图像预处理除无用信息，保留高维特征。对收集到的数据集采用Adaboost算法[2s]和主 3)模型测试。将测试样本的数据均按照1)所动形状模型(acitve shape model,ASM)[2进行人脸述进行预处理，进行高斯处理后再输入到2)训练出检测和关键点定位，再按照瞳孔坐标位置进行归一的DBN模型中去，最高层的500个节点值作为图像化，如图4，可以看到对齐后的效果。将归一化后的最终的抽象特征向量。视频图像进行模糊化，最后对所有的图像进行Quo 4)相似性度量。将50个视频图像的特征向量 tient Image方法去除光照千扰。和1个二代证图像的特征向量构成50个（矿∫2） 2)DBN模型训练对，其中∫，表示视频图像特征向量，∫2表示二代证将按照上述预处理后得到的图片进行高斯处图像特征向量，计算向量的余弦距离，得到50个相理，使得均值为1，方差为0，如图5，打乱训练样本似度数值，得到最大的相似度数值作为50张视频图图片，再将每张40×40的图片拉成一维行向量作为像和一张二代证图像之间的相似度。对上述的相似整个DBN模型的输入。度数值设置阈值，如果高于一个阈值则视频图像和二代证图像中是同一个人，否则不是同一个人。 DBN模型：预训练+反向微调 ●0▣500 反向传播 RBM第4层a云 ▣1000 W. 微调 (a)视频图像 ●●●●●●☑2000 (b)二代证图像 RBM第3层O。微调图4归一化效果图 I ☐400( RBM第2层微调 Fig.4 Normalization 000●● ●●●●●☐1600 第1层 RBM 「输入图像40×40 图6深度学习模型DBN Fig.6 DBN model 4 图5高斯处理后的效果图实验结果与分析 Fig.5 Face pictures after Gaussian processing 4.1实验设置用于二代证人脸核实问题上的DBN模型如图实验用到的数据集为采集的二代身份证的 6,第1层以1张分辨率为40×40的图像作为输入，人像数据集，具体包括：1)第1批采集的98人的即包含1600个实值节点的可视层，第2层以及第3 二代身份证图像和视频图像（数据集1）；2)256 层均为二值隐藏层，分别包含4000,2000个节点，个人（第1批98个人+第2批158个人）的二代最后一层为实值隐含层，也为输出层，共包含500个身份证图像和视频图像（数据集2）。这2个数节点。据集均是在特定的采集环境中采集，涵盖年龄、整个DBN模型的训练过程为：光照、姿态、表情等主要变化条件，每个人的数据 1)预训练。逐层叠加训练RBM模型，直至最为51张图像，包含二代身份证模糊照片1张和高层。此时，整个模型网络参数的初始值在代价函视频拍摄图像50张。数最优解附近，很大程度上避免了反向调节时BP 实验采用了2种方案进行：1)十折交叉验算法陷入局部最优

３人脸核实问题的解决方案人脸核实问题的解决算法流程如图３，实线箭头部分为系统训练，虚线箭头部分为系统测试：１）图像预处理对收集到的数据集采用Ａｄａｂｏｏｓｔ算法［２５］和主动形状模型（ａｃｉｔｖｅｓｈａｐｅｍｏｄｅｌ，ＡＳＭ）［２６］进行人脸检测和关键点定位，再按照瞳孔坐标位置进行归一化，如图４，可以看到对齐后的效果。将归一化后的视频图像进行模糊化，最后对所有的图像进行Ｑｕｏ⁃ ｔｉｅｎｔＩｍａｇｅ方法去除光照干扰。２）ＤＢＮ模型训练将按照上述预处理后得到的图片进行高斯处理，使得均值为１，方差为０，如图５，打乱训练样本图片，再将每张４０ × ４０的图片拉成一维行向量作为整个ＤＢＮ模型的输入。图４归一化效果图Ｆｉｇ．４Ｎｏｒｍａｌｉｚａｔｉｏｎ图５高斯处理后的效果图Ｆｉｇ．５ＦａｃｅｐｉｃｔｕｒｅｓａｆｔｅｒＧａｕｓｓｉａｎｐｒｏｃｅｓｓｉｎｇ用于二代证人脸核实问题上的ＤＢＮ模型如图６，第１层以１张分辨率为４０ × ４０的图像作为输入，即包含１６００个实值节点的可视层，第２层以及第３层均为二值隐藏层，分别包含４０００，２０００个节点，最后一层为实值隐含层，也为输出层，共包含５００个节点。整个ＤＢＮ模型的训练过程为：１）预训练。逐层叠加训练ＲＢＭ模型，直至最高层。此时，整个模型网络参数的初始值在代价函数最优解附近，很大程度上避免了反向调节时ＢＰ算法陷入局部最优。２）根据重构误差采用ＢＰ算法对整个模型进行反向调节。整个深度学习模型可以看成是一个特征抽象的过程，即将原来４０ × ４０的图像经过一系列抽象，摒除无用信息，保留高维特征。３）模型测试。将测试样本的数据均按照１）所述进行预处理，进行高斯处理后再输入到２）训练出的ＤＢＮ模型中去，最高层的５００个节点值作为图像最终的抽象特征向量。４）相似性度量。将５０个视频图像的特征向量和１个二代证图像的特征向量构成５０个（ｆ１，ｆ２）对，其中ｆ１表示视频图像特征向量，ｆ２表示二代证图像特征向量，计算向量的余弦距离，得到５０个相似度数值，得到最大的相似度数值作为５０张视频图像和一张二代证图像之间的相似度。对上述的相似度数值设置阈值，如果高于一个阈值则视频图像和二代证图像中是同一个人，否则不是同一个人。图６深度学习模型ＤＢＮＦｉｇ．６ＤＢＮｍｏｄｅｌ４实验结果与分析４．１实验设置实验用到的数据集为采集的二代身份证的人像数据集，具体包括：１）第１批采集的９８人的二代身份证图像和视频图像（数据集１）；２）２５６个人（第１批９８个人＋第２批１５８个人）的二代身份证图像和视频图像（数据集２）。这２个数据集均是在特定的采集环境中采集，涵盖年龄、光照、姿态、表情等主要变化条件，每个人的数据为５１张图像，包含二代身份证模糊照片１张和视频拍摄图像５０张。实验采用了２种方案进行：１）十折交叉验第２期张媛媛，等：深度信念网络的二代身份证异构人脸核实算法 ·１９７·

点击进入文档下载页（PDF格式）

共8页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录