基于子空间的人脸识别方法的分析与研究

2020-12-28 02:10吕芳芳

电脑知识与技术 2020年33期

摘要：人臉识别技术以其非入侵的优势已经在工作和生活的各领域中广泛应用，随着科技的进步，未来人脸识别的应用将更加普遍。近几十年来，研究者们提出了许多的人脸识别算法。分析和研究基于子空间的人脸表示以及人脸分类方法，通过重点介绍人脸分类的几种具有代表性的方法并总结其优缺点，来探讨未来人脸识别的研究方向。

关键词：人脸表示;人脸分类;特征子空间;发展趋势

中图分类号：TP311 文献标识码：A

文章编号：1009-3044（2020）33-0185-02

开放科学（资源服务）标识码（OSID）：

1 引言

人脸识别作为一种非侵人性的生物识别技术，目前已经被广泛应用于各种场合，如公安检查系统，医院和高校的门禁系统，教室的考勤系统等。但目前的人脸识别技术仍然面临较大的挑战，比如面部表情变化，光照变化，姿态变化，以及是否存在遮挡等，都会使得分类识别任务的准确率下降，因而人脸识别还有很长的路要走。近年来，人脸识别的研究大多开始转向人脸姿态的矫正，表情的矫正，以及含遮挡的人脸图像中遮挡的定位和遮挡下人脸图像的重构等。目前基于深度学习和3D人脸模型的姿态、表情矫正方法已经取得显著成果，但仍有提升的空间。而针对包含遮挡的人脸图像，如墨镜类的遮挡，能够通过加入先验知识获得较为理想的效果，但对于随机的遮挡物，目前还没有较好的定位遮挡的方法。

人脸识别的技术流程主要有人脸检测，人脸表示以及人脸分类。人脸检测的任务是检测并定位出一幅图像中的人脸;人脸表示是将人脸映射到特征子空间中来更好的描述人脸;而人脸分类的任务便是识别出人脸的身份或者标签。本文主要针对人脸表示和分类介绍相关的方法。在众多已有的人脸识别的方法中，很多都是基于子空间的方法。

2 人脸表示的方法

人脸表示是将原本的人脸图像中的特征信息表示成有利于分类器比较和分类的特征形式。一般分为局部特征和全局特征两种。

2.1 全局特征的表示方法

主成分分析方法[1]（Principal Component Analysis，PCA）和线性判别分析[2] （Linear Discriminate Analysis，LDA）是经典的用于提取全局特征的方法，本质上都是通过投影变换将样本从一个特征空间变换到另一个特征空间的方法。PCA方法主要是通过K-L变换消除数据的相关性，并投影到一个子空间中，使得各类别数据能够在该空间上较好的分离。所以PCA常用于特征降维，将高维特征投影到低维的特征空间中。缺点是由于PCA是一种无监督的方法，缺乏类别信息的辅助，因而无法增强各类别数据之间的区分度。而LDA则是一种有监督的方法，在PCA的基础上引入Fisher准则，在向子空间投影的同时进行聚类。即使得同类样本之间更加紧凑，不同类别样本之间的距离更大，从而实现更好的分类效果。

2.2 局部特征的表示方法

由于全局特征无法有效捕捉细节信息，因此局部特征的提取方法逐渐兴起。较有代表性的局部二值模式[3] （Local BinaryPattern，LBP）是一种描述图像局部纹理特征的视觉算子，具有旋转不变性和灰度不变性等优点。如图1所示，通过阈值标记中心像素和其邻域像素之间的差别，再将其二值化，得到该中心像素的特征值。但是基于空域的LBP特征及其变体对于光照等异常的鲁棒性不足，因此研究者们又提出了很多基于频域的特征。比如Gabor特征[4]，通过傅立叶变换将图像从空间域转换到频率域，再利用Gabor核在频率域进行加窗，然后对频域图像分块求和得到原始图像在某一方向和尺度下的特征向量。由于Gabor滤波器的频率和方向与人类的视觉系统类似，因而特别适合于纹理表示与判别。

无论是全局特征还是局部特征，都是将原始样本投影到某一个特征域（或特征子空间）上，在该特征子空间内能比原始样本空间更有效的表达样本特征，从而更有利于接下来的分类。基于子空间的人脸表示方法如图2所示。

3 人脸分类的方法

用于人脸分类的方法主要有基于稀疏表示的方法和基于协同表示的方法。稀疏表示的目的是在给定的超完备字典中使用尽可能少的原子来表示信号，使得信号的表示更加的简洁，从而更方便对信号加工处理。而系统表示则是尽可能利用更多不同类的样本来协同表示一个测试样本，以提高表示的效果。

3.1基于稀疏表示子空间的方法

由Wright等人于2009年提出了基于稀疏表示[6]的分类器（Sparse Representation based Classification。SRC），基于压缩感知理论，通过最小L1范数的回归因子，从相关性较强的各人脸子空间寻找能较好表达待识别图像y的字典原子：

min ‖y - Ax ‖，+‖x‖.

其中x为重构系数（回归因子），A为训练样本，y为测试样本。L1范数会使得向量x中尽可能多的元素为0，从而让其中的非零元素尽可能落在v所属的类别子空间当中。

虽然SRC可以得到较为理想的人脸识别的准确率，但是由于原始训练样本中可能存在噪声等不确定的信息，因而在这种情况下可能无法有效的表示测试样本。因此，Yang等人将字典学习[10，11]引入到SRC当中，并加入Fisher准则[9]以增强回归因子的判别力，提出了Fisher判别字典学习[7]模型（Fisher Discrimina-tion Dictionary Learning， FDDL）.

3.2 基于协同表示子空间的方法

Zhang等人于2011年提出了“协同表示”的思想，认为SRC的成功不一定归功于稀疏编码，因为不同类样本之间存在较大的相关性，因而一些不能被同类别样本很好表示的特征也许能够被其他类别的样本表征。同时，在保证测试样本y能够被训练样本较好的表示的基础上，还须保证编码系数x的主要能量落在y所属的子空间中，防止被其他类别上相似的局部特征“过度表达”。所以，zhang等人提出的基于协同表示[5]的分类（Col-laborative Representation based Classifier。CRC）模型如下：

其中，对回归因子x的约束采用Lp（p=1，2）范数，）L为平衡因子，e为表示误差。

同SRC 一样，CRC依然是采用训练样本当作字典，因而其表示能力有限。Cai等人于2014年将字典学习和支持向量的思想引入SRC中，提出了支持向量引导的字典学习[8]（Support Vec-tor Guided Dictionary Learning，SVGDL）模型，作者证明该模型实际上是FDDL的更一般的形式。并且SVGDL自适应的确定每对编码向量的权重，能够取得比FDDL更好的分类结果。

字典学习的实质是通过迭代拟合原始训练样本，得到训练样本的一个鲁棒的回归子空。进而通过将测试样本投影到该子空间当中，根据其与各类别样本的相似程度确定其类别。无论是协同表示还是系数表示，最终都需要引入字典学习得到更加鲁棒的表达样本的子空间。基于子空间的人脸分类方法如图3所示。

4 总結

随着软硬件技术的进步，有许多性能优异的人脸分类算法出现，但都只能适用于某一种特定的场景。实际应用中，情况复杂多变，人脸识别还有很多难点需要攻克，比如图像的质量对于识别性能的影响，还有前文提到的表情、光照、遮挡等异常情况的出现，甚至还有肉眼难以分辨的双胞胎等问题。

本文主要探讨了一些经典的人脸表示和分类方法及其产生动机和优缺点。人脸识别技术未来的发展趋势可以从以下方面展开：1）如何定位面部图像上出现的遮挡。2）如何矫正表情的变化以降低其对识别效果的影响。3）如何确定哪些局部特征能被有效协同表示并防止过度表达。相信未来人脸识别技术会更加完善，更加广泛地应用于实际生活当中。

参考文献：

[1] Wold S，Esbensen K，Geladi P.Principal component analysis[J].Chemometrics and Intelligent Laboratory Systems， 1987， 2（1/2/3）：37-52.

[2] Ye J， Janardan R， Li Q， et al. Two-Dimensional Linear Dis-criminant Analysis[C]. neural information processing systems， 2004： 1569-1576.

[3] Ahonen T，Hadid A，Pietikainen M.Face description with localbinary patterns：application to face recognition[J].lEEE Transac-tions on Pattem Analysis and Machine Intelligence， 2006， 28（12）：2037-2041.

[4] Patil M K，Patekar S A，Sankhe P，et al.Gabor feature extractionfor gray scale image[C]//Proceedings of the International Con-ference & Workshop on Emerging Trends in Technology - IC-WET '11. February 25-26， 2011. Mumbai， Maharashtra， India.New York：ACM Press，2011：22-24.

[5] Lei Z，Meng Y，Feng X C.Sparse representation or collaborativerepresentation：Which helps face recognition？[C]//2011 Interna-tional Conference on Computer Vision.November 6-13， 2011，Barcelona，Spain.IEEE，2011：471-478.

[6] Wright J，Yang A Y，Ganesh A，et aI.Robust face recognition viasparse representation[J].lEEE Transactions on Pattern Analysisand Machine Intelligence，2009，31（2）：210-227.

[7] Yang M，Zhang L，Feng X C，et aI.Fisher Discrimination Diction-ary Learning for sparse representation[C]//2011 InternationalConference on Computer Vision.November 6-13，20ll，Barcelo-na，Spain.lEEE，2011：543-550.

[8] Cai S J，Zuo W M，Zhang L，et aI.Support vector guided diction-ary learning[J].Computer Vision - ECCV 2014，2014： 624-639.D01：10.1007/97 8-3-319-105 93 -2_41.

[9] Gao Q X，Liu J J，Zhang H J，et aI.Enhanced fisher discriminantcriterion for image recognition[J].Pattern Recognition， 2012，45（10）：3717-3724.

[10] Tosic I，Frossard P.Dictionary learning[J].lEEE Signal Process-ing Magazine，2011，28（2）：27-38.

[11] Mairal J，Bach F，Ponce J，et aI.Supervised dictionary learning[EB/OL]. 2008： arXiv： 0809.3083[cs. CV]. https：//arxiv. org/abs/0809.3083.

作者简介：吕芳芳（1983-），女，河南洛阳人，中级职称，硕士，主要研究方向为计算机网络及网络安全、图像处理。