基于低秩矩阵分解和协作表示的人脸图像分类

2015-06-23 13:55阴亚芳廖延娜
西安邮电大学学报 2015年1期
关键词:识别率人脸人脸识别

阴亚芳, 李 倩, 廖延娜

(1. 西安邮电大学 电子工程学院, 陕西 西安 710121; 2. 西安邮电大学 理学院, 陕西 西安 710121)

基于低秩矩阵分解和协作表示的人脸图像分类

阴亚芳1, 李 倩1, 廖延娜2

(1. 西安邮电大学 电子工程学院, 陕西 西安 710121; 2. 西安邮电大学 理学院, 陕西 西安 710121)

为了降低干扰因素对人脸识别准确率的影响,提出一种基于低秩矩阵分解和协作表示的人脸图像分类算法。针对噪声阴影影响,使用鲁棒主分量分析(RPCA)对人脸数据进行低秩矩阵分解,去除干扰,得到较为干净的人脸图像。通过协作表示分类方法对经RPCA处理后的低秩分量图像进行分类,通过归一化的最小重构误差来判定测试样本的具体类标。在3个人脸数据集上对算法性能进行仿真测试,结果表明,该算法在10%到50%的标记率下较其他算法均能提升分类识别率。

低秩矩阵分解;协作表示;分类;监督学习;人脸识别

噪声,光照不均衡产生的阴影以及不同的姿态都对人脸识别算法的性能有着重要影响,因为算法的鲁棒性也在一定程度上依赖于人脸图像的质量。低质量的人脸图像对于后续处理提出了巨大的挑战。基于haar小波的人脸图像去噪算法[1]和基于小波变换和去噪模型的光照不变人脸识别算法[2]取得了较好效果,然而,这些算法都是在单独样本上进行图像去噪和分类识别,并没有考虑样本之间的相似性,从而在一定程度上限制了算法的性能。

在人脸识别过程中,样本的表示以及分类器的选择对于最终的识别效果起着关键性的作用。基于稀疏表示的分类算法(Sparse Representation based Classifier,SRC)[3]假设样本之间可以线性表示,通过最小重构误差来确定最终测试样本类别,该思想也被广泛应用与图像去噪[4]、超分辨[5]、运动跟踪[6]、遥感影像分类[7]和图像快速重构[8],但是SRC运算量大,耗时较长。基于多分类器融合策略的人脸识别算法[9]原理与SRC类似。基于协作表示的人脸分类算法(Collaborative Representation based Classifier,CRC)[10]充分考虑了数据表示间的协作性,实验效果好且计算代价小,不过该算法是基于原始数据样本进行的实验,而人脸数据的质量会直接影响着算法的性能。

综合考虑现有算法存在的问题,本文拟将鲁棒主分量分析(Robust Principle Component Analysis,RPCA)算法[11]与CRC算法相结合,给出一种基于低秩矩阵分解和协作表示的分类算法,即鲁棒主成分分析协作表示分类算法(Robust principle component analysis based Collaborative Representation Classification, RCRC),来进一步提升分类性能,并通过实验加以检验。

1 基本理论

1.1 鲁棒主分量分析

鲁棒主分量分析算法给出了低秩矩阵分解的模型[11]

(1)

其中

X=(x1,x2,…,xn),A=(a1,a2,…,an),E=(e1,e2,…,en),

分别表示具体得到的人脸数据,数据中的低秩分量和数据中的稀疏噪声项。m为数据维数,每一个样本都是一个列向量。n为样本个数。由于数据样本之间的相关性,所观测到的实际数据具有明显的低秩性质,即其他样本可以用少量的样本集来线性表示,从而整体数据的秩会降低。基于这样一种观察和假设,可以对数据进行分解,得到其低秩部分,也就是所有数据的公共部分,得到的E也就是数据之间的差异部分,即噪声阴影类干扰,其具有稀疏性质。

由于秩函数的离散性,上述优化问题可松弛为

(2)

(3)

上述优化函数可以通过交替的求解变量A和E进行求解,具体求解过程可以参考文献[12]。

通过求解上述优化问题,可以得到数据的低秩部分A和稀疏E,低秩部分A将作为后续分类的原始数据。

1.2 基于协作表示的人脸分类算法

针对图像分类问题,已有各种分类识别算法被提出。经典SRC算法假设,某一个测试样本可以通过已知训练集中的标记样本来进行线性重构,从而表示模型可以表示为线性模型。通过最少标记样本来进行线性重构,可以得到该测试样本在给定训练集下的表示系数。该模型可以写成最小化有约束的l1范数。最后通过对每一类的最小重构误差来确定测试样本的类别。该过程在人脸识别上取得了很好的实验结果,然而,求解这样一个l1范数特别耗时,尤其是当训练集数目很大且样本维数较高时,算法运行时间更大。

针对SRC算法中l1范数求解耗时这个问题,文[10]提出在人脸识别中,并不一定要求能求解的系数是稀疏的,即并不一定要用最少的训练样本去表示一个测试样本,从而提出了基于l2范数优化的人脸识别方法。

CRC模型可以表示为[10]

(4)

其中D是给定的训练样本集,α表示系数向量,λ是调节参数。通过求解上述优化问题可以得到表示系数α,最后可以通过归一化的最小重构误差来确定测试样本y的类标

(5)

其中M是类别数目,该归一化能在一定程度上带来判别信息。由于上述优化具有解析解,从而算法运行时间较短。

2 新算法

在RPCA算法中,所有样本都是列向量,通过全局性优化,将所有样本联合在一起处理,可以利用所有样本间的相似性来得到数据的低秩部分,即公共部分,从而也就能够得到数据之间的差异部分,即噪声。这样一种处理方式能够得到更为干净的人脸图像,其受噪声、阴影和姿态的影响较小,从而在一定程度上得到了更好的源数据,对于算法性能的提升有一定的辅助作用。

考虑将通过RPCA所得到的低秩部分的数据作为后续分类的原始数据,实验结果可以说明该预处理的有效性。

在数据分类阶段,采用原始的CRC框架,给定一个测试样本y,通过训练集线性表示为

y=d1α1+d2α2+…+dnαn=(d1,d2,…,dn)(α1,α2,…,αn)T=Dα。

(6)

上式可以拓展为矩阵形式

Y=DΨ,

其中Ψ为所有α组成的矩阵,每一列对应一个样本的表示系数。通过这样一个矩阵形式的书写,可以对所有数据的表示系数进行整体求解,从而将式(4)改写为

(7)

由于上式是优化问题是关于变量Ψ的二次凸函数,所以通过对上式求导且令导数为0,可以得到Ψ的解析解,即

Ψ=(D′D+λI)-1D′Y,

(8)

其中I为对应大小的单位阵。在得到表示矩阵Ψ后,可以直接对测试样本进行分类。相应的分类器,即式(5)也可以改写为

(9)

通过归一化的每类最小重构误差来确定测试样本y的类别。

通过这样一个具有解析解形式的分类过程,算法在运行时间上得到了很好的保证。从而,基于此所提出的算法框架可在一定程度上兼顾算法稳定且运行时间较短的优势。

新算法的框架如图1所示,主要包括两大步骤,即通过RPCA的数据预处理和基于CRC框架下的图像分类。

图1 RCRC算法原理

3 仿真与分析

在3个人脸数据集YaleB, ORL和AR上对新算法性能进行测试与已有算法进行对比,为些数据集中包含着各种表情、遮挡、噪声、阴影、姿态等干扰的人脸图像。数据集YaleB包含640张人脸图像,数据总共有10类,每类64张,原始数据维度为1 024。数据集ORL包含400张人脸图像,数据总共有40类,每类10张,原始数据维度为1 024。数据集AR包含1680张人脸图像,数据总共有120类,每类14张,原始数据维度为2 000。

将新算法与最近邻分类器(Nearest Neighbor classifier, NN)、基于半监督图的分类算法(learning with Local and Global Consistency,LGC)[13]以及CRC算法进行比较,这是因为:NN是典型的模式识别分类算法;LGC结合了标记样本和大量无标记样本,属于半监督学习领域典型算法,而新算法为有监督算法,所以有监督和半监督算法之间进行比较,也能在一定程度验证算法的广阔性;与CRC相比较是因为新算法是基于CRC框架下的,不同在于新算法结合了RPCA,两者之间的比较恰好能说明新算法使用RPCA的作用。

在仿真测试中,分别在不同标记率下对各算法的性能进行了比较,标记率从10%到50%,对每个算法运行10次,计算其均值和方差。表1至表3分别列出了3个数据集上进行仿真的结果。表中粗体表示的数据为当前标记率下各算法的最好结果,可见,新算法优于其他3种算法。

表1 在YaleB上4种算法的识别率

表2 在ORL上4种算法的识别率

表3 在AR上4种算法的识别率

以在数据集YaleB上的运行结果为例,标记率从10%提升到50%时,RCRC的分类性能从91.19%提升到了99.56%,提升幅度为8%,算法的方差也呈减小趋势,在一定程度上说明了算法在高标记率下的稳定性。从表1中可以看出,随着标记率的增加,所有算法的性能均得到很大程度的提升,也从另一方面说明了标记样本的多少对于算法分类性能的重要性。在ORL和AR数据集上,能够观察到同样的实验效果和变化趋势。不难发现,在数据集的数据越多的情况下,新算法识别率越好。通过表1至表3可以发现所提出的算法在所有情况下均取得最好实验结果,从而也就说明了所提算法的优越性和合理性。

在数据集YaleB上,新算法对比其他算法的识别率增量如图2所示。从图上不难看出标记率从10%到50%,新算法比NN算法、LGC算法及CRC算法的识别率都有增加,在标记率是10%的时候识别率提高的很明显。在ORL数据集和AR数据集上也有相类似结果,从而说明了RPCA预处理在算法性能提升上的作用,也说明噪声、阴影、姿态等干扰的影响得到了有效的降低。

图2 新算法对比其他算法识别率增量

由于RPCA中的参数α有理论最优值,所以考虑固定其大小。CRC中的参数λ的值固定为10-4,在新算法中固定λ的值为10-3。实验效果可证明该参数设置的合理性。

分析参数λ对算法性能的影响。选取数据集YaleB进行参数分析。实验中选取10%的标记样本进行测试,参数λ变化范围为10-6~10-1。

由图3可见,在很大范围内(10-6~10-3),新算法都能获得很好的实验结果,准确率均在90%以上。当参数大于0.01时,算法性能会下降,主要是由于参数取值过大,即对于正则项的惩罚太大,导致算法识别率降低。

图3 新算法关于λ在YaleB上的参数分析

4 结束语

提出了基于RPCA的协作表示分类方法CRCR,并在人脸数据库上对其算法性能进行了验证。首先,通过RPCA对数据进行预处理,去除噪声阴影姿态等干扰,然后利用表示系数间的协作性得到分类系数,最后通过每一类的最小重构误差来确定测试样本的最终类标。在数据维度较高时,算法的实时性有待提升。新算法是在样本的原始空间上进行分类识别,通过更为鲁棒有效的特征提取可在一定程度上提高算法分类性能。

[1] 徐静云.一种基于haar小波的人脸图像去噪算法[J].科技信息,2013,26(1): 15-16.

[2] 曹雪,余立功,杨静宇.基于小波变换和去噪模型的光照不变人脸识别[J].计算机应用,2011,31(8):2126-2129.

[3] Wright J, Yang Allen, Ganesh A, et al. Robust face recognition via sparse representation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009, 31(2):210-227.

[4] 何艳敏,甘涛,陈武凡.基于稀疏表示的两级图像去噪[J].电子与信息学报,2012,34(9):2268-2272.

[5] Yang Jianchao, Wright J, Huang T, et al. Image super-resolution via sparse representation[J]. IEEE Transactions on Image Processing (TIP), 2010, 19 (11):778-781.

[6] Xie Yuan, Zhang Wensheng, Li Cuihua, et al. Discriminative object tracking via sparse representation and online dictionary learning[J]. IEEE Transactions on Cybernetics, 2014, 44(4): 539-553.

[7] Chen Yi, Nasrabadi N M, Tran T D. Hyperspectral image classification using dictionary based sparse representation[J]. IEEE Transactions on Geoscience and Remote Sensing, 2011, 49(10):3973-3985.

[8] 王小刚,田小平,吴成茂. 基于压缩感知的图像快速重构去噪算法[J]. 西安邮电学院学报,2012,17(4):11-14.

[9] 陈羽,赖剑煌.基于多分类器融合的人脸识别方法[J].中山大学学报:自然科学版,2006, 45(14):24-27.

[10] Zhang Lei, Yang Meng, Feng Xiangchu. Sparse representation or collaborative representation: which helps face recognition[C]//IEEE International Conference on Computer Vision. Spain Barcelona:IEEE, 2011: 471-478.

[11] Candès E J, Li Xiaodong, Ma Yi, et al. Robust principal component analysis[J]. Journal of the ACM (JAC-M), 2011, 58(3):1101-1127.

[12] Lin Zhouchen,Chen Minming,Ma Yi. The augmentted Lagrange multiplier method for exact recovery of corrupted low-rank matrices[R/OL]. UIUC Technical Report UILU-ENG-09-2214. (2009-10-26)[2014-08-10]. http://www.cad.zju.edu.cn/home/dengcai/Data/FaceData.html.

[13] Zhou Dengyong, Bousquet O, Lai T N, et al. Learning with local and global consistency[C]//Advances in Neural Information Processing Systems. Canada Vancouver: MIT Press,2003:321-328.

[责任编辑:瑞金]

Face image classification based on low rank matrix decomposition and collaborative representation

YIN Yafang1, LI Qian1, LIAO Yanna2

(1.School of Electronic Engineering, Xi’an University of Posts and Telecommunications, Xi’an 710121, China;2. School of Science, Xi’an University of Posts and Telecommunications, Xi’an 710121, China)

In order to address the problem of low recognition accuracy in the case with strong interference, a new algorithm of face image classification based on low rank matrix decomposition and collaborative representation is proposed in this paper. Firstly, the robust principle component analysis (RPCA) method for low rank matrix decomposition of face data set is used to obtain the clean face images. Secondly, images are classified after RPCA by collaborative representation and the labels of test sample are determined with the normalized minimum reconstruction error. Performance comparisons are done between the new algorithm and classical classification algorithms. Experimental results show that this method can improve the classification accuracy efficiently when the label rate is ranged from 10% to 50%.

low rank matrix decomposition, collaborative representation, classification, supervised learning, face recognition

2014-09-01

陕西省教育厅科学研究计划资助项目(12JK0559)

阴亚芳(1966-),女,博士,教授,从事数字信号处理及光通信技术研究。E-mail:yinyf@xupt.edu.cn 李倩(1989-),女,硕士研究生,研究方向为图形图像及视频处理。E-mail:liqian8902@126.com

10.13682/j.issn.2095-6533.2015.01.014

TP391.4

A

2095-6533(2015)01-0070-05

猜你喜欢
识别率人脸人脸识别
人脸识别 等
有特点的人脸
一起学画人脸
揭开人脸识别的神秘面纱
人脸识别技术的基本原理与应用
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
听力正常青年人的低通滤波言语测试研究*
三国漫——人脸解锁
提升高速公路MTC二次抓拍车牌识别率方案研究
人脸识别在高校安全防范中的应用