基于Gabor-ILLE的多姿态人耳识别

2014-08-03 15:23雷军环

计算机工程与应用 2014年23期

关键词：降维维数识别率

雷军环

长沙民政职业技术学院软件学院，长沙 410004

基于Gabor-ILLE的多姿态人耳识别

雷军环

长沙民政职业技术学院软件学院，长沙 410004

人耳作为人的独特生物特征体，具有唯一性、稳定性等特点，且人耳不受表情、化妆的影响，也不易损伤，识别时不受打扰，人耳识别的研究引起了学者们的广泛关注[1-3]。

多姿态人耳指当人耳姿态变化时，图像会呈现不同程度压缩、旋转和拉伸等变化，导致人耳图像产生形变，其中特征提取是多姿态人耳识别中的一个重要步骤，当前人耳特征提取方法分为两类：几何形状特征法和代数特征法[4]。几何形状特征法通过提取外耳和内耳关键点，构建的几何特征，物理意义十分直观，但易受姿态、光照等外界因素的影响，特征提取不稳定，人耳识别率低[5-6]。代数特征法提取人耳的整体特征，揭示了人耳图像的本质特征，主要有主成分分析（PCA）、独立分量分析（ICA）等，这些方法是线性方法，忽略了人耳图像边缘像素间的非线性关系，在人耳识别中应用范围受限[7-8]。核主元分析法（KPCA）是一种非线性的代数特征提取方法，其性能受核参数的影响很大[9]。局部线性嵌入（LLE）算法是一种流行的学习方法，实现了高维输入数据点映射到一个全局低维坐标系，同时保留了邻接点之间的空间关系，在人耳识别中得到了广泛的应用[10-11]。但是经典LLE算法对姿态变化比较敏感，且近邻点选择十分关键[12]。Gabor小波核函数能够很好地描述哺乳动物初级视觉系统中一对简单视觉神经元的感受特性，与傅里叶变换相比，Gabor小波变换具有良好的时频局部化特性，对光照变化不敏感，且能容忍一定程度的图像旋转和变形[13]。

为了提高多姿态人耳识别率，本文针对LLE算法对光照变化敏感和近邻点选择十分敏感的不足，利用Gabor小波优点，提出了一种融合Gabor小波和改进LLE（Improved LLE，ILLE）的人耳识别算法（Gabor-ILLE），并在USTB3人耳图像库上进行仿真实验，测试Gabor-ILLE方法的人耳识别效果。

1 人耳识别的流程

Gabor-ILLE人耳识别算法的流程如图1所示。首先通过特征融合有效消除特征之间的冗余信息，降低特征维数，同时不会丢失有效的人耳识别特征，然后采用K近邻算法建立分类器，最后输出人耳识别结果。

图1 Gabor-LLE人耳识别算法的工作流程

2 Gabor小波及特征提取

Gabor小波变换是一种加高斯窗的傅里叶变换，它由一组不同尺度、不同方向的滤波器组成，二维Gabor小波核函数定义为：

选用的是5个尺度、8个方向的Gabor滤波器组。将输入图像 I(x，y)，并与滤波器组的各个滤波器进行卷积，并取其幅值作为输出，即

每一幅人耳图像经过Gabor变换后，可以得到40个对应不同尺度与方向的图像，具体如图2所示。

图2 人耳图像的Gabor幅值表示

原始Gabor特征维数相当高，特征之间存在大量冗余，影响人耳识别的实时性和正确率，为此，本文将相同尺度上多个方向的Gabor特征进行融合，降低Gabor特征维数，消除冗余特征，并且保证不丢有效的人耳识别特征。

根据式（3）和式（4）的特征融合规则将每个像素点不同方向相同尺度的Gabor特征编码成化为二进制，表示为：

式中，Re(Gu，v(z))表示 Gabor特征的实部；Im(Gu，v(z))表示Gabor特征的虚部。

对于每一个尺度的Gabor方向特征，通过式（5）和式（6）计算其十进制编码和融合，得到每一幅人耳图像转化成5个尺度上的融合特征，保留了每个像素点所对应的40个Gabor滤波器的图像。

3 改进局部线性嵌入（ILLE）算法

经过上述特征融合规则提取的人耳图像特征维数相当高，因此，本文引入改进LLE算法进行降维。

对于LLE算法，需要预先设定近邻个数K，但当前K选择没有统一方法，而是人为初始化K的值，然后不断调整K值比较效果才能得到最优值，耗时比较多，影响了人耳识别的效率。为了获得最优的K值，提出了分级求出K值方法。

在经典LLE算法中，通过局部重建权值矩阵W是来评估输入输出映射优劣，即通过学习了解剩余方差找到最优K值。由于剩余方差值越低，高维数据嵌入到低维的效果越好。因此最优K值的目标函数被定义为：

式中，G(xi，xk)为 xi，xj两点间的测地线距离，本文采用Dijkstra算法测量距离。

为了达到缩小分布较稀疏的区域的样本点间的距离，增大分布较密集区域样本点间的距离的目的，提出了平均距离 M(i)，M(j)分别表示 xi(i=1，2，…，n)，xj(j= 1，2，…，n)和区域其他点之间的距离的平均值。

从式（7）可以看出最优 K值受到 EY的影响，而EY是基于维数D的改变，因此采用迭代算法先确定D的范围通过分级算法求出K值。分级求出K值的方法可以描述为：

（1）选择dmax（d的最大可能值），确定d的取值范围为 0～dmax，进行迭代。

（2）初始化d值，选择 Kmax（Kopt的最大可能值）。

（3）根据公式（3）计算相对应于 k(K∈[1，Kmax])的重构误差ε。

（4）找出所有极小的ε(K)和响应的K值，并将这些K值组成一个原始集合S。

（5）对于每一个K∈S，运行LLE并计算剩余方差。

（6）根据公式（7）选择 Kopt，重复（2），迭代结束，将一系列Kopt组成集合S1。

（7）根据冒泡算法确定最小Kopt，得到所求的最优K。

4 人耳分类算法

K近邻算法（KNN）是一种非常重要的非参数模式识别方法，它首先选择未知样本x的K个近邻，然后将x归属于K个近邻中多数属于的那一类。设待识别的网络安全状态 x的 K个近邻分别为 x1，x2，…，xk，那么KNN的分类判别函数为：

式中，di(x)为wi类的判别函数。

5 仿真实验

5.1 人耳图像库

数据来源于北京科技大学的USTB3人耳库，该库总共包含79个人，每人10幅图像，定义右耳正对着摄像机时为0°。从0°开始，头部依次向左偏转 5°、10°、15°、20°，每种角度拍摄两张包含完整人头的侧面图像[14]。为了降低头发、光照等因素的影响，需要对人耳库的所有图像进行预处理，首先手工剪切原始图像，只留下人耳部分，然后进行直方图均衡处理，最后将其归一化为100像素×150像素大小，部分人耳如图3所示。在Core2 Intel 3.0 GHz CPU，RAM 4.0 GB，Windows 7平台上，利用Matlab 2012实现仿真实验。

5.2 结果与分析

5.2.1 与传统Gabor特征提取算法的性能对比

图3 某一个人的10幅人耳图像

对于不同的人耳子集，改进Gabor算法和Gabor传统算法的人耳识别的平均识别率如图4所示。从图4可知，相对于传统Gabor特征提取算法，改进Gabor算法的人耳平均识别率得以提高，对比结果表明，本文对Gabor算法进行改进是有效的，提取的特征可以更加准确描述人耳类别信息，获得了更加理想的人耳识别结果。

图4 与传统Gabor算法的性能对比

5.2.2 与传统LLE算法性能对比

每人选取 0°的图像用于训练，分别选取 5°、10°、15°、20°人耳图像进行测试，随机选取3幅图像为测试样本，选取类别数m为3，随着特征维数变化，所有算法的人耳识别率变化曲线如图5所示。

对图5进行分析可知，Gabor-ILLE算法性能最优，可以得到如下结论：

（1）在每种角度下，Gabor-LLELLE和Gabor-ILLE受嵌入维数d的影响，人耳识别率基本上随着d的增加，特征维数随之增加，降维之后的结果能保留更多的原有信息，提供了更多的人耳类别信息，分类识别的结果也就更准确，可以降低偏转角度对人耳识别的影响。

（2）在嵌入维数d取值一定的情况下，Gabor-ILLE能够获得比Gabor-LLE更高的识别率，这是因为Gabor-ILLE算法采用分级方法求出K值，能够更好地对数据进行降维，消除特征之间冗余，选择对识别结果比较重要的特征。

（3）在偏转角度 θ=5°时，Gabor-LLE和Gabor-ILLE算法均可以获得较高的人耳识别率，识别率都大于90%，当偏转角度θ=20°时，识别率大部分低于80%，即随着偏转角度的增大，算法识别率逐渐下降，这主要是随着旋转角度增加后，人耳信息量减少，提取有效的人耳特征越少，特征难以正确描述人耳类信息，导致人耳识别率低。

图5 不同角度的人耳识别结果

表1 几种特征降维的识别性能比较

5.2.3 与其他特征降维算法的性能对比

为了测试本文ILLE算法的优越性，选择PCA、LDA进行对比实验，所有算法均进行10次实验，取平均值作为最终结果。不同角度人耳的平均识别率见表1。

对表1的结果进行分析，可以得到如下结论：

（1）在每种角度下，Gabor-ILLE算法都要高于Gabor-PCA、Gabor-LDA算法的识别率，主要是由于PCA、LDA是线性的方法，而并不适用于非线性数据，而LLE算法基于拓扑学的非线性方法，从人类认知角度出发，通过研究高维数据集的内在几何结构，发现其内在几何规律，能够更好地解决数据的非线性问题，因此获得更加理想的人耳识别结果。

（2）对于不同角度的人耳，Gabor-ILLE的最优特征维数要略低于PCA、LDA，这主要是由于LLE可以找到对人耳识别结果更重要的特征，用更少的特征获得更优的识别结果，而且减少了计算量，提高了人耳识别效率。

5.2.4 识别速度比较

识别速度对于人耳识别的实时性十分重要，采用时间作为人耳识别速度评价标准，利用Matlab 2012的tic和toc命令记录每一种算法对USTB3人耳图像库的平均训练和识别时间，结果见表2。从表2可知，相对于对比算法，Gabor-ILLE算法的运行时间最短，识别速度最快，识别效率最高，这主要因为Gabor-ILLE算法可以找到更优的人耳图像特征，有效降低了特征维数，消除了其中大量的无用、冗余特征，可以较好满足人耳识别的实时性要求。

表2 不同算法的识别时间比较 s

6 结束语

本文针对姿态变化和近邻点选取对LLE算法进行图像识别的不利影响，提出了一种基于Gabor-ILLE人耳图像识别算法，实验结果表明，Gabor-ILLE算法不仅可以有效地降低高维数据的维数，同时减小LLE算法受姿态变化和近邻点选取的影响，提高了人耳识别率。

致谢感谢北京科技大学信息工程学院提供的人耳图像库，使本研究得以顺利进行。

[1]Yan Ping，Bowyer K W．Empirical evaluation of advanced ear biometrics[C]//Proc of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition，2005，3：41-50.

[2]Chang K，Bowyer K W，Sarkar S，et al.Comparison and combination of ear and face images in appearance-based biometrics[J].JEEE Trans on Pattern Anal Mach Intel，2003，25（9）：1160-1167.

[3]Burge M，Burge W.Ear biometrics in computer vision[C]// Proceedings of the 15th International Conference on Pattern Recognition，2000，2：822-826.

[4]封筠，梁晓霞，穆志纯.梯度方向直方图特征的人耳身份识别方法[J].南京大学学报：自然科学版，2012（4）：452-458.

[5]袁立，穆志纯，徐正光，等.基于人耳生物特征的身份识别[J].模式识别与人工智能，2005，18（3）：310-315.

[6]Hurley D J，Nixon M S，Carter J N.Force field feature extraction for ear biometrics[J].Computer Vision and Image Understanding，2005，98（3）：491-512.

[7]王晓云，郭金玉.基于局部信息统计的人耳识别方法[J].计算机工程与应用，2012，48（9）：141-144.

[8]Victor B，Bowyer K，Sarkar S.An evaluation of face and ear biometrics[C]//Proceedings of the IEEE 16th International Conference on Pattern Recognition，2002：429-432.

[9]Vural E，Frossard P.Learning pattern transformation manifolds for classification[C]//2012 19th IEEE International Conference on Image Processing，2012：1165-1168.

[10]谢朝霞，穆志纯，谢建军.基于LLE的多姿态人耳识别[J].智能系统学报，2008，3（4）：321-327.

[11]Yang P，Shan S G，Gao W，et al.Face recognition using Ada Boosted Gabor features[C]//Proceedings of the 6th IEEE International Conference on Automatic Face and Gesture Recognition.Seoul：IEEE Computer Society Press，2004：356-361.

[12]刘嘉敏，周晓莉，朱晟君，等.基于LLE及其改进算法的人耳识别[J].光电工程，2012，39（12）：132-137.

[13]雷松泽，齐敏，王毅，等.结合Gabor小波和监督保局投影的人耳识别[J].计算机辅助设计与图形学学报，2010，22（8）：1260-1267.

[14]袁立.人耳识别中若干关键问题的研究[D].北京：北京科技大学，2006.

LEI Junhuan

School of Software,Changsha Social Work College,Changsha 410004,China

LLE algorithm is very sensitive to the change of attitude and neighbor points,a novel ear recognition algorithm（Gabor-ILLE）based on Gabor wavelet and improved LLE algorithm is proposed in this paper.The ear features are extracted by Gabor transform,and then the improved LLE is used to reduce dimensionality of features and select the optimal Gabor features of ear recognition,KNN is used to establish the classifier of human ear recognition,and the simulation experiment is carried out on USTB3 ear images.Compared with the reference methods,the proposed algorithm has obtained higher ear recognition rate,and the experimental results verify the effectiveness of the Gabor-ILLE algorithm.

ear recognition;locally linear embedding;Gabor wavelets;features extraction

针对LLE算法对姿态变化和近邻点敏感的缺陷，提了一种融合Gabor小波和改进LLE算法的人耳识别算法（Gabor-ILLE）。该算法通过Gabor变换提取人耳特征，并对Gabor初始特征融合，采用改进LLE对特征进行降维，选择最有利于人耳识别的Gabor特征，采用K近邻算法建立人耳分类器实现人耳识别，并采用USTB3人耳图像库进行仿真实验。相对于参比人耳算法，Gabor-ILLE获得了更高的人耳识别率，实验结果验证了Gabor-ILLE算法的有效性。

人耳识别；局部线性嵌入；Gabor小波；特征提取

TPP317

10.3778/j.issn.1002-8331.1403-0189

LEI Junhuan.Multi-pose ear recognition based on Gabor wavelet and improved locally linear embedding algorithm.Computer Engineering and Applications,2014,50（23）：163-166.

雷军环（1967—），女，教授，研究方向：计算机网络与软件工程。E-mail：leijunhuan88@163.com

2014-03-14

2014-05-16

1002-8331（2014）23-0163-04

CNKI网络优先出版：2014-08-15,http://www.cnki.net/kcms/doi/10.3778/j.issn.1002-8331.1403-0189.html