基于Gabor小波与RBF神经网络的人脸识别新方法

作者：时间：2009-08-10来源：网络收藏

完成上述步骤之后，每人最多对应于3个隐层节点，整个RBF网络的结构随之确定。

本文引用地址：http://www.eepw.com.cn/article/157900.htm

3．2 RBF网络混合学习算法
网络学习就是通过调整连接权W(j，k)、隐层中心Ck和宽度σk，以减小输出误差。隐层参数Ck、σk的调整是非线性过程，学习速度较慢；而W(j，k)调整是线性过程，学习速度较快。因此，RBF网络的每一次训练分为两个层次进行。
3．2．1 连接权调整
设输出目标矩阵T∈Rsxn，其元素t(j，i)为0或为1，表示Pi是否属于j类，T每列有、且仅有一个元素为l，表示Pi所属类别。定义误差函数为：

y(j，i)表示Pi在输出层j节点的输出yj(Pi)，可通过线性最小二乘法求解最佳权值W*。
3．2．2 隐层中心及宽度调整
W固定，由(11)式采用梯度下降法，经推导可得Ck和σk的迭代计算公式为：

其中梯度矢量为：

式中η1、η2分别为隐层中心Ck和宽度σk的学习速率(η1，η2>O)，m为迭代次数。
σk的学习速率通常大于Ck的学习速率(选取η2=2η1)。但ηl或η2的选取一般只能通过试验分析确定。为此，本文从(13)式出发，提出了学习速率η2的估算方法。设σk(0)为高斯宽度的初值，经推导可得η2的估算公式如下：

式中a为常数项，用于控制学习速率大小。实验表明a=0．01可以较好的满足条件。

4 实验结果
试验选用0RL人脸数据库，共包括40个人的脸部图像，其中每人lO幅具有丰富的面部表情和姿态变化。在未对ORL人脸进行任何预处理的条件下，选取每人的前5幅图像共200幅进行训练，另外200幅用于识别。然后将训练与识别图像相互交换，再次进行实验，识别正确率取两次试验结果的均值。表1、表2、图4和表3“任选5幅”部分的实验都是基于上述方法。为了便于比较，对于表3的1至4行的识别率是从相应参考文献上引用过来，第5行即本文方法是作者根据本文提出的算法进行实验的结果，其中对于“任选3幅”是指第一次选取每人的前3幅图像共120幅进行训练，余下280幅用于识别，第二次再选取每人的后3幅图像共120幅进行训练，余下280幅用于识别，识别率取两次结果的平均；“任选5幅(1幅侧面)”是指每人参与训练的样本都含1幅侧面的图像，其它与“任选5幅”的相同。
首先对第二个类别细分判别规则进行了验证。表l列出了设置不同判别规则，两次试验所得RBF网络的隐层节点个数以及识别错误的图像数目。
表1可以看出，“正确归类规则”的设置比较合理，改变规则或者各个聚类不作细分，识别成功率较低。而且按照本文的聚类初始化方法，所得RBF网络的隐层节点数目很少。40个人的训练样本，只有少数几个人的特征矢量需要进行类别细分。所以，本文的初始化方法得到的网络结构非常简单，网络的学习训练和分类识别具有较高的效率，并具备优异的泛化能力。

从表1还能看出，采用前五幅图像和后五幅图像进行训练，后者识别成功率明显高于前者。其中两幅识别错误的人脸以及相应的训练样本，如图3所示。

图3中每行最后一幅为识别错误图像，前五幅为训练图像。可以看出，前五幅人脸之间的姿态变化较小，而测试人脸的姿态与训练样本差别较大。若采用前五幅图像训练将会使得RBF网络隐层神经元的聚类宽度偏小，造成这几个测试样本与本属同类的隐层聚类中心相对距离较远，神经元激活程度不够，从而导致分类识别错误。当采用不同姿态的人脸训练时，同类样本问的差异可以使得RBF网络的学习更加充分，有利于正确地分类识别。
通过实验，8个方向的滤波器若忽略其中任何一个方向，识别正确率都明显下降，说明对于多姿态人脸来说，各个方向的人脸Gabor特征都不可缺少。若使用全部40个滤波器运算量又太大，同时也不能获得更好的结果。限于篇幅，表2列出了全8个方向与部分频率组合的实验结果比较，从表2可以看出选取空间频率v∈{1，2}或v∈{0，1，2}均能获得最佳识别结果，故本文在2个空间频率v∈{l，2}和8个方向μ∈{0，…，7}上进行采样，形成16个Gabor滤波器。

图4表示对Gabor人脸采用小波分解和采样法进行降维处理的识别结果。由图4可知，小波分解方法明显优于采样法，本文特征提取方法的最佳维数在140维左右。

由表3可知，同样采用基于RBF神经网络的分类器：与方法l相比，基于Gabor小波的特征提取方法优于主分量分析(PCA)与Fisher线性鉴别变换(FLD)的组合；方法2采用高阶伪泽尔尼克不变矩表征人脸，需要运用椭圆模型对人脸进行精确的尺度校正和分割。方法3采用5个频率的40个Gabor滤波器，本文选用2个频率的16个滤波器，在识别速度和占用内存等方面具有显著优势。方法4采用自组织稀疏RAM的N―tuple神经网络分类器，对于小样本具有较好的泛化逼近能力，本文算法在相同试验条件下具有不相上下的识别率。

5 结论
实验表明Gabor小波对于人脸位置、图像亮度变化具备较好的适应能力，在基于二维图像的人脸识别方法中具有一定的优越性。同时，也注意到前人研究成果主要针对128×128的人脸图像，进一步的研究工作可以根据Gabor小波的构造原理，选取适用于较低分辨率图像(如64x64)的滤波器参数。由于滤波处理的计算复杂度为O(d2)，人脸识别速度可以提高4倍，则有望满足实时识别要求。
RBF神经网络具有结构简单、非线性逼近能力强、收敛速度快以及全局收敛等显著优点。本文采用的RBF神经网络初始化方法，充分利用了人脸特征矢量的相对分布信息，聚类初始化过程简单、快速，同时可以保证RBF神经网络结构极其简单，具有较好的泛化能力。本文提出的学习速率估算方法具有普遍性，使得RBF网络无需先验参数、具备自适应能力。而且神经网络是以并行方式处理信息，采用硬件实现能够达到较高速度，所以该研究成果具有广泛意义。