首页>论文>正文
日期
09/14
2006
咨询
  • QQ扫一扫

  • Vision小助手
    (CMVU)

基于核独立成分分析的人脸自动识别方法研究
收藏
2006-09-14 10:06:07来源: 刘小双

摘要:提出了一种独立成分分析(ICA)和核方法相结合的人脸自动识别方法,将原始人脸图像通过某种非线性变换将输入空间映射到一个高维特征空间,然后在高维特征空间进行独立成分分析,提取非线性独立成分作为特征向量进行分类识别,试验结果表明该方法性能优于PCA、KPCA、ICA。

关键词:人脸识别;主成分分析;独立成分分析;核方法

1.引言

计算机人脸识别技术也就是利用计算机分析人脸图像,进而从中提取出有效的识别信息,用来“辨认”身份的一门技术。人脸识别技术应用背景广泛,可用于公安系统的罪犯身份识别、驾驶执照及护照等与实际持证人的核对、银行及海关的监控系统及自动门卫系统等。虽然人类的人脸识别能力很强,能够记住并辨别上千个不同人脸,可是计算机则困难多了。其表现在:人脸表情丰富;人脸随年龄增长而变化;人脸所成图像受光照、成像角度及成像距离等影响。另外,人脸识别还涉及到图像处理、计算机视觉、模式识别以及神经网络等学科,也和人脑的认识程度紧密相关。这诸多因素使得人脸识别成为一项极富挑战性的课题,因此,人脸识别中所选取的特征必须对上述因素具备一定的稳定性和不变性。

2.ICA模型及其定义

2.1.ICA的模型
ICA是一种信号处理统计方法[1][2],该方法是主成分分析(PCA)方法的一般化。它的实质是寻求一种线性变换,使得输出的分量之间是统计独立的或者尽可能的独立。它不仅考虑了信号的二阶统计特性还考虑了高阶统计特性。人脸识别问题中许多重要信息包含在图像信号的高阶统计量中。经ICA方法处理后的人脸图像信号互相独立,利用这些独立的影像基构成一个子空间,然后利用待识别人脸图像在这个子空间上的投影系数进行人脸识别。而文献[3]表明ICA方法的识别率明显优于PCA方法,这是由于与PCA相比,ICA有如下几个优点:1)ICA是利用训练信号里的高阶统计量的信息,而PCA则只对二阶统计量去除相关性;2)ICA基向量比PCA基向量在空间上更局部化,而局部特征对人脸表示很重要。
ICA的基本思想是:用一组基向量来表示一系列观测到的随机变量,而假设基向量之间是统计独立的或者尽可能独立的。ICA最简单的形式是:给定 个可观察变量 ,假设它们为 个未知的独立成分 的线性组合 ,该独立成分相互间满足统计独立的假设且都具有零均值。用向量的形式表示: 表示可观察到的变量, 表示一组独立成分变量,则 和 之间的关系可用下式表示:

                                                       (1)

这里 是事先未知的满秩矩阵,称为混合矩阵或特征矩阵, 的各行代表特征信号; 则代表在观察数据中第 个特征的幅度。

2.2.ICA的算法
ICA算法[2]可分为两类:第一类,最大和最小化一些相关准则函数。这类算法的优点是对任何分布的独立成分都合适,但它们要求非常复杂的矩阵运算或张量运算。第二类,基于随机梯度方法的自适应方法。该类算法能保证收敛到一个相应的解,但其主要问题是收敛速度慢,且其收敛与否很大程度上依靠学习速率参数的正确选择。

 这里介绍一种非常简单、高效的定点递推算法[4],该算法是通过寻求观测变量的线性组合的四阶累积量(即Kurtosis)局部的极值点。本文引用了Hyvärinen的定点算法,该算法的基本思想是:独立成分中间的任何一个可视为Kurtosis的一个极值点。将零均值且已白化过的随机变量X投影到向量w,考虑到Kurtosis的最优化:

                           (2)

约束条件是:

                                 (3)

当 时,对于某些 , 的Kurtosis可取得局部最大或最小。为了确定独立成分,必须求 的Kurtosis关于 的梯度:

                   (4)

这里    , 为数据 的协方差。可以通过的Kuhn-Tucker条件和式,可得到:    

                 (5)

由上式可推得:                         (6)
这里 是拉格朗日因子, 可由下式的递推方法得到:

                     (7)
                            (8)

3.KICA算法

基于ICA的人脸识别方法在受到光照、姿态、角度和表情变化时,难以取得很好的效果,而基于核函数方法的KPCA的非线性方法在处理上述非线性问题时呈现了一定的优势。借鉴KPCA方法的思想[5],导出一种KICA的人脸识别算法。这里的KICA算法主要是针对人脸图像特征的提取,其计算可以归结为KPCA与ICA的求解,与Francis的方法[6]相比,计算的复杂性大大降低了。下面我们利用上节介绍的ICA算法导出用于人脸识别的KICA算法。

与KPCA算法一样,首先通过一个非线性函数将人脸图像向量X映射到一个高维特征空间Y中,即 .然后在高维特征空间中进行ICA变换。与上面的ICA算法一样,在高维特征空间中首先要对进行白化变化。此时的白化变换是要在高维特征空间中求解协方差矩阵的特征值和对应的特征向量。根据KPCA的算法容易实现,它们都可以通过KPCA算法得到。在KPCA算法中,通过求解特征方程: ,我们很容易得到特征向量: , 以及相对应特征向值 。
因此,在高维特征空间中的白化变换阵为

 
             (9)

这样,原来的样本在高维特征空间中经过白化变换后变为

 ,                      (10)

因为 均值为                              (11)

 ,                  (12)

所以

 
         
 
 
 

        
        
               (13)

从上面的式子容易看出, 的计算只涉及投影到高维空间中向量的计算,在高维空间中向量的计算并不涉及非线性映射 的具体形式,而只要计算两个函数的内积形式,即核函数

                            (14)

得到 后,再用固定点算法,就可以求出相应的分离矩阵 
   将每一个测试样本 ,其在特征空间的投影为 ,然后在KICA提取的特征向量上投影

 


               (15)

4.实验结果与分析

  本文采用的实验数据取自英国剑桥大学Olivetti研究所制作的ORL人脸数据库。该数据库由40个不同人、每人10副、共400副图像组成。其中有些图像拍摄于不同时期;人的脸部表情和脸部细节有着不同程度的变化,比如,笑或不笑,眼睛或睁或闭,戴着眼镜或不戴;人脸姿态也有相当程度的变化,深度旋转和平面旋转可达20°;人脸的的尺度也有相当程度的变化。每副原始图像有256个灰度级,大小为112×92。实验时我们选取每个人的前5副图像作为训练样本,其余的5副图像作为测试样本。为了降低计算的复杂性,先用双三次插值法将原始图像的分辨率从112×92降低为28×23以减少计算量,实验结果表明这样处理不会影响识别率。KICA中的核函数取为 ,分类时分别采用余弦分类器和最近邻分类器。在利用固定点算法求解分离矩阵时,整个实验一共进行了5次取平均,分别将所给的算法与PCA、ICA、以及KPCA方法的实验结果进行比较。表1列出了四种方法实验结果的比较:

从上表我们可以看出:利用ICA进行余弦分类识别率为91%,而PCA分别为81.5%。可见,ICA方法要明显优于PCA方法。同时利用KPCA、KICA进行余弦识别正确率分别为84%92%,显然核方法而也要优于传统的方法。

从上表我们可以看出:利用核函数 进行余弦识别时,当 时的识别率要明显高于 的情况,同时说明识别率对核函数参数的选择具有一定的敏感性。

5.结论

本文主要研究了基于核的非线性特征提取问题,通过核函数的使用达到提取象素高维相关性的目的。由于传统的PCA只利用二阶相关,而ICA利用了高阶统计信息。KICA时ICA的非线性推广,在非线性特征提取方面具有较好的性能;本文利用KICA在非线性特征提取上的优势,提出来一种新的人脸识别方法。该方法具有较高的识别率,基于ORL人脸库的试验结果也验证了其有效性,该方法在图像识别领域具有一定的前景。

参考文献:

[1] Hyvärinen A. Survey on independent component analysis[J]. Neural Computation, ,2:94-128. 1999
[2] A. Hyvärinen and E. Oja. Independent Component Analysis: Algorithms and Applications[J]. Neural Networks, 13(4-5):411-430, 2000.
[3] 刘直芳,游志胜,王运琼.基于PCA和ICA的人脸识别[J].激光技术,2004,28(1):78~81
[4]Aapo Hyvärinen,Erkki Oja.A fast Fixed-Point Algorithm for Independent Component Analysis[J].IEEE Trans on Neural Networks,10(3):626~634,1999
[5] 吴今培.基于核函数的主成分分析及应用[J].系统工程2005:23(2):117~120
[6] Yang M H.Face recognition using kernel methods[J].Advances in Neural Information Processing System.,14:215~220, 2002
[7] 边肇祺,张学工 模式识别[M] 北京:清华大学出版社 2000