人脸识别技术研究(毕业论文) - 图文 联系客服

发布时间 : 星期一 文章人脸识别技术研究(毕业论文) - 图文更新完毕开始阅读

第3章 基于独立分量分析的人脸识别方法

3.1引言

独立分量分析(Independent Component Analysis,ICA) 是近年才发展起来的一种基

于统计理论的信号处理技术,该方法的目的是将观察到的数据进行线性变换,使其分解成统计独立的分量。CIA与PCA同属于基于子空间的特征提取方法,即用低维的子空间参数描述高维的数据特征。在PCA中,首先考虑的是如何保留信号的最大能量,在最小均方误差的准则下重构数据,并且要求主分量两两正交。而ICA的基本思想是用基函数来表示一个随机变量集合,其基向量是统计独立的,或者尽可能的独立。ICA的概念可以看为是PCA的一种扩展。目前ICA主要应用于特征提取[43]、盲源信号分离[44]、语音信号分析[45]、图像处理[46]和人脸识别[47]等。

特征脸法应用用传统的PCA方法提取人脸特征,该方法只能考虑图像数据间的二阶统计特性,未能利用高阶统计信息,同时要求提取的人脸特征两两正交。与PCA不同,基于ICA的特征提取方法得到的独立图像基,能够反映像素间的高阶统计特性,并且不要求向量基两两正交。在人脸识别中,重要的人脸信息一般存在于象素间的高阶统计信息中,所以ICA可以看作是值得期待的人脸特征提取方法。

本章首先简要介绍了ICA的理论基础,包括ICA的起源和ICA的线性模型;然后介绍了基于ICA人脸识别方法,以及独立元的选择和改进的ICA快速算法;最后分析基于ICA人脸识别的实验结果。

3.2独立分量分析的理论基础

独立分量分析作为一种新的多维信号处理方法,主要用于揭示和提取多维统计信号中的潜在成分,是在具有较长研究历史的盲源分离问题(Blind Source Separation,BSS)[36]中涌现出的新的信号分析技术,二者联系紧密。ICA与传统的多维信号分析方法截然不同的是,经ICA处理得到的各个分量不仅去除了相关性,还是相互统计独立的,并且是非高斯分布的。ICA在许多方面对传统方法的重要突破使得其越来越成为信号处理中一个极具潜力的分析工具。

3.2.1独立分量分析与盲源分离

ICA源于盲源分离问题的解决,该问题是信号处理中一个传统而又极具挑战性的课题。盲源分离是指仅从观测的混合信号(通常是多个传感器的输出)中恢复独立的源信号,这里的“盲”是有两层含义:其一是指源信号是不可观测的;其二指混合系统是事先未

23

知的。在科学研究和工程应用中,很大观测信号都可以假设成是不可见的源信号的混合。所谓的“鸡尾酒会”问题(cocktail Party Problem)就是一个典型的例子,简单来说就是当很多人(作为不同的源信号)同时在一个房间里说话时,声音信号由一组麦克风记录下来,这样每个麦克风记录的信号是所有人声音的一个混合,也就是我们所说的观测信号。接下来的问题是:如何从这组观测信号中提取每个说话者的声音信号,即源信号。由于输入输出两端的连接权值是未知的,所以属于盲源分离的范畴。如果这些连接权值是己知的,或者说混合矩阵是已知的,则上面的问题就退化成简单的求逆过程,即求混合矩阵的逆矩阵。但是在更多的情况下,我们无法获取混合系统的先验知识,这就要求我们从观测信号来推断这个混合矩阵,实现盲源分离。

ICA技术正是为了解决盲源分离问题而不断发展起来的,并成为阵列信号处理和数据分析中的有力工具。将ICA应用在盲源分离中,能够从混合信号中重现不可观测的源信号成分,所利用的仅仅是假设源信号统计独立这样一个容易满足的先验条件。与传统的基于二阶统计特性的方法(比如PCA等)相比,ICA不仅可以去除各分量之间的一、二阶相关性,同时还具有发掘并去除数据间的高阶相关信息的能力,使得输出分量相互独立。

目前ICA在诸如语音识别、通信、生物医学信号处理等很多领域都得到了极大的重视。针对人脸识别中的人脸图像样本和人脸特征向量之间的关系,符合盲源分离中的观测向量和源信号间的关系,本文尝试将其应用到人脸识别的特征提取中,取得了良好的实验结果。

3.2.2独立分量分析的线性模型

ICA的起始点基于一个非常简单的假设,假设存在N个相互独立的源信号,写成矩阵形式为S=(s1,s2,?,sN)T,独立表示有下式成立:

(3-1)

以及N个观测信号,表示成矩阵形式为X=(x1,x2,?,xN)T。同时假设观测信号是由源信号线性混合而成。

写出矩阵形式就是:

(3-2)

(3-3)

其中A为称为混合矩阵,由混合系数组成。对照式(3-2),矩阵A的每个行向量中的N个元素作为N个源信号的加权系数对源信号进行混合,即得到对应的一个观测信号。

24

ICA的基本目标就是寻找一个线性变换W,称之为分离矩阵。该矩阵使得观测信号X经过线性变换后,输出信号Y=(y1,y2,?,yN)T向量间尽可能的相互独立,表示成矩阵形式就是:

(3-4)

输出Y就是源信号S的一个估计,上述的ICA模型如图3-1所示。

图3-1 ICA模型的原理图

但是从盲源分离的观点看,Y中各个分量与S相比存在次序的不同以及对应分量幅度相差一个常数项的可能,这称之为ICA问题的不确定性,造成这种不确定性的原因是由于没有关于独立源的先验知识。在线性变换中,为了便于说明其原理,均假设变换前后数据维数相等。在实际应用中,当观测信号维数m大于源信号维数n时,总可以通过降维的方法使得m=n,所以这种假设不失一般性。

ICA、PCA和SVD均属于线性变换技术,但是后两者只能按能量大小对数据进行分解,消除数据之间的二阶相关性,而ICA能够消除输入数据之间的高阶相关性。在图像中,可以提取的特征很多,特征之间存在相关性,并且重要特征一般隐藏在高阶统计特性中,因此使用ICA方法能够约减特征维数,并且使特征保持高阶相互独立,而不像PCA和SVD只能消除二阶相关性。

3.3基于独立分量分析的人脸识别方法

一般情况下,人脸识别过程可以分三步完成:预处理、特征提取和分类识别。基于ICA的人脸识别方法也不例外。ICA涉及的预处理的方法除了传统的几何归一化,灰度归一化外,还有中心化和白化的过程,本节将主要阐述这两种预处理方法。将工以应用到人脸的特征提取中,则ICA问题可以描述如下:观测的数据矢量就是人脸的训练样本,令xi为一个人脸图像样本,则由n个训练图像构成训练集X=(sl,x2,?,xN)T是相同数目的独立源信号S=(s1,s2,?,sN)T经过混合矩阵A线性混合而成,如式(3-3)。

在人脸识别中,ICA的研究目的是从仅有的观测数据(人脸图像)X出发寻找一个分离矩阵W,使得Y=WX的各个分量统计独立。图3-2给出了人脸图像CIA的原理图,X中的人脸图片被认为是S中统计独立源的线性组合,A是未知的混合矩阵,W是ICA算法估计得到的分离矩阵,Y就是ICA提取的人脸特征空间。

25

图3-2 人脸图像的ICA原理图

在获得ICA人脸特征空间Y后,就可以给出人脸的特征表示,如图3-3,其中(b1,b2,?,bN)为ICA系数,即用人脸在特征空间Y上的投影来表示人脸。

图3-3 人脸图像的ICA特征表示

3.3.1人脸图像的预处理

将ICA应用于人脸识别,随机向量即待训练的人脸图像。矩阵运算中,每幅人脸图像就是一个行向量,行向量的维数为其包含的像点数。在对图像进行ICA前,必须对图像进行预处理。

最基本的预处理是将X减去其均值,得到均值为零的X,如下式:

(3-5)

此过程称为中心化,仅仅为了简化运算。在估计出混合矩阵A后,中心化得到的源信号S可以重新获得它的均值

(3-6)

在应用ICA之前,还有一个重要的预处理就是将观测数据白化。所谓白化,是指各分量间互不相关,且每个分量的能量是归一化的,即

(3-7)

(3-8)

根据统计独立的概念,不相关是独立的必要条件,而不是一个充分条件。源信号就是白化信号,对于独立的源信号S=(sl,s2,?,sN)T,各分量必然是不相关的,所以有:

(3-9)

因为在ICA的输出结果中,被提取出分量的幅度具有不确定性,某个分量s1乘上一个系数所产生的作用,只需让混合矩阵A对应的列向量a1除以一个相同的数就可抵消。所以简单起见,不妨假设独立源的能量是归一的。

(3-10)

26