人脸识别技术研究(毕业论文) - 图文

发布时间 : 星期日 文章人脸识别技术研究(毕业论文) - 图文更新完毕开始阅读

的人脸识别方法,并尝试新的特征提取和分类方法。

1.4人脸识别测试数据库

人脸识别是近年来研究的热点,各国研究人员提出了各种新的识别算法,为测试和比较各种识别技术的优缺点及其识别率的高低,世界各研究机构都建立了各自的人脸测试和测评数据库,下面介绍一些著名的标准数据库。

1. 英国ORL(O一Olivertti Research Laboratory)人脸数据库

ORL人脸图像库是由英国剑桥011vetti实验室从1992年4月到1994年4月期间拍摄的一系列人脸图像组成,共有40个不同年龄、不同性别和不同种族的对象。每个对象10幅图像共计400幅灰度图像组成,图像尺寸为92xlZl,图像背景为黑色。其中人脸部分表情和细节均有变化,例如笑与不笑,眼睛睁着或闭着,戴或不戴眼镜等,人脸姿态也有变化,其深度旋转和平面旋转可达20度,人脸的尺寸也有最多10%的变化。该库是目前使用最广泛的标准数据库,它含有大量的比较结果。 2. 英国Manchester人脸数据库

该数据库由30人的690幅图像组成,图像有不同的光照和背景特征,而且对于每个人而言,前后两张照片之间的时间间隔至少为3周。训练集对光源有一定的约束。虽然Manchester人脸数据库远比ORL数据库全面,但因发表的比较结果不够多,从而远不如ORL数据库使用广泛。 3. Yale耶鲁人脸库

该数据库包括15人每个人11幅正视图,每幅图像具有不同的面部表情、有或者无眼镜,这些图像在不同光照条件下拍摄。该库的特点就是光照变化显著,且有面部部分遮掩。

4. 欧洲M2VTS多模型数据库

该库是用来作为多模型输入的通路控制实验,它包括37个人的序列人脸图像。每人的5幅图像间隔一个星期,每个图像序列包括从右侧轮廓(-90度)到左侧轮廓(90度)之间的图像,而且拍摄时每个人用他们的母语从一到九数数。该库主要用于测试多模式身份识别。

5. 美国FERET(Face Recognition Technology)人脸数据库

FERET人脸数据库是目前最大的人脸数据库,由美国军方研究实验室提供,其中每人的图像数目不等,有些人提供了更多不同视点和不同表情的照片。该数据库中不包含戴眼镜的照片,拍摄条件也有一定的限制。人脸大小约束在规定范围内。1996年6月,该数据库己存储了1199个人的14126幅图像,而且逐年增加。但到目前为止,该数据库并未提供运动图像系列或包含语言信息。FERTE数据库的最大缺点是非美研究机构的获取不便。

其他数据库还有CMU(Carnegie Mellon University)正面人脸数据库,MIT单人脸

11

数据库等。不同的人脸数据库,图像的质量和内容也是不同的,为了客观的、全面的测试人脸识别方法的性能,考虑不同因素对识别方法的影响,本文的人脸识别方法主要应用了ORL、Manchester、Yale和部分FERET人脸数据库进行测试。

1.5本文的主要内容

本文主要研究基于静止图像的正面人脸识别技术,方法包括基于主分量分析的人脸识别方法、基于独立分量分析的人脸识别方法和基于隐马尔可夫模型的人脸识别方法。在分析人脸识别方法理论基础的同时,针对其中的特征提取与分类识别的关键环节进行了改进,提高了识别性能。

12

第2章 基于主分量分析的人脸识别方法

2.1引言

早期的人脸识别方法主要是基于几何特征的方法和基于模板匹配的方法。基于主分量分析(Pr1neipal Components Analysis,PCA)的人脸识别方法是首次将人脸看作一个整体,特征提取由手工定义到利用统计学习自动获取特征,是人脸识别方法上的一个重要转变。在该方法的发展过程中,sirovich和Kirby首先将K一L变换(Karhunen一Loeve Transfer)用于人脸图像的最优表示[33],Turk和Pentland进一步提出了“特征脸”(Eigenfaces)这个概念,该方法又被称为“特征脸法”[34]。

特征脸法是将整个人脸的图像区域看作一随机向量,通过CPA获取正交向量基的方法。其中对应较大特征值的向量基具有与人脸相似的形状,所以被称为特征脸,如图2-1。

图2-1 FERET人脸库中提取的特征脸示例

利用这些向量基的线性组合可以描述、表达和逼近人脸图像,因此可以进行人脸的识别与合成。识别过程就是将人脸图像映射到由特征脸张成的子空间上,比较其与己知人脸在特征脸空间中的位置,完成分类识别的。PAC至今仍是传统的人脸特征提取方法。 本章首先以多维数据的统计变换的概念引出主分量分析的基本理论和主要特点;其次介绍基于CPA的人脸特征提取方法和人脸识别方法:最后从理论分析结合实验结果论述基于PCA的人脸识别方法存在不足。

2.2主分量分析的理论基础

人脸图像原始特征的数量很大,或者说样本处于一个高维空间中,通过映射(或变换)的方法可以用低维空间来表示样本,这个过程称为特征提取。如果不对特征进行选择而直接进行分类器设计,无论从计算的复杂程度还是分类器性能来看都是不适宜的。因此研究如何将高维数据空间压缩到低维特征空间以便有效的识别分类便成为一个重要的课题。特征的选择和提取的基本任务是从样本的许多特征中找出那些最有效的特征,所以它满足以下两条原则:

a.尽可能的去除人脸图像中的相关性,降低人脸表示的维数,减少数据计算量;

13

b.抽取人脸最本质的,最能表现不同人脸间差异的特征,以提高识别率。映射后的特征称为二次特征,它们是原始特征的某种组合(通常是线性组合)。所谓特征提取在广义上就是一种变换。

2.2.1多维统计数据的线性变换

在科学研究的众多研究领域,一个普遍存在的问题是如何从采集的数据中获取信息。随着科技的高速发展,大量数据的测量及存储已经不再成为问题,但是获取数据本身所含的信息是不够的,提取产生这些数据的系统的固有的信息才是根本目的所在。在诸如数据分析、信号处理、神经网络等应用领域,找到多维数据的一个恰当的描述是经常会遇到的问题。为了使问题尽可能的简单化以及考虑到计算的复杂性,最好使得这种描述是一个对原始数据的线性变换,因为这会对各种形式的后继分类带来极大的方便,如数据压缩、特征提取、模式识别等。

在多维信号处理中,为了便于研究,通常把采集得到的数据(如一系列人脸图像)看作多维随机信号的一系列样本值,以便于将随机矢量的数值统计方法[36][37]应用到原数据。这样做虽然忽略了信号的时间特性,但是可以尽可能的利用其统计特性。假设所有分量都是零均值的,即有E{x}=0,如果不满足此条件,通过减去其均值可以很容易获得。

对多维信号x=(x1,x2,?,xn)T的某一观测样本矢量,其中x1,i=l,2,?,n为各个分量,按照某种规则对其做线性变换,记为T:Rn→Rm,

Y=Tx (2-1) y=(y1,y2,?,ym)T为变换后的结果。假设这里T是一个线性变换,于是y中的每个分量都是原数据所有分量的线性组合:

(2-2) 对应每个yi的一组系数wij,j=1,2,?,n称为一个基向量,式(2-2)写出矩阵形式为: Y=Wx (2-3) 所以多维数据的线性变换就是按照一定的准则寻找一系列的加权系数玛组成线性变换矩阵砰中的各个基向量(碎的行向量),而这m个基向量构成一个新的坐标系。将原数据在这样一个坐标系上展开,得到各个分量便是变换的结果。要求变换后的数据夕在最大程度上体现原数据间隐含的实质结构,并且y的各个分量尽可能的代表产生原数据的系统本身的物理机制。基于多维随机变量统计分析的框架,变换矩阵砰的寻找方法通常是建立在一个体现输出结果y的统计特性的目标函数g(y)的基础上。而这种统计特性因算法中的基本准则不同而不同,可能是一阶、二阶的,如相关系数、协方差等;也可能是高阶的,如互信息、非高斯性等,这样随之产生了不同的线性变换技术,如主分量分析(PCA)、奇异值分解(SVD)、投影法(Projection Pursuit)等[38]。简而言之,所有的

14

联系合同范文客服:xxxxx#qq.com(#替换为@)