人脸识别技术研究(毕业论文) - 图文 联系客服

发布时间 : 星期二 文章人脸识别技术研究(毕业论文) - 图文更新完毕开始阅读

在人脸识别技术发展的几十年中,研究者们提出了多种多样的人脸识别方法,但大部分的人脸识别系统主要由三部分组成:图像预处理、特征提取和人脸的分类识别。一个完整的自动人脸识别系统还包括人脸检测定位和数据库的组织等模块,如图1-1。其中人脸检测和人脸识别是整个自动人脸识别系统中非常重要的两个技术环节,并且相对独立。下面分别介绍这两个环节。

图1-1人脸识别系统框图

人脸检测与定位

检测图像中是否有人脸,若有,将其从背景中分割出来,并确定其在图像中的位置。在某些可以控制拍摄条件的场合,如警察拍罪犯照片时将人脸限定在标尺内,此时人脸的定位很简单。证件照背景简单,定位也比较容易。在另一些情况下,人脸在图像中的位置预先是未知的,比如在复杂背景下拍摄的照片,这时人脸的检测与定位将受以下因素的影响:

1.人脸在图像中的位置、角度、不固定尺寸以及光照的影响; 2.发型、眼镜、胡须以及人脸的表情变化等; 3.图像中的噪声等。 特征提取与人脸识别

特征提取之前一般需要做几何归一化和灰度归一化的工作。前者是指根据人脸定位结果将图像中的人脸变化到同一位置和大小;后者是指对图像进行光照补偿等处理,以克服光照变化的影响,光照补偿能够一定程度的克服光照变化的影响而提高识别率。提取出待识别的人脸特征之后,即可进行特征匹配。这个过程是一对多或者一对一的匹配过程,前者是确定输入图像为图像库中的哪一个人(即人脸识别),后者是验证输入图像的人的身份是否属实(即人脸验证)。

以上两个环节的独立性很强。在许多特定场合下人脸的检测与定位相对比较容易,因此“特征提取与人脸识别环节”得到了更广泛和深入的研究。近几年随着人们越来越关心各种复杂的情形下的人脸自动识别系统以及多功能感知研究的兴起,人脸检测与定位才作为一个独立的模式识别问题得到了较多的重视。本文主要研究人脸的特征提取与分类识别的问题。

1.3.4主要的人脸识别方法

人脸识别技术作为模式识别领域的一个研究热点,每年都有许多相应的研究成果发表,并且涌现出各种各样的识别方法,可以说信息处理领域的各种新方法的研究和算法

7

的改进都尝试在人脸识别中得到应用。文献[25][26]对近十年来人脸识别领域取得的成果进行了总结。人脸识别方法的分类,根据研究角度的不同,可以有不同的分类方法,这是研究人脸识别方法首先遇到的问题。本文在深入研究国内外人脸识别技术的发展和研究成果的同时,将已有的不同的分类方法做一个比较,目的是希望能从不同角度认识人脸识别问题,在较全面的了解各种方法优缺点的基础上,给本文的人脸识别方法提供研究方向。

根据输入图像中人脸的角度,人脸识别技术可分为基于正面、侧面、倾斜人脸图像的人脸识别。由于实际情况的要求,对人脸正面模式的研究最多,这也是本文的研究内容。

根据图像来源的不同,人脸识别技术可分为两大类:静态人脸识别和动态人脸识别。静态人脸识别,即人脸来源为稳定的二维图像如照片。如果人脸的来源是一段视频图像,则人脸识别就属于动态人脸识别。在头部运动和表情变化状态下的人脸识别都可以看作动态人脸识别,如视频监视中的人脸识别。动态人脸识别具有更大的难度:首先,视频输出的图像质量较差:其次,背景较复杂,目前对动态人脸识别的研究还局限于简单背景,较少人物的情况,对静态人脸识别的研究比较多。本文的研究也是基于静止图像的。 根据人脸识别技术的发展历史,人脸识别方法大致可分为基于几何特征的人脸识别方法、基于模板匹配的人脸识别方法和基于模型的人脸识别方法。

a.基于几何特征的人脸识别方法

这是人脸识别技术发展中,应用最早的方法。该方法是通过提取人脸的几何特征,包括人脸部件的归一化的点间距离、比率以及人脸的一些特征点,如眼角、嘴角、鼻尖等部位所构成的二维拓扑结构进行识别的方法。所构造的几何特征既要清晰区分不同对象人脸的差异,又要对光照背景条件不敏感,常规的几何特征量很难满足这些要求。因此该方法识别效果不理想。

b.基于模板匹配的人脸识别方法

基于模板匹配的方法,主要是利用计算模板和图像灰度的自相关性来实现识别功能。一般基于人脸的全局特征,利用人脸模板和相关参数如灰度的相关性来进行检测和识别的。Berto在[27]中将基于几何模型的人脸识别方法和模板匹配进行了全面比较后,得出结论:前者具有识别速度快和内存要求小的优点,但在识别率上后者要优于前者。增加几何特征对于基于几何特征的人脸识别方法只能轻微的提高识别率,因为要提高几何特征的提取质量本身就十分困难,而且随着图像质量的下降和人脸遮挡的引入,基于几何特征的人脸识别效果会大幅下降。总之,认为模板匹配法要优于几何特征法。

c.基于模型的人脸识别方法

通过统计分析和匹配学习找出人脸和非人脸,以及不同人脸之间的联系。该方法包括特征脸法(Eigenface)、神经网络方法(NN)、隐马尔可夫模型方法(HMM)和支持向量机(SVM)等方法。和模板匹配的方法相比,基于模型方法的模板是通过样本学习获得,而非人为设定。所以该方法,从原理上更为先进合理,实验中也表现出更好的识别效果。

8

根据人脸表征方式(即特征提取)的不同,还可以将人脸识别技术分为三大类:基于几何特征的识别方法、基于代数特征的识别方法和基于连接机制的识别方法。

a.基于几何特征的人脸识别方法

该方法在上文中已有阐述,它将人脸用一个几何特征矢量表示,用模式识别中层次聚类的思想设计分类器达到识别目的。该方法的困难在于没有形成一个统一的、优秀的特征提取标准。由于人面部的模式千变万化,即使是同一个人的面部图像,由于时间、光照、摄影机角度等不同,也很难用一个统一的模式来表达,造成了特征提取的困难。不过,由于现在各种优秀特征提取算法(如动态模板、活动轮廓等)的提出,使得人脸的几何特征描述越来越充分。而且在表情分析方面,人脸的几何特征仍然是最有力的判据。

b.基于代数特征的人脸识别方法

这类识别法仍然是将人脸用特征矢量表示,只不过用的是代数特征矢量。该方法在实际应用中取得了一定的成功[28]。由于代数特征矢量(即人脸图像向各种人脸子空间的投影)具有一定的稳定性,识别系统对不同的倾斜角度,乃至不同的表情均有一定的鲁棒性。所以,也说明了这种方法对表情的描述不够充分,难以用于表情分析。

c.基于连接机制的人脸识别方法

这类识别法将人脸直接用灰度图(二维矩阵)表征,利用了神经网络(Neural Network,NN)的学习能力及分类能力[29][30]。这种方法的优势在于保存了人脸图像中的纹理信息及细微的形状信息,同时避免了较为复杂的特征提取工作。而且,由于图像被整体输入,符合格氏塔(Gestalt)心理学中对人类识别能力的解释。与前两种识别方法相比,基于连接机制的识别法具有以下明显不同:信息处理方式是并行而非串行;编码存储方式是分布式。但由于原始灰度图像数据量十分庞大,因此神经元数目通常很多,训练时间很长。另外,完全基于神经网络的识别法在现有的计算机系统(冯一诺伊曼结构)上也有其内在的局限性。神经网络虽然有较强的归纳能力,但当样本数目大量增加时,其性能可能会严重下降。

本文根据人脸表征方法与特征综合方式的不同,认为将人脸识别方法分为基于几何特征的方法、基于模板匹配的方法和基于统计学习的方法,比较合适。此分类方法即符合人脸识别技术发展的历史,又将人脸特征提取与分类识别有机的结合在一起。识别人脸主要依据那些在不同个体之间存在较大差异,而对于同一个人比较稳定的特征,具体的特征形式和综合方式(分类方式)的不同决定了识别方法的不同。图1-2列出了主要的人脸特征与综合方法。早期静态人脸识别方法研究较多的是基于几何特征的方法和基于模板匹配方法。目前,静止图像的人脸识别方法主要是基于样本通过统计学习识别人脸的方法,主要研究方向有:基于代数特征的识别方法,包括特征脸(Eigenface)方法[8]和隐马尔可夫模型(HMM)方法[31];基于连接机制的识别方法,包括一般的神经网络方法和弹性图匹配(Elastic Graph Matching)方法[32],以及以上方法的一些综合方法。基于统计学习的方法属于基于整体的研究方法,它主要考虑了模式的整体属性。因为基于整体的人脸识别不仅保留了人脸部件的拓扑关系,而且也保留了各部件本身的信息。文献[27]

9

认为基于整个人脸的分析要优于基于部件的分析,理由是前者保留了更多信息。对于基于整个人脸的识别而言,由于把整个人脸图像作为模式,那么光照、视角以及人脸尺寸会对人脸识别有很大的影响,因此如何能够有效的去掉这些干扰就尤为关键。神经网络的方法在人脸识别上有其独到的优势,即它避免了复杂的特征提取工作,可以通过学习的过程获得其它方法难以实现的关于人脸识别的规律和规则的隐性表达。但是NN方法通常需要将人脸作为一个一维向量输入,因此输入节点庞大,降维就显得尤为重要。根据文献[32]对于自组织神经网络方法的分析,认为可采用自组织神经网络的P个节点来表达原始的N个输入(P

图1-2 可以提取的各种人脸特征,图下方为各种特征的综合方式

通过对不同的人脸识别分类方法的总结,多视角的、全面的介绍了主要的人脸识别方法。从对人脸识别方法的分析中可以看出,每种方法各有其优缺点,因此一些学者倾向于将多种方法综合起来,或同时利用不同种类的特征,图1-2为人脸图像可以提取的特征以及可能的特征综合方法。

在对各种人脸识别方法进行理论分析后,本文主要研究基于统计学习的、整体的人脸识别方法,包括特征脸法、基于独立分量分析的人脸识别方法和基于隐马尔可夫模型

10