搜档网
当前位置:搜档网 › 基于matlab的人脸检测与识别技术研究毕业设计开题报告

基于matlab的人脸检测与识别技术研究毕业设计开题报告

毕业设计(论文)

开题报告

题目名称:基于matlab的人脸检测与识别技术研究院系名称:电子信息学院

班级:测控

学号:

学生姓名:

指导教师:

2014年2月

目录

目录............................................................................................................................... I 第一章选题背景.. (1)

第二章国内外的发展现状 (3)

2.1近年来国外的脸谱识别技术的发展 (3)

2.2近年来脸谱识别技术在国内的发展 (3)

第三章课题研究的意义 (5)

第四章课题研究的主要内容 (6)

五、课题研究的实现方法(即方案论证) (7)

5.1人脸的检测与定位 (7)

5.2人脸的识别算法 (8)

5.3特征提取算法 (9)

5.4算法的选择 (10)

六、设计难点 (12)

七、进程安排 (14)

参考文献 (15)

第一章选题背景

智能移动设备的迅速普及以及拍摄功能的不断提升,为面部识别技术创造出了众多全新的应用场景,并且正在赋予它新的生命。严格意义上讲,面部识别技术并不是一项十分新颖的技术,它的历史可以追溯到20世纪60年代。在安防领域,面部识别技术这几十年来已经有不少应用出现。不过这项技术在过去半个世纪的时间里一直没能大红大紫,普通民众对它的了解更多是来自好莱坞的电影——FBI和CIA 通过遍布全球各个角落的摄像头,利用先进的面部识别系统能够在很短的时间内锁定犯罪嫌疑人的位置。当然,这些更多只是艺术的夸张,在现实世界中,面部识别技术远远没有它在大银幕上那么酷。

多年来,面部识别技术的应用被“困”在了安防领域,难有突破。不过,随着最近几年互联网和IT公司的介入,这门技术正在迎来自己的“第二春”。

索尼在E3游戏大会上发布了面部识别软件SOEmote,它能够通过摄像头实时捕捉玩家的面部表情并且同时反馈到游戏角色的脸上;6月18日,Facebook以约6000万美元的价格完成了对以色列面部识别公司https://www.sodocs.net/doc/348995435.html,的收购。而此前,苹果和谷歌已经分别于2010年和2011年收购了面部识别技术公司Polar Rose和PittPatt。在中国,6月4日,网易开始对网易邮箱的人脸识别登陆系统进行公测;同期,盛大也发布了基于人脸识别技术的App“智能相册”。短短半年时间,国内外已经有多家IT互联网企业推出了有关面部识别技术的产品和服务。

面部识技术是基于人的脸部特征信息进行身份识别的一种生物识别技术。它先利用摄像头采集含有人脸的图像或视频,接着利用计算机图像处理技术从画面中提取人像特征点,利用生物统计学原理分析建模,即人脸特征模板。最后对被测者的面部图像进行特征分析,达到辨识身份的目的。

在经历了20世纪90年代的大爆发后,面部识别技术却在最近十几年间遇到了瓶颈:不仅是因为技术本身一直没有实质性的突破,更重要的是,由于仅仅局限在安防领域,因此一直没有革命性的产品问世。虽然近几年在民用市场上也开始能见到使用面部识别技术产品的身影,但是基本还是集中在门禁、考勤和监控系统,仍旧摆脱不了安全领域的束缚。唯一的创新来自于数码相机行业,2006年,尼康公司

率先将面部识别技术运用到了自己产品当中,使用面部识别技术的相机可以在拍摄时自动搜寻人脸并进行优先对焦。在尼康的引领下,面部识别技术也被其他厂商普遍采用,成为了数码相机的标配。

近年来互联网的飞速发展,为脸谱识别技术的快速发展提供了广阔的发展空间。互联网和IT技术行业正在日益改变着脸谱识别技术的发展方向。脸谱识别可以和网络结合,形成各种物联网技术。互联网巨头近两年的一系列对面部识别技术公司的收购,正在让面部识别技术重获新生。智能移动设备在过去几年当中的迅速普及为面部识别技术带来了新的机会,手机和电脑上像素愈来愈高的摄像头帮助面部识别技术在传统的安全服务之外,开拓出众多新的应用场景。

第二章国内外的发展现状

2.1近年来国外的脸谱识别技术的发展

当前很多国家展开了有关人脸识别的研究,主要有美国,欧洲国家,日本等,著名的研究机构有美国MIT的Media lab,AI lab,CMU的Human-Computer Interface Institute, Microsoft Research,英国的Department of Engineering in Uni versity of Cambridge等。

对于面部识别的研究始于20世纪60年代,不过在诞生的最初30年中,这项技术除了一些基础性的研究,始终没有重大的成果产生。20世纪90年代以后,随着计算机技术的迅速发展,面部识别技术终于迎来了春天。整个90年代,面部识别技术有众多理论上的突破,而且美国军方也出于反恐的需要,开始资助相关的研究,这也使得面部识别技术得以迅速转化到实际应用。美国国防部资助的FERET项目分别在1994年、1995年和1996年组织了3次面部识别评测,几种知名的面部识别算法都参加了测试,这3次测评直接推动了面部识别算法的改进。

“9·11”事件发生后,为了遏制恐怖袭击,美国对面部识别技术更加重视,并且在安防领域被更加广泛的推广应用。

2.2近年来脸谱识别技术在国内的发展

国内关于人脸自动识别的研究始于二十世纪80年代,主要的研究单位有淸平大学,哈尔滨工业大学,中科院计算所,中科院自动化所,复旦大学,北京科技大学等,并都取得了一定的成果。国内的研究工作主要是集中在二大炎方法的研究:某于几何特征的人脸正面自动识别方法、基于代数特征的人脸正面自动识别方法和基于迹接机制的人脸正面自动识别方法。周激流实现了具有反馈机制的人脸正面识别系统,运用积分投影法提取面部特征的关键点并用于识别,获得了比较满意的效果。他同时也尝试了“稳定视点”特征提取方法,即为使识别系统中包含3D信息,他对人脸侧面剪影识别做了一定的研究,并实现了正,侧面互相参照的识别系统。彭辉、张长水等对“特征脸”的方法做了进一步的发展,提出釆用类间散布矩阵作为产生矩阵,进一步降低了产生矩阵的维数,在保持识别率的情况下,大大降低了

运算堂。程永淸,庄永明等对同类阁像的平均灰度阁进行SVD分解得到特征脸空间,每一幅阁像在特征脸空间上的投影作为其代数特征,然后利用层次判别进行分类。张辉,周洪祥,何振亚釆用对称主元分析神经网络,用去冗余和权值正交相结合的方法对人脸进行特征提取和识别。该方法所用特征数据量小,特征提取运算罱也较小,比较好地实现了大莆人脸样本的存储和人脸的快速识别。北京科技大学的王志良教授主要研究人工心理,建立了以数学公式为基础的心理学模塑。

第三章课题研究的意义

随着物联网的兴起以及图像处理、模式识别、人工智能、生物心理学等科学技术的研究和发展,机器与人沟通是生物特征识别系统发展的必然趋势,可以预测到在不远的将来,人脸识别具有更加广阔的应用前景。本论文就是基于这样一个背景,运用数字图像处理技术,结合人脸检测与识别的应用课题,通过研究如何用图像处理方法完成人脸检测与识别的问题,进行图像处理算法的研究。

第四章课题研究的主要内容

人脸识别(Face Recognition)的研究大致包括以下5个方面的内容:

(1) 人脸检测(Face Detection):即从不同场景中检测出人脸存在与否同时确定其位置。这一任务主要受面部倾斜度、光照、噪声以及各种各样遮挡的影响。

(2) 人脸表征(Face Representation):即采取某种表示方式表示检测出的人脸和数据库中的已知人脸。通常的表示法包括几何特征(如欧氏距离、曲率、角度)代数特征(如矩阵特征矢量)、固定特征模板、特征脸、云纹图等。

(3) 人脸鉴别(Face Identification)(通常所说的“人脸识别”):即将待识别人脸与数据库中的己知人脸比较,得出相关信息。这一过程的核心是选择适当的人脸表征方式与匹配策略,系统构造与人脸表征方式密切相关。

(4) 表情/姿态分析(Expression/Gesture Analysis):即对待识别人脸的表情或姿态信息进行分析,并对其加以归类。

(5) 生理分类(Physical Classification):即对待识别人脸的生理特征进行分析,得出其年龄、性别、等相关信息。

由于人脸鉴别通常被称作“人脸识别”,如无特别指明,本文中的“人脸识别”即是指待识别人脸与数据库中已知人脸之间的匹配问题。

人脸识别系统的主要问题是包含人脸的检测和人脸的识别问题,在所有的问题中这两个是关键。人脸识别系统的结构流程图如图4-1所示:

图4-1 人脸检测与识别的流程图

在人脸检测和识别的关键在于一个好的算法,目前国内外对于人脸的检测和识别分别有很多种不同的算法。本课题研究的主要任务在于选取一个较优的人脸检测算法和人脸识别算法,使系统能够快速准确的进行脸谱的检测。

五、课题研究的实现方法(即方案论证)

人脸检测与定位在理论上是分开的,但是在实际应用中可以合并。人脸检测的目的是检测图像中有没有人脸,人脸的定位是将人脸从背景中分割出来,让“系统”知道人脸或人脸上的某些器官在图像上的位置。在很多算法中,人脸检测的同时就完成了定位。

若要实现系统的要求,应该将人脸的识别系统分为两个过程:人脸的检测和定位、人脸的识别。因此,对于人脸的完整检测识别是两种算法的结合。

5.1人脸的检测与定位

人脸的检测与定位的常用算法有:基于面部特征的人脸检测算法、基于统计的人脸检测方法、基于模板匹配的人脸检测方法、基于肤色模型的人脸检测方法。如下逐一介绍其优缺点。

(1)基于面部特征的人脸检测算法:是利用了人脸的先验知识导出的规则来进行人脸检测。人脸各个器官的分布总是存在着一定的规律性,例如人的两个眼睛总是对称分布在人脸的上半部分,鼻子和嘴唇中心点的连线基本与两眼之间的连线垂直,嘴巴绝对不会超过眼睛的两端点等。人们可以根据这些描述人脸局部特征分布的规则来进行人脸检测。这种方法存在的问题有:检测率不高,如果背景区域中存在类人脸区域,则必然导致误检;用于描述人脸特征之间的关系的规则不易设计,规则制定的过高或者过低会造成拒识或误识。

(2)基于统计的人脸检测方法:这种方法不是针对人脸的某一特征,而是从整个人脸出发,利用统计的原理,从成千上万张人脸图像中提取出人脸共有的规律,利用这些规律来进行人脸识别。此类方法将人脸区域看作一类模式,使用大量的“人脸”与“非人脸”样本,构造并训练分类器,通过判别图像中所以可能区域属于哪类模式的方法实现人脸检测。由于人脸图像的复杂性,显式地描述人脸特征具有一定的困难,因此基于统计的方法越来越受到重视,是解决复杂人脸检测问题的有效途径。

(3)基于模板匹配的人脸检测方法:早期基于模板匹配的方法首先建立一个标准的人脸模板,由包含局部人脸特征的子模板构成,然后对一幅输入图像进行全

局搜索,对应不同尺度大小的图像窗口,计算标准人脸模板中不同部分的相关系数,通过预先设置的阈值判断该图像窗口中是否包含人脸。Yullie 等人提出基于弹性模板的方法用于人脸检测。弹性模板是由一个根据被测物体形状而设定的参数的可调模板和与之相对应的能量函数所构成,能量函数要根据图像的灰度信息、被测物体轮廓等先验知识设计。这种方法的优点在于,由于使用的弹性模板可调,能够检测不同的大小、具有不同偏转角度的物体。但是其缺点是检测前必须根据待测人连的形状来设计弹性模板的轮廓,否则会影响收敛的效果;对图像进行全局搜索时,要动态地调整参数和计算能量函数,计算时间过长。

(4)基于肤色模型的人脸检测方法:在彩色图像中,颜色是人脸表面最为显著的特征之一,利用颜色检测是很自然的想法。Yang等人在考察了不同种族、不同个体的肤色后,认为人类的肤色能在颜色空间中类聚成单独的一类,而影响肤色值变化的最主要因素是亮度变化。此方法首先寻找到肤色区域,在根据“颜色相近”、“位置相邻”、“尺度相近”等规则进行类肤色区域归并,最后用模板匹配,神经网络验证等手段确定区域是否是人脸。

5.2人脸的识别算法

人脸识别方法主要可分为三类:静态图像的人脸识别,视频序列的人脸识别和三维人脸识别方法。结合本设计实际情况,在这里我们只对静态图像的人脸识别作简要介绍。

静态图像人脸识别是通过简单设备获取人脸图像后再进行人脸识别。由于其操作简单,计算复杂度低,所以大多数人脸识别算法的研究都是基于静态图像。从识别方法上可以大致分为三类:

(1)基于几何特征的方法:基于几何特征的方法是在抽取人脸图像上显著特征的相对位置及其参数的基础上进行识别。这种方法的缺点在于对获得的图像要求很高,特征点的定位非常重要,人脸的倾斜或是装饰物会在很大程度上影响识别的准确性。

(2)基于模版的方法:基于模板的方法可以分为基于相关匹配的方法、特征脸方法、线性判别分析方法、奇异值分解方法、神经网络方法、动态连接匹配方法等。

(3)基于模型的方法:基于模型的方法是通过统计分析和匹配学习找出人脸和非人脸以及不同人脸之间的联系,该方法的模版是通过样本学习获得而非人为设定,在原理上较为先进合理。基于模型的方法有基于隐马尔柯夫模型(HMM),主动形

状模型和主动外观模型的方法等。其中,隐马尔可夫模型作为一种统计分析模型,创立于20世纪70年代,80年代得到了传播和发展,现已成功用于语音识别,行为识别等领域,在人脸识别领域还有较大发展空间。

5.3特征提取算法

特征提取的过程就是根据各类可分性判据,运用迭代或智能进化的方法,找出一组变换矩阵,将样本从原始分布空间有效映射到新的特征空间的过程。因此特征提取的实质是一个寻求最佳映射变换的过程,同时也是一个数据压缩的过程。

(1).按欧式距离度量的特征提取方法

假设

()()(,)i j k l x x ?表示i ω的第k 个样本与j ω的第l 个样本之间的距离,这样的特征集*

x ,使C 个各样本之间的平均距离()J x 为最大,即: *()()x

J x J x Max = (5-1)

为最优的特征集。

这种方法的特征提取过程为:设12[,,,]T D Y y y y =???为D 各原始特征集,,w b S S 为

原始空间离散度矩阵,*T b b S W S W =,*T w

w S W S W =,为映射后离散矩阵, W 为待求的变换矩阵,变换后的可分性判据:

1()[()]T T b w J W tr W S W W S W -= (5-2)

对W 各分量求偏导,可以唯一确定一组W 值。设矩阵1w b S S -的本征值

12...D λλλ≥≥,取前d 个本征值对应的本征向量作为W ,即12[,,...,]d W u u u =即可求出特征变换矩阵,则新的特征集为:

T X W Y = (5-3)

(2)Karhunen-Loeve (KL)变换方法

在模式识别领域,KL 变换被公认为是特征提取最有效的方法之一,KL 展开应用于特征提取,形成了子空间模式识别的基础[4]。这种方法的基本思想是:假设数据库里有M 幅人脸图像,其灰度均值为F ,将每一幅图与之相减构成一组向量,用于主分量分析:找出M 个正交向量及特征值描述数据的分布,将特征向量从大到小排列,其特征向量将图像投影到一个由特征向量组成的子空间。由于这些图像很像

人脸,所以叫“特征脸”。利用KL 变换提取特征,具有稳定性、位移不变性、转置不变性,具有很好的抽取效果。

(3)奇异特征值分解方法

奇异特征值(Singular Value Decomposition ,简称SVD )算法是一种有效的代数特征提取方法。由于它的最优逼近性,SVD 变换具有很好的信息压缩特性,并且图像阵列可以有效地用几个奇异值表示。此外采用奇异值向量作为观察序列,具有以下性质:

1)稳定性,也就是说图像灰度值的微小变化不会引起奇异值大的变化。

2)奇异值向量与对应图像亮度成比例变化。

3)奇异值向量具有转置不变性和位移不变性。

因此,奇异特征值可以作为图像的一种有效的代数描述。SVD 技术已经成为解决分类中特征生成和特征选择问题的一种有效工具,在图像数据压缩和存储、信号处理和模式分析中得到了广泛的应用。

(4) 独立分量分析(ICA )方法

独立分量分析(Independent Component Analysis ,简称ICA )方法是近年来才发展起来的一种新的统计方法,目的是将观察到的数据进行某种线性分解成为统计独立的成分。目前ICA 主要应用于特征提取,图象处理和人脸识别。在特征提取中的一般过程为:设i x 表示为一幅人脸图像,训练矩阵:

12(,,...,)T m X x x x = (5-4)

设训练集由N 个未知独立分量12(,,...,)T n S s s s =表示,则X AS =,

A 为特征矩阵。从式(5-4)中可以看出, 每个图像i x 由12,,...,m s s s 与12,,...,i i in a a a 的线形组合来表示,因此,混合矩阵A 也称为特征矩阵,可看作是所有训练图像的特征。

5.4算法的选择

在人脸检测与识别技术中,正确检测识别率是研究人脸检测与识别算法的重要性能指标。另外,由于计算机人脸检测识别技术的实际应用实时性要求比较强,因此计算时间是计算机人脸检测识别技术中的一个重要指标。计算时间主要有两方面:一是设计阶段,系统训练需要的时间;另一个是检测和识别阶段系统需要的时间。通常情况下,系统设计阶段需要的时间可以不考虑,但检测与时间却相当重要,它

直接影响人脸检测识别系统的实用性,对系统是否能用于实践起决定性作用。

综合人脸识别系统每个环节以及各种算法分析与性能指标的要求,在人脸检测阶段,应该选用一种对外界干扰因素(比如光照、人脸角度等)适应性强,检测率高,识别速度快的方法,因此我们选择了一种基于统计的人脸检测方法——Adaboost算法;在人脸识别阶段,我们选用了隐马尔可夫模型方法,后来的实验也证实了这是一种识别率高,识别速度快的方法。

5.5系统的整体方案设计流程

图5-1系统的总体方案设计流程图

六、设计难点

对于一个人脸的检测系统其主要的性能指标有如下几点:

(1)检测率:被正确检测到的人脸数目与原图像内包含的人脸数目的比值。检测率越高,表明检测系统对人脸的接受能力越强。

(2)误识率(或虚警率、误报率、误检率):被误检为人脸的非人脸子窗口的数目与原图像内被检测的所有非人脸子窗口数目的比值。检测率无法反映系统对非人脸的排除能力,有可能所有人脸都被检测到的同时有大量的非人脸也被误检为人脸。因此,引入误识率来衡量系统对非人脸样本的排除能力。误识率越低,表明检测系统对非人脸的排除能力越强。

(3)检测速度:大部分应用领域需要在线实时地检测人脸,如人脸识别、人脸跟踪和可编程视频监控等。通常,提高速度往往是以降低检测率为代价的。因此,在检测率和误检率达到满意的前提下,检测速度越快越好。

(4)鲁棒性:反映了检测系统在各种条件下的适应能力。这四个标准有些是相互制约的。例如,误检率会随着检测率的提高而提高,检测率随着误检率的降低而降低;或检测率和误检率都很理想,但检测速度很慢,如神经网络方法;又或检测速度虽快,但鲁棒性较差。

根据以上几个性能指标所以本次设计最大值难点在于一下几个方面:

(1)人脸的检测是设计中必须注重的问题,对于不同背景、不同亮度、不同环境的图像中筛选出人脸是人脸识别的首要的问题。

对于此问题的解决方案是:首先,选取一个较为合适的算法,这是最基本的。怎么能从背景中提取出人脸的图像,如前所述我们选用了基于统计的人脸检测方法,通过adaboost算法对系统不断的进行“人脸”和“非人脸”的训练,一次来提高系统的人脸检测能力;其次,对于系统要进行大量的训练,该系统算法的设计特点是通过学习,其人脸的检测能力能不断的提高,因此大量的脸谱训练是解决问题的关键。

(2)系统实现后其识别的精确度问题,即系统的识别率和错误识别率的大小。

此问题它存在于识别和检测两个方面,对于检测方面如前所述,这里不再赘述。我们注重考虑一下识别方面的问题。首先,若达到高的识别率,当然一个好的数据库建立是必不可少的。

(3)系统的识别速度问题,一个好的系统不仅要具有较高的识别精度,同时

其识别速度也必须的达到要求。

此问题要求的是整个系统的配合问题,一个好的系统,不仅检测要快,识别的速度也必须跟的上。这就要求我们能够选择较为快速的脸谱识别和检测算法。我们所选的算法能够较好的兼容。

(4)系统的人脸数据库建立也是一个很重要的问题,数据库建立需要对每一张脸谱进行相应的特征分析,然后根据算法建立模型。这项工作繁琐复杂,是很需要耐心的一项工作了。

拟采取基于模型的脸谱识别算法—隐马尔可夫模型。这种模型被广泛的应用,不仅具有较高的识别率,并且识别速度也是很可观的。

七、进程安排

前期准备:查阅资料,学习、熟悉相关理论和技术,论证系统的总体方案以及系统各部分的具体实现方法,确定出最佳方案;译文。

第一周:开题报告的撰写,开题;

第二到四周:方案确定,认真的学习相关的MATLAB软件

第五到六周:学习各种算法,深入的理解adaboost算法和隐马尔可夫算法

第七到十周:系统的程序编写,软件设计。

第十一到十二周:完成系统并开始进行系统的学习与训练

第十三周:系统的优化与调试,并行系统移植,使系统能够完好的工作

第十四到十五周:整理材料,撰写论文准备答辩。

参考文献

[1] 程雪红,人脸检测与定位及识别技术研究[D],西安电子科技大学硕士论文,

2006。

[2] Yang M H,Kriegman D, Ahujia N. Detection Faces in Images:A Survey [J].IEEE

Transaction.Pattern Analysis and Machine Intelligence. 2002, 24(1): 34-58.

[3] 薛斌党,嵌入式隐Markov模型和神经网络人脸识别[D]。大连理工大学博士学

位论文,2002,7-19.

[4] 宋春雷,王龙,学习理论与鲁棒控制[J],控制理论与应用,2000-17(5): 633-636.

[5] Valiant L G. A Theory of the Learnable [J], Communications of the ACM, 1984,

27(11):1134-1142.

[6] Kearns M. The Computational Complexity of Machine Learning [J] Cambridge: MIT

Press, 1990.

[7] Kearns M ,Valiant L G.Cryptographic Limitations on Learning Boolean Formulae

and Finite Automata [J].Journal of the ACM, 1994,41(1):67-95.

[8] Schapire R E.The Strength of Weak Learnability [J].Machine Learning, 1990,

5(2):197-227.

[9] Viola P. Jones M J. Robust Real-Time Face Detection [J].International Journal of

Computer Vision 2004, 57(2), 137-154.

[10] F Samaria, S Young. HMM based architecture for face recognition[J].Image and

Computer Vision, 1994,12 , 537-543.

[11] A J Viterbi. Error bounds for convolutional codes and an asymptotically

Theory[J].1967, IT-13, 260-269.

[12] G D Forney. The Viterbi algorithm[J]. Proc. IEEE, 1973, 61, 268-278.

[13] L E Baum, G R Sell. Growth functions for translations on manifolds[J]. Pac. J. Math,

1968, 27(2), 211-227.

[14] L E Baum, T Petrie, G Soules. A maximization technique occurring in the

statistical analysis of probabilistic functi

[15]梁路宏,艾海舟,徐光褚,张钹.人脸检测研究综述[J].计算机学报,2002,

25(5):449~458

[16]Sung K,Poggio T.Example-Based Learning for View-Based Human Face

Detection[J].IEEE Trans on Pattern Analysis and Machine Intellgence,1998,20(1):39~51

[17]人脸检测、跟踪与识别一一应用领域[EB/OL].http://blog.sina.corn.cn

/s/blog_539 ede0401 00056a.html

[18]张翠平,苏光大.人脸识别技术综述[J].中国图象图形学报,2000,5(A)(1 1):

885~894

[19]边肇棋,张学工等.模式识别(第二版)[M].北京:清华大学出版社,2000,121.136

[20]J.EMarques de Sd.模式识别一原理、方法及应用[M].北京清华大学出版社2002,

46~79

相关主题