搜档网
当前位置:搜档网 › 模式识别及其新技术

模式识别及其新技术

模式识别及其新技术

姓名:方浩学号:2110903073

1引言

模式识别是六十年代初发展起来的,随着计算机技术的发展,它已成为当前科学技术发展的一门前沿学科。模式识别在许多科学和技术领域得到了广泛的应用,推动了人工智能、图像处理、信号处理、计算机视觉、多媒体技术等多种学科的发展,扩大了计算机的应用领域。本文将介绍模式识别及其新的技术应用。

2.1模式识别的概念

何谓模式?广义地说,存在于时间和空间中可观察的物体,如果我们可以区别它们是否相同或是否相似,都可以称之为模式。模式所指的不是事物本身,而是从事物获得的信息,因此,模式往往表现为具有时间和空间分布的信息。模式识别是研究一些自动技术,依靠这些技术,计算机自动地把待识别的模式分到各自的模式类中去,即利用计算机实现人对各种事物或现象的分析、描述、判断、识别。

模式识别的作用和目的在于利用计算机对物理对象进行分类,在错误概率小的条件下,使识别的结果尽量与客观物体相符合。

模式识别作为一门前沿学科,其涉及的领域包括农业、天文学、生物学、市政管理、经济、工程、地理、医学、军事、安全等。

2.2 模式识别系统

一个模式识别问题一般要经过如图1所示,包括数据采集、数据预处理、特征提取与特征选择以及模式分类4个过程。

图1 模式识别过程

下面对各部分内容作简要介绍:

数据获取:用计算机可以运算的符号来表示所研究的对象。

预处理:去除所获取信息中的噪声,增强有用的信息,及一切必要的使信息纯化的处理过程。

特征选择和提取:对所获取的信息实现从测量空间到特征空间的转换。

分类器设计:将该特征空间划分成由各类占据的子空间,确定相应的决策分界和判决规则,使按此类判决规则分类时,错误率最低。把这些判决规则建成标准库。

分类决策:分类器在分界形式及其具体参数都确定后,用相应的决策分界对待分类样本进行分类决策的过程。

训练过程:对作为训练样本的测量数据进行特征选择与提取,得到它们在特征空间的发布,依据这些分布决定分类器的具体参数,也就是设计分类器的过程。

识别过程:分类决策的过程,则是在特征空间中用统计方法把被识别对象归为某一类别。

模式识别系统总的来说由两大模块组成,即学习模块和测试模块,如图2 所示。

图2 模式识别系统组成示意图

在两个模块中都存在数据的项处理,数据的预处理功能是多方面的,包括:将感兴趣的模式从背景中分离;去除噪声信号的影响;标准化模式样本等等。在学习(训练)过程中,将已知的模式样本进行数值化后送人计算机,这就是训练模式样本的特征数据输入过程。对输入的样本进行分析,去掉对分类无效或易造成混淆的那些特征,尽量保留对分类判别有效的数值特征,这就是所谓的特征选择。有时还采用某些变换技术,得出数目比原来少的综合性特征作为分类用,这一过程称为特征提取,接着按设想的分类判决数学模型对给定训练样本模式进行训练,得到分类的判决规则。

获取了判决规则后,就可以进行识别过程。先进行未知模式的特征数据采集,接着进行未知模式的特征选择和特征提取,再根据已有的判决规则对模式分类,最后输出识别结果。

然后,将已识别的分类结果与己知类别的输入模式作对比,不断改进判决规则和特征选择与特征提取方法,制定出使错误率(风险率)最小的判决规则和特征选择与提取策略。这也就是通常所说的再学习过程。

2.3 模式识别的基本方法

目前主要的模式识别方法有:统计模式识别、句法模式识别、模糊数学方法、神经网络法、人工智能方法。

1.统计模式识别

这类识别技术理论较完善,方法也很多,通常较为有效,现已形成了一个完

整的体系。它主要基于用概率统计模型得到各类别的特征向量分布,以取得分类的功能。获得特征向量的分布基于一个类别已知的训练样本集。因此,这是一种监督学习的模式识别方法,在这个意义上,分类器势概念驱动的,用已知类别标签的样本集来训练从而得知如何分类。如果将分类器设计的有效,它将可以处理新的样本集。

统计模式识别方法有很多具体方法,它们取决于是否采用一个已知的、参数型的分布模型。

2.句法模式识别

句法模式识别也称为结构模式识别。在许多情况下,对于较复杂的对象仅用一些数值特征已不能较充分地进行描述,这时可采用句法识别技术。句法识别技术将对象分解为若干个基本单元,这些基本单元称为基元;用这些基元以及它们的结构关系来描述对象,基元以及这些基元的结构关系可以用字符串或图来表示;然后运用形式语言理论进行句法分析,根据其是否符合某一类的文法而决定其类别。

3.模糊模式识别

这类技术运用模糊数学的理论和方法解决模式识别问题,因此适用于分类识别对象本身或要求的识别结果具有模糊性的场合。目前,模糊识别方法较多。这类方法的有效性主要在于对象类的隶属函数是否良好。

4.人工神经网络法

人上神经网络是由大量简单的基本单元——神经元(Neuron)相互联接而构成的非线性动态系统,每个神经元结构和功能比较简单,而由其组成的系统却可以非常复杂,具有生物神经网络的某些持性,在自学习、自组织、联想及容错方面具有较强的能力,能用于联想、识别和决策。在模式识别方面,与前述方法显著不同的特点之一是在学习过程中具有自动提取特征的能力。

5.人工智能方法

众所周知,人类具有极完善的分类识别能力,人工智能是研究如何使机器具有人脑功能的理论和方法,模式识别从本质上讲就是如何根据对象的特征进行类别的判断,因此,可以将人工智能中有关学习、知识表示、推理等技术用于模式识别。

上述的五类方法各有其持点及应用范围,现在来看,它们不能相互取代,只能共存,相互促进、借鉴、渗透及融合。一个较完善的识别系统很可能是综合利用上述各类识别方法的观点、概念和技术而形成的。

3模式识别的新技术应用

模式识别经过几十年的发展,已经在很多方面得到了成功的应用。下面将介绍几种目前模式识别新的技术应用。

1.机器视觉

在机器视觉中,模式识别是非常重要的。机器视觉系统通过照相机捕捉图像,然后通过分析,生成图像的描述信息。典型的机器视觉系统主要应用在制造业中,用于自动视觉检验或自动装配线。例如,在自动视觉检验应用中,生产的产品通过传送带移动到检验站,检验站的照相机确定产品是否合格。因此,必须在线分析图像,模式识别系统将产品分为合格和不合格两种。然后,根据分类结果采取相应的动作,比如丢弃不合格的产品。在装配线上,必须对不同的对象进行定位和识别,也就是说,将对象分类到已知类别中的某一类中,如螺丝刀类、德国钥匙类以及任何工具制造单元,然后机器手把这些对象放置在正确的位置。

2.字符识别

字符识别是模式识别应用的另一个重要领域,重要用于自动化和信息处理。按识别的对象,文字识别分为西文字符识别、阿拉伯数字识别和汉字识别等。按文字出现的形式,文字识别又分为印刷体字符识别和手写体字符识别。显然,手写体的识别要比印刷体的识别困难得多。

由于汉字结构复杂、种类多,使得汉字识别成为我国模式识别研究人员的一大重点课题。里。此外还有利用书写板输入的在线文字识别,由于在线文字识别可以利用汉字的笔顺信息,从而降低了识别的难度。

一般说来,如果对于字符的书写予以一些限制,则识别过程会简单些,所以有的识别系统规定字符要写在规定的方框内,有的系统还在框内加上限制字符形状的格点等。手写体阿拉伯数字的识别在邮政信函自动分拣上起到了重要的作用。现在信封上的邮政编码就是为自动分拣而设的。

3.语音识别

语音识别的难度和复杂性都很高,因为要提取语音的特征,不仅要分析语言的结构和语音的物理过程,而且还要涉及听觉的物理和生理过程。人们可以听懂不同嗓音、不同速度的连续语句,但是要用机器来实现,困难就很大。语音识别有两类课题,第一类是识别人们的语言。它可能是不同的人在不同环境背景下的声音。孤立语音的识别已经取得了不少成绩。语音识别的最终目的是识别连续语音,困难在于连续语音的分割、节拍信息的提取、某些辅音的准确和稳定的检出等,这些问题还没有得到很好的解决。

语音识别的另一类课题是发声者的识别。这个课题的任务是识别出发声者是谁,而对于说话内容则不感兴趣。这在身份鉴别中能起很大作用。

4.计算机辅助诊断

计算机辅助诊断是模式识别的另一个重要应用。目的是帮助医生做诊断决定。计算机辅助诊断已经应用于实际,主要研究各种医疗数据,如X射线、计算机断层图、超声波图、心电图、脑电图。模式识别在医学上的应用很多,前景是很好的。随着卫生保健事业的发展,各种健康普查的工作量会大大增加,单纯依靠人工来分析显然不能满足需要。所以,模式识别在医学上的应用会越来越广泛和深入。

5.状态监测与故障诊断

机械设备运行状态监测和故障诊断最本质的工作是:如何通过对机器外部征兆的监测取得特征参数的正确信息,并进行分析和识别。由此可见,从本质上讲,机械设备运行状态监测和故障诊断属于模式识别的范畴。

当然,针对机械设备运行状态监测和故障诊断这一特殊应用领域而使用的模式识别方法有其特殊性。

与诸如入脸识别、说话人确认、文字识别等普通的模式识别问题相比,其特殊性主要体现在以下几点:学习样本集中,正常运行模式样本多而故障运行模式样本少;两类误判会产生不同程度的损失,一般情况下将正常运行模式判为故障运行模式(简称为错判)所造成的损失远比将故障运行模式判为正常运行模式(简称为漏判)所造成的损失小;生产设备刚投入运行的一段时间内,表现出来的状态一般仅有正常运行模式一种,随着时间的推移,其它运行模式才可能相继出现;

随着生产设备的长时间使用和其它一些因素(如转动部件之间的磨合、紧固元件轻微的松动、维修时更换了零部件等)的出现,设备的运行参数会发生改变,因此,各运行模式之间的划分标准可能改变;设备运行状态监测和故障诊断中存在较强的模糊性;诊断理论具有广泛的通用性而具体样本数据和各种参数适用面却很窄。因此,在将一般模式识别理论和方法应用于故障诊断时必须进行一定的调整,才能符合监测与诊断的要求。

7.数据库中的数据挖掘和知识探索

数据挖掘广泛应用于医学和生物学、市场和财务分析、企业管理、科学探索、图像和音乐检索。由于信息存在于给各种形式的海量数据中,如文字、图像、音频和视频,它们存储在全世界的不同地方。在数据库中,查找信息的最传统方法是基于模型描述,对象检索是基于关键词描述和部分字匹配。基于内容的检索系统越来越受欢迎,这种系统是根据提交到系统中的对象与全世界各网络站上的对象空间的“相似性”来查询信息的。在基于内容的图像检索系统中,图像传送到输入设备中;该系统返回基于可测量信号判断“相似”图像。信号是可编码的,如颜色、纹理和形状的相关信息。在基于内容的音乐检索系统中,例如,用麦克风输入,系统返回“相似”音乐作品。在这种情况下,相似性取决于描述音乐作品的某些课测量特征,比如音乐韵律、音乐节奏和某些重复段落的位置。

8.人脸识别

人脸识别是利用计算机分析人脸图像,进而从中提取有用的识别信息,用来“辨认”身份的一门技术。人脸识别技术应用背景广泛,可用于公安系统的罪犯身份识别、驾驶执照和护照等与实际持证人的核对、银行及海关的监控系统及自动门卫等。虽然人类的人脸识别能力很强,能够记住并辨别上千个不同人的脸,可是计算机则困难多了。其表现在:人脸表情丰富;人脸随年龄增长而变化,人脸所成图像因受光照、成像角度及成像距离等影响;而且从二维图像重建三维人脸是病态过程,目前尚没有很好的描述人脸的三维模型。

模式识别在其它很多领域也获得了广泛的应用,诸如遥感图像的识别,军事上可见光、雷达、红外因像的分析与识别等等。

9.身份识别

身份识别包括身份确认和身份辨别两方面的研究内容。身份确认是指验证用

户是否为他自己所声明的身份,身份辨别用于确定测试对象是已有参考对象中的那一个。

现有的身份识别方法大致分为两类,一是通过持有物如各种证件或口令、密码等,二是采用生物识别技术,即通过生理或行为特征。前一种方法由于无法避免伪造、遗失或窃取,因此难以真正保证系统的安全,相对而言,后者要可靠得多。因此,在一些相对重要的应用领域,都是利用人的生理或行为特征来自动确认与鉴别人的身份。

目前,有8种基于生理和行为特征的方法可应用于身份识别:人脸识别、指纹识别、求纹识别、虹膜识别、手形识别、语音识别、签字识别以及开钡动力学识别。从目前的研究所取得的成果出发,综合考虑身份识别系统在成本、速度、精度、可欺骗性等方面的要求及校测试者的可接受程度,人脸识别和语音识别应该是最有发展前途的两种身份识别方法。

4 总结

本文简单介绍了模式的基本概念、系统组成、模式识别基本方法,并总结了目前已经广泛应用的模式识别新的技术应用。模式识别的应用领域在不断拓宽:数据挖掘、生物特征识别、遥感、文本分类、工业自动化、文档与图像分析等,随着模式识别理论及其相关技术的发展,可以预见,其应用将更加广泛和成熟。

参考文献

[1] 李晶皎,王爱侠,王骄.模式识别[M].北京:电子工业出版社,2002.

[2] 吴逸飞.模式识别[M].北京:清华大学出版社,2002.

[3] 孙即祥.现代模式识别[M].长沙:国防科技大学出版社,2001.

[4] 肖建华.只能模式识别[M].广州:华南理工大学出版社,2006.

相关主题