搜档网
当前位置:搜档网 › (完整word版)手势识别技术综述

(完整word版)手势识别技术综述

(完整word版)手势识别技术综述
(完整word版)手势识别技术综述

手势识别技术综述

作者单位:河北工业大学计算机科学与软件学院

内容摘要:

手势识别是属于计算机科学与语言学的一个将人类手势通过数学算法针对人们所要表达的意思进行分析、判断并整合的交互技术。一般来说,手势识别技术并非针对单纯的手势,还可以对其他肢体动作进行识别,比如头部、胳臂等。

但是这其中手势占大多数。本文通过对手势识别的发展过程、使用工具、目的与市场等进行综述,梳理出手势识别发展的思路,让读者对手势识别有一个总体上的认识,同时也可以让读者在此基础上进行合理想象,对手势识别的未来有一个大体印象。

Abstract:

Gesture recognition is an interactive technology using mathematical arithmetic to the analysis,judge and assembly meaning that people want to convey which belongs to computer science and Linguistics.In general, gesture recognition technology is not for simple gestures expressed by hands ,it can also aim to other body movement recognition, such as the head, arm and so on. But the gesture accounted for most of the analysis. In this paper, by describing the development process, tools used , objective and market of gesture recognition , we can sort out the ideas of the development of gesture recognition, and let readers have an overall understanding of gesture recognition. At the same time, it can let the reader imagine that on hand gesture recognition based on reason ,and have a general impression of its future.

1.定义

说到手势识别,首先要对手势识别中的手势有一个清晰的认知。手势在不同的学科中有不同含义,而在交互设计方面,手势与依赖鼠标、键盘等进行操控的区别是显而易见的,那就是手势是人们更乐意接受的、舒适而受交互设备限制小的方式,而且手势可供挖掘的信息远比依赖键盘鼠标的交互模式多。在学术界,人们试图对手势定义一个抽象、明确而简洁的概念以为手势及其应用的研究提供依据。1990年Eric Hulteen和Gord Kurtenbach曾发表的题为“Gestures in Human-Computer Communication”中定义:“手势为身体运动的一部分,它包括一部分信息,而且是一种能被观察到的有意义的运动。挥手道别是一种手势,而敲击键盘不是一种手势,因为手指的运动没有被观察,也不重要,它只表示键盘

被按下这一动作。”

从定义上讲,手势识别是一种利用数学算法,包括计算机图形学,辅以摄像头、数据手套等输入工具,针对收集到的信息,比如手掌、手指各关节的方位、角度等进行判断、分析并作出正确回复的技术。许多测试品已开始使用三维手势识别来提升准确率及反应速度。但是,分析手势的特点,回顾手势识别的发展历史,可以更好地把握其发展脉络,从而对未来手势识别的潜力与可能方向做出基本判断。

2.发展过程

手势是任意的,手不同部位的方向、角度及弯曲程度等的不同信息可能会有实际意义上的天壤之别。所以手势识别应该基于用户与程序、设备之间的约定。

针对手势的任意性,最初的手势识别主要使用各种与手及手臂通过直接的接触式有线机器设备进行数据采集。它可以直接检测诸如手指、关节及手臂的方位、角度等。典型的设备有数据手套等。通过内含许多传感器的数据手套,可以十分精确地获取手势识别所需的各种信息,此外其反应速度、识别准确度、稳定性也得到了保障。但是该设备在实际中的造价比较高昂,更重要的是会对手的灵活性有一定限制,因而没有得到有效推广。此后推出的穿戴式光学标记可通过红外线将手指及手掌变化传输到屏幕上,也保持了数据手套的优点。该设备虽减轻了重量,提高了手部的灵活性,但是仍需较复杂的输入输出转换设备,此外也会对手部动作的自然性产生影响。【1】

基于视觉的手势识别技术能够使手部动作的表达更加自然,同时也可以为未来其他的肢体识别技术所应用,因此成为了主流。手型模型是通过计算机图形学对二维的手势图像属性,如手的颜色、纹理、边界、轮廓等进行分析。【6】该方法主要使用三种组件:探测组件、运动轨迹组件、识别组件。【6】探测组件负责有针对性地收集有特点的视觉信号并将手势信号整理成码。运动轨迹组件负责实时定位,虽然它对于只需静态手势的设备并不是必要的组件,但是其可以优化手部中各部位的运动曲线,提升设备精度。

基于视觉的手势识别按手势的动态特点可以分为静态的与动态的两种,静态手势识别针对单个手型,主要包括手势分割及手势识别两部分,前者是后者的基础。【3】静态手势识别方法难以识别区分度较小的手势、实时性差,因此向动态手势识别过渡已经成为一种趋势。【3】

大部分手势识别应用是将每个手势作为一个整体,之后通过计算相似度来进行模式匹配。这种方法显而易见的缺点是只有当收集到的数据与预设模型的相似程度很高时才会比较准确,另外对于某些比较相似的手势区分效果不好。【6】

3.研究方法

目前常用的手势识别研究方法主要有以下几种:

(1)基于人工神经网络的手势识别

神经网络基于统计和概率学方法的组织和判断具有抗干扰、自学习、易控制和处理高效的特点,可用于处理信息缺失的模式并进行模式推广。如果整个神经

网络包括的全部神经元都是时空效能好的算法,那就可以判断手势细微部分的运动。但人工神经网络对时间序列处理能力不强。在静态手势的识别中应用较多,动态手势识别中几乎没有应用。此外,尽管对神经网络的相关研究及应用已经有了几十年,但是该方法本身的复杂性使成功构建一个效果良好的神经网络对大多数人比较困难。【2】

(2)基于隐马尔可夫模型的手势识别

隐马尔可夫模型是一种能细致描述信号的时空变化统计分析模型,适用于动态手势的识别。由于其分析复杂,计算量大,速度慢,故而大多采用离散马尔可夫模型。

(3)基于几何特征的手势识别,包括手势分割法与几何特征法

手势分割包括2种方法:单目视觉和立体视觉。基于单目视觉的方法又分为基于徒手的表观特征(肤色,轮廓);人为增加限制,如要求使用者戴上有色手套及各种光学标识;建立数据库的方法。【12】

手势的几何特征指手势的边缘(如轮廓)和手势区域特征(如手掌颜色、面积)。【4】基于几何特征的手势识别技术,大多采用各种距离公式进行模板匹配,如量度度量空间中真子集之间距离的Hausdorff距离等。几何特征识别方法主要有3种: 模板匹配法(自动提取每一帧特征图像与模板库匹配后识别手势,多用于静态手势识别);神经网络法,统计分析法(如隐马尔可夫模型法HMM)等。

动态手势识别的算法比较复杂。除了进行手势识别的算法外,还需要其他辅助算法及过程。

某些具有手部整体运动轨迹的手势可以是肢体动作的一部分,比如挥手、打招呼等。这些手势识别需要准确地从手腕部对手势及手臂进行识别并分割。此外,在动态手势识别中还需同时进行方位定位及识别工作,其核心是动态时间空间跃迁算法(DSTW),一种可以在时间空间成对排列搜索请求及模型手势的算法。【11】

此外,涉及随机信号及过程的光谱分析法已经在大量科学学科中使用了几十年,尽管随机性会给时间域特性分析带来困难,像特征值及频率仍然是有价值的光谱信息。傅里叶分析是频率域光谱分析的常见方法。【8】

尽管存在诸多的方法,而且手势识别仍在不断发展中,但是手势识别本身的特点在某些方面成为了障碍。与人脸识别最显著的区别是,基于图像的手势识别与人脸识别虽然都是根据二维图像,但是手部没有类似人脸那样丰富的可以标记及区分的数据特征对象。人脸的表情丰富,可以作为理想的数据库。典型的人脸切尔诺夫模型拥有18个变量,而自1973年来经过几十年的发展,面部特征又得到了丰富,非对称的切尔诺夫脸可显示多达36维的脸部特征。手部的特征明显要少得多,基本上就是各关节、手掌的坐标,指尖的朝向等。而且脸部特征基本上是在一个平面上的,没有旋转特征,脸部的自由度小。手部在手势定位及旋转上至少需要6维信息,包括手部的三维坐标及三维方向。而完全对手势进行分辨需要超过20个的自由度变量,这使得手势的甄别十分复杂。

4.当前的应用

(1)用于虚拟环境的交互

手势识别可以用于虚拟制造和虚拟装配、产品设计等。虚拟装配通过手的运动直接进行零件的装配,同时通过手势与语音的合成来灵活的定义零件之间的装配关系。还可以将手势识别用于复杂设计信息的输入。【9】

(2)用于手语识别。

手语是聋哑人使用的语言,是由手型动作辅之以表情姿势由符号构成的比较稳定的表达系统,是一种靠动作Π视觉交际的语言。手语识别的研究目标是让机器“看懂”聋人的语言。手语识别和手语合成相结合,构成一个“人2机手语翻译系统”,便于聋人与周围环境的交流。手语识别同样分为基于数据手套的和基于视觉的手语识别两种。基于DGMM的中国手语识别系统选取Cyberglove型号数据手套作为手语输入设备,采用了动态高斯混合模型DGMM(DynamicGaussianMixtureModel)作为系统的识别技术,可识别中国手语字典中的274个词条,识别率为98.2%。【9】

(3)用于多通道、多媒体用户界面。

正如鼠标没有取代键盘,手势输入也不能取代键盘、鼠标等传统交互设备,这一方面由于手势识别的设备和技术问题,另一方面也由于手势固有的多义性、多样性、差异性、不精确性等特点。手势识别要想取得比较高的识别率,仍有很长的路要走。手势输入在人机交互中应用的精髓不在于用来独立地用作空间指点,而是为语言、视线、唇语等交互手段通道提供空间的或其他的约束信息,以消除在单通道输入时存在的歧义。这种做法是试图以充分性取代精确性。

(4)用于机器人机械手的抓取

机器人机械手的自然抓取一直是机器人研究领域的难点。手势识别,尤其是基于数据手套的手势识别的研究对克服这个问题有重要的意义,是手势识别的重要应用领域之一。

5.前景

提供一个自然而且有效的人机交互界面始终是人机交互研究的目的。【1】那么手势识别以后的发展也要围绕这一点。在未来的发展中,口语、手势和人脸在虚拟环境中的互补是必要的。因为手形有两种建模方式:基于三维的建模和基于图像的建模。【4】基于三维的建模有强大的表达能力,几乎能够表达所有的手形,但是缺乏效率。而后者简单高效,但是缺乏通用性。手势由一段时间内的一系列手形组成。手势的分解和分类是手势识别的两个重要问题。在多用户虚拟环境中,人脸又可以作为区分用户的属性。只有综合利用他们,才能在人机交互系统中产生深远的影响。

然而在手势识别的发展中还有以下几个难点:现有的手势识别方法的局限性:单一颜色或静态背景;干净的肤色分割;手腕的界定;手动初始化。【10】到目前为止,大多数研究都集中在静态手势识别技术,而我们不仅要对手势进行跟踪,还要进行识别,其计算工作量很大且速度慢,不能用于实时识别系统。当前阻止我们进行实时识别的难点有手势目标检测困难手势目标识别困难。当前

还未能找到解决问题的理想方法,针对具体的某一系统,在实现时要假设一定的限制条件,以达到较好的识别效果。

虽然有许多许多的困难,但是现在全世界已有不少工作者投入到手势识别这项研究中,例如:美国的麻省理工学院,乔治理工学院,加州圣何塞公司等。如上所言,这项研究肯定有许多的难点问题需要去思考,去克服。在他发展的道路上,我认为分析师拉兹罗所言的:“无论何时,如果你想引进一种新的用户界面,他是否简单和容易操作总是成败的关键。当年鼠标问世时也不是一下子就得到了大众的接受。”非常适合此处。所以无论是学生还是公司,只要坚持对该系统的研究,必然会获得成功。

目前多个科技公司都纷纷推出了自己的手势识别产品或申请专利。2012年,Leap Motion 横空出世。作为一种继Kinect之后又一款革命性的交互产品,它只需将其用USB连接到电脑上,便可以准确识别出来显示器前方的动作。2016年4月,苹果公司获得了来自美国专利商标局一项新专利的批准。通过Apple Watch 上多种传感器的检测,iPhone可转化成文字或语音消息,实现忽略来电、静音等功能。此外,2016年4月2日公布的三星公司为VR研发的新传感器允许用户凌空操作VR应用,可以通过虚拟现实世界中瞄准线实现菜单、图标、照片、视频等的点击运行,而完全不需要使用到设备上的任何真实按钮。

参考文献:

【1】任雅祥,《基于手势识别的人机交互发展研究》,《计算机工程与设计》27卷第七期

【2】武霞、张崎、许艳旭,《手势识别发展现状综述》,《电子科技》2013年26卷6期【3】杨波、宋晓娜、冯志全,《复杂背景下基于空间分布特征的手势识别算法》,《计算机辅助设计与图形学学报》2010.10 第22卷第10期

【4】冯志全、蒋彦,《手势识别研究综述》,《济南大学学报(自然科学版)》2013年10月第27卷第4期

【6】Hong Cheng,Zhoujun Dai,Zicheng Liu,, 55(2016)137—147)

【7】Shweta K.Yewale,Pankaj K.Bharne,, Vol.3 No.4 April 2011

【8】Ali Boyali,Naohisa Hashimoto,, 24(2016) 11-18

【9】李清水、方志刚、沈模卫、陈育伟. 《手势识别技术及其在人机交互中的应用》,人类工效学.2002年3月第8卷第1期

【10】徐慧琳. 《手势识别系统的发展趋势》.科教导刊.2003年第11期

【11】Ankit Chaudhary,J. L. Raheja. < Intelligent Approaches to interact with Machines using Hand Gesture Recognition in Natural way:A Survey>.International Journal of Computer

Science & Engineering Survey (IJCSES) V ol.2, No.1, Feb 2011

【12】MISS. SHWETA K. YEWALE..Shweta K. Yewale et al. / International Journal of Engineering Science and Technology (IJEST)

手势识别技术综述

手势识别技术综述 作者单位:河北工业大学计算机科学与软件学院 内容摘要: 手势识别是属于计算机科学与语言学的一个将人类手势通过数学算法针对人们所要表达的意思进行分析、判断并整合的交互技术。一般来说,手势识别技术并非针对单纯的手势,还可以对其他肢体动作进行识别,比如头部、胳臂等。

但是这其中手势占大多数。本文通过对手势识别的发展过程、使用工具、目的与市场等进行综述,梳理出手势识别发展的思路,让读者对手势识别有一个总体上的认识,同时也可以让读者在此基础上进行合理想象,对手势识别的未来有一个大体印象。 Abstract: Gesture recognition is an interactive technology using mathematical arithmetic to the analysis,judge and assembly meaning that people want to convey which belongs to computer science and Linguistics.In general, gesture recognition technology is not for simple gestures expressed by hands ,it can also aim to other body movement recognition, such as the head, arm and so on. But the gesture accounted for most of the analysis. In this paper, by describing the development process, tools used , objective and market of gesture recognition , we can sort out the ideas of the development of gesture recognition, and let readers have an overall understanding of gesture recognition. At the same time, it can let the reader imagine that on hand gesture recognition based on reason ,and have a general impression of its future. 1.定义 说到手势识别,首先要对手势识别中的手势有一个清晰的认知。手势在不同的学科中有不同含义,而在交互设计方面,手势与依赖鼠标、键盘等进行操控的区别是显而易见的,那就是手势是人们更乐意接受的、舒适而受交互设备限制小的方式,而且手势可供挖掘的信息远比依赖键盘鼠标的交互模式多。在学术界,人们试图对手势定义一个抽象、明确而简洁的概念以为手势及其应用的研究提供依据。1990年Eric Hulteen和Gord Kurtenbach曾发表的题为“Gestures in Human-Computer Communication”中定义:“手势为身体运动的一部分,它包括一部分信息,而且是一种能被观察到的有意义的运动。挥手道别是一种手势,而敲击键盘不是一种手势,因为手指的运动没有被观察,也不重要,它只表示键盘

Word文档排版的几个小技巧

1.页面设置快速进行调整 问:要对Word 进行页面调整,通常大家采用的方法是选择“文件→页面设置”选项的方法进行,请问有没有更快速方便的方法呢? 答:有,如果要进行“页面设置”,只需用鼠标左键双击标尺上没有刻度的部分就可以打开页面设置窗口。 2.Word 中巧选文本内容 问:在Word 文件中进行编辑操作时,经常需选定部分文件内容或全部内容进行处理,请问有没有快捷的方法进行选定? 答:在Word 中要选中文件内容时,有一些快捷的操作方法,掌握好它们可以大大提高你的工作效率。下面为大家介绍这几种用得较多的方法: ( 1 )字或词的选取: 将指针移到要选的字或词后,双击鼠标左键即可选定。 ( 2 )任意连续的文字选取: 将指针移到要选取的文字首或末,再按住鼠标左键不放往后或往前拖动,直至选中全部要选择的文字后松开鼠标左键即可。如果采用键盘上“ Shift ”键配合鼠标左键进行选择,可这样进行:将光标移到要选取的文字首(或末),再按住“ Shift ”键不放,然后将鼠标指针移到要选取的文字末(或首)并单击,此时也可快速选中这段连续的文字。 ( 3 )一行文字的选取: 将指针移到该行的行首,在光标指针变成向右的箭头时,单击鼠标左键即可; ( 4 )一段文字的选取: 将指针移到该段第一行的行首,同样在光标指针变成向右的箭头时,双击鼠标左键即可。 ( 5 )整个文件内容的选取: 把指针移到该文件中任一行首(在指针变成向右的箭头时),快速单击鼠标左键三次便可选中整个文件内容(也可利用组合键“ Ctrl+A ”快速选定)。 另外在平时使用中,还有几个特别的快捷键可以加快选取: Shift+Home :使光标处选至该行开头处。———————————————————————————————————————青年论坛https://www.sodocs.net/doc/b81380289.html,/电影吧https://www.sodocs.net/doc/b81380289.html,/ 欢迎访问

Word使用技巧大全100例

Word使用技巧大全100例 1、即时取消Word的后台打印 当我们刚刚编辑完一篇文档按了打印命令后,后来又不想打印当前的文档了,那么怎样才能即时取消后台打印任务呢?一般来说,大家在发出打印任务后,程序会自动将打印任务设置为后台打印,同时在状态栏上出现打印机图标,打印机图标旁边的数字显示的是正在打印的页的页码。要想即时取消后台打印任务的话,大家只要用鼠标双击打印机图标就可以了。 2、W ord 2003让文字随文本框大小变化 当我们在用Word进行文档编辑时,经常需要用文本框来实现一些特殊的应用,比如在文本框中输入文字来达到特殊效果,但有个问题是,当我们在文本框中输入文字并调整了文本框的大小后文字并不会跟着变化。其实我们可让文本框里的文字大小随文本框大小同步”变化;单击选中该文本框,然后选择剪切”再执行菜单编辑]—[选择性粘贴]”在粘贴形式中选择图片(增强型图元文件)”现在再拖动文本框看看,是不是可以随意改变文字大小了。 3、W ord 2003/2007快速切换英文大小写 在Word中输入英文句子时,一般每个单词的第一个字母都是大写,通常的输入方法就是输入第一个字母时就要进行一次大小写切换。这样很麻烦。不妨全部输入小写字符,然后选中所有单词,按一次组合键“ Shift+F3式试,是不是每个单词的第一个字母都变成了大写?再按一次试试,所有的字母都变成了大写!再按一次,又变了小写。原来,组合键Shift+F3是个英文大小写切换键,充 分利用这个组合键,以后输入英文就方便多了。 4、W ord 2003/2007 Word表格中“ Shift+Alt方向键”调整行序 Word表格编辑时可以使用一些快捷键提高效率,比如“Shift+Alt方向键”组合,非常有用,用“Shift+Alt上(或下)方向键”能够调整文档中段落的顺序,也可以调整Word表格中的行序。方法是:将插入点置于要调整行的任意一个单元格内(或行尾段落标记前),按下“Shift+Alt a,”然后按上下方向键,按向上箭 头”键可使该行在表格内向上移动,按向下箭头”键可使该行向下移动。

基于手势识别的智能电视交互专利技术综述

基于手势识别的智能电视交互专利技术综述 智能电视具有操作系统,支持第三方应用资源实现功能扩展,支持多网络接入功能,具备人机交互、与其他智能设备进行交互等。随着计算机视觉的发展和人机交互的需要,手势识别研究取得了蓬勃的发展,通过手势识别对智能电视进行控制和操作,能够更轻松、高效地使用电视设备。文章利用专利数据库对智能电视手势识别技术进行了数据统计和分析,对该领域的专利申请趋势等情况做了归纳总结。 标签:智能电视;手势识别;发展状况;专利 Abstract:Intelligent TV has the operating system,which supports the third party application resources to realize the function expansion,supports the multi-network access function,has the man-machine interaction,and carries on the interaction with other intelligent devices. With the development of computer vision and the need of human-computer interaction,the research of gesture recognition has made great progress. By controlling and operating intelligent TV through gesture recognition,one can more easily and more efficiently use TV equipment. This paper makes use of patent database to analyze the data of intelligent TV gesture recognition technology,and summarizes the trend of patent application in this field. Keywords:intelligent TV;gesture recognition;development status;patent 引言 电视是家庭娱乐休闲必不可少的家用电器。如今,电视依然是最为普及的信息传播载体,用户在观看普通节目的同时,还可以上网、娱乐等。从用户的角度出发,通过自然简单、人性化的方式完成交互,无疑是用户完成电视操作的最佳方式。而手势具有直观、自然、丰富的特点,是一种符合人们日常习惯的交互手段,是表達信息和特定意图的良好载体,由于手势具有上述特性,因此在对智能电视进行操控中得到了良好的运用,实现了对智能电视自然灵活地操作。 1 基于手势识别的智能电视控制技术发展状态分析 1.1 技术分解 本文通过检索获得的专利申请进行统计分析,对基于手势识别的智能电视控制所涉及的具体技术和应用领域进行分解。 根据手势采集设备可以将手势识别系统大致分为基于数据手套和基于视觉的两种手势识别系统。其中,数据手套通过多个传感器反馈各关节的数据,并通过位置跟踪器返回人手所在的三维坐标,从而获取手势在三维空间中的位置信息和手指的运动信息。通过数据手套可以直接获取人手在三维空间中的位置和运动

三种简单手势识别

简单手势识别

一、背景 随着计算机的发展,人机交互技术由传统的鼠标键盘时代发展到了以语音输入、动作识别等技术为代表的自然交互时代n1。特别是视觉计算技术的发展,使计算机获得了初步视觉感知的能力,能“看懂”用户的动作。手势识别作为一种直观自然的输入方式,把人们从传统接触性的输入装置中解放出来,可以以一种更自然的方式与计算机交互,使计算机界面变得更加易‘引。 手势主要分为静态手势和动态手势两种,动态手势可以看作是连续的静态手势序列。动态手势具有丰富和直观的表达能力,与静态手势结合在一起,能创造出更丰富的语义。利用动态手势识别构建新型的交互界面,是新一代的人机交互界面对输入方式自然性的要求,可以弥补传统交互方式的不足。基于视觉和手势识别研究正处于蓬勃发展的阶段,仍存着的许多值得研究的问题。研究基于视觉的动态手势识别对于构建更加好友的人机交互界面很有意义。

二、手势识别概述 2.1、手势识别的概念 手势是姿势的一个子集,姿势这个概念没有精确的定义。一般认为,手势概念经过人的手转化为的手势动作,观察者看到的是手势动作的图像。手势的产生过程如图2-1所示。 图2-1 手势的产生过程 手势识别的过程则找一个从图像V到概念动作G的变换而,如图2-2所示。

2.2、手势识别流程 随着计算机的发展,人机交互技术由传统的鼠标键盘时代发展到了以语音输入、动作识别等技术为代表的自然交互时代n1。特别是视觉计算技术的发展,使计算机获得了初步视觉感知的能力,能“看懂”用户的动作。手势识别作为一种直观自然的输入方式,把人们从传统接触性的输入装置中解放出来,可以以一种更自然的方式与计算机交互,使计算机界面变得更加容易。 手势主要分为静态手势和动态手势两种,动态手势可以看作是连续的静态手势序列。动态手势具有丰富和直观的表达能力,与静态手势结合在一起,能创造出更丰富的语义。利用动态手势识别构建新型的交互界面,是新一代的人机交互界面对输入方式自然性的要求,可以弥补传统交互方式的不足。基于视觉和手势识别研究正处于蓬勃发展的阶段,仍存着的许多值得研究的问题。研究基于视觉的动态手势识别对于构建更加好友的人机交互界面很有意义。

关于计算机视觉的手势识别综述

关于计算机视觉的手势识别综述 蒋指挥 (江苏科技大学江苏镇江 213022) 摘要:计算机技术的高速发展也产生了许多新领域,在此对以计算机视觉为基础的手势检测识别技术展开综述。主要阐述该技术的发展历程、实现方法、研究现状以及其存在的不足之处和发展方向。结果表明简单的可穿戴设备的手势识别和深度视觉传感器的手势识别和多方法交叉融合的手势识别是未来该领域的发展方向。 关键词:计算机视觉;手势识别;人机交互 A survey of gesture recognition in computer vision//Jiang Zhi Hui Abstract;With the rapid development of computer technology, a lot of new fields have been developed. In this paper, the technology of gesture detection and recognition based on computer vision is reviewed. This paper describes the development of the technology, the realization method, the research status and its shortcomings and development direction. The results show that the simple wearable device for hand gesture recognition and depth vision sensor for hand gesture recognition and multi method cross fusion for gesture recognition is the future direction of the development of the field. Key words:Computer vision; gesture recognition; human-computer interaction 计算机在我们的生活中越来越不可或缺,我们同时也对计算机提出了更高的要求,计算机视觉的手势识别正是对计算机应用拓展的重要途径,例如现在的VR技术,就是应用了手势识别才实现的。ABIResearch公司高级分析师约书亚·弗拉德(JoshuaFlood)指出:“免提操作或手势识别很快将成为高端旗舰智能手机、媒体平板电脑和智能眼镜区别于其他同类产品的一个关键因素。三星电子最新推出银河S4已经将这项技术用于其手机中,并以其全新的用户体验获得用户交口称赞。此外,在一系列新型智能眼镜产品即将发布之时,不难想象这类技术将被采用。”其实手势识别技术涵盖了许多领域,比如物理学、生物学等,实现手势识别的方式有很多种从一开始的二维手型识别、二维手势识别到后来的三维手势识别,正是计算机视觉技术的发展使得手势识别的实现方式更加多样。但目前的技术仍然很繁琐,冗杂的可穿戴设备就直接影响了使用者的舒适感,其还有很大的发展空间。 1、手势识别的发展历程及其实现方法

几个Word经典实用技巧

几个Word经典实用技巧 现在是讲效率的年代,使用Word来进行平时的办公处理也是一样,那么,我们怎样才能够在Word中“快”起来呢?那就请这位作者给我们带来的Word中快速操作的10个技巧,小编看完后也觉得相当实用。 1.快速定位光标位置 用WPS编辑文件时有一个特点,就是当你下次打开一WPS文件时,光标会自动定位到你上一次存盘时的位置。不过,Word却没有直接提供这个功能,但是,当我们在打开Word文件后,如果按下Shift+F5键您就会发现光标已经快速定位到你上一次编辑的位置了。 小提示:其实Shift+F5的作用是定位到Word最后三次编辑的位置,即Word会记录下一篇文档最近三次编辑文字的位置,可以重复按下Shift+F5键,并在三次编辑位置之间循环,当然按一下Shift+F5就会定位到上一次编辑时的位置了。 2.快速插入当前日期或时间 有时写完一篇文章,觉得有必要在文章的末尾插入系统的当前日期或时间,一般人是通过选择菜单来实现的。其实我们可以按Alt+Shift+D键来插入系统日期,而按下Alt+Shift+T组合键则插入系统当前时间,很快! 3.快速多次使用格式刷

Word中提供了快速多次复制格式的方法:双击格式刷,你可以将选定格式复制到多个位置,再次单击格式刷或按下Esc键即可关闭格式刷。 4.快速打印多页表格标题 选中表格的主题行,选择“表格”菜单下的“标题行重复”复选框,当你预览或打印文件时,你就会发现每一页的表格都有标题了,当然使用这个技巧的前提是表格必须是自动分页的。 5.快速将文本提升为标题 首先将光标定位至待提升为标题的文本,当按 Alt+Shift+←键,可把文本提升为标题,且样式为标题1,再连续按Alt+Shift+→键,可将标题1降低为标题2、标题3……标题9。 6.快速改变文本字号 Word的字号下拉菜单中,中文字号为八号到初号,英文字号为5磅到72磅,这对于一般的办公人员来说,当然已经绰绰有余了。但在一些特殊情况下,比如打印海报或机关宣传墙报时常常要用到更大的字体,操作起来就有些麻烦了。其实,我们完全也可以快速改变文本的字号:先在Word中选中相关汉字,然后用鼠标单击一下工具栏上的字号下拉列表框,直接键入数值,即可快速改变您的字体大小。而且这个技巧在Excel和WPS 2000/Office中同样

基于3D 体感技术的动态手势识别

第27卷第4期2012年8月 光电技术应用 ELECTRO-OPTIC TECHNOLOGY APPLICATION Vol.27,No.4August ,2012 随着机器智能领域的迅猛发展,手作为人身体上最灵活的一个部位及人机交互的一个媒介,得到越来越多的应用。因此基于手势识别的各种应用也是层出不穷。手势是一种自然而直观的人际交流模式。手势识别也理所当然地成为了实现新一代人机交互不可缺少的一项关键技术。然而,由于手势本身具有的多样性(包括肤色、形态的差异性)、多义性(不同手势具有不同的意义)、以及时间和空间上的差异性(会受到光照等因素的影响)等特点,加之人手是复杂变形体及视觉本身的不适定性,因此基于视觉的手势识别是一个极富挑战性并具有很大应用空间的研究方向[1] 。 1手势识别技术的发展 手势识别分为两种,一种是静态的手势识别,即在 摄像头下检测到某个手势时就给出命令。另一种是动态手势识别,即能够识别手做的一些动作。随着3D 体感技术的出现,手势识别进入一个全新的领域。1.1静态手势识别 静态手势识别的常用方法主要有:基于模版匹配的,用边缘特征像素点作为识别特征,并利用Hausdorff 距离模板匹配完成静态手势识别[2];基于SVM 支持向量机,通过皮肤颜色模型进行手势分割, 并用傅里叶描述子描述轮廓,采用针对小样本特别有效且范化误差有界的最小二乘支持向量机(LS -SVM )作为分类器进行手势识别[3]以及集合模版匹配和机器学习理论的手势识别方法[4]等。但由于静态手势识别技术应用的局限性较大,不够灵活,使用人数在减少。 收稿日期:2012-06-24 作者简介:淦创(1990-),男,辽宁锦州人,大学本科,研究方向为计算机图像处理. ·信号与信息处理· 基于3D 体感技术的动态手势识别 淦 创 (北京航空航天大学,北京100191) 摘要:提出了一种基于3D 体感机Kinect 的图像处理手势识别算法,通过深度图像和骨骼图像的方法实现动态手势识别。首先在Kinect 提供的骨骼图像中20个骨点中,选取2个离手部最近的骨骼点,通过追踪这两个骨骼点的位置来实现对手部的追踪,再通过判断手部的深度(即其相对于摄像头的距离)的变化来实现动态手势识别。 关键词:深度图像;骨骼图像;手部追踪;动态手势识别中图分类号:TN94 文献标识码:A 文章编号:1673-1255(2012)04-0055-04 Dynamic Gesture Recognition Based on 3D Kinect GAN Chuang (Beijing University of aeronautics and astronautics,Beijing 100191,China ) Abstract :A kind of gesture recognition algorithm of image processing based on 3D Kinect is proposed.The dynamic gesture recognition algorithm is performed by skeleton images and depth images.At first,two skeleton points which are nearest to hands are choosen from 20skeleton points in a skeleton image.The process of tracking hands is performed by tracking the positions of the two skeleton points.Then the dynamic gesture recognition pro?cess is realized by the change of depths of hands (the distance between a hand and a camera). Key words :depth image;skeleton image;hands tracking;dynamic gesture recognition

手势识别---人工神经网络

手势识别---人工神经网络 一.手势识别综述 随着计算机性能的逐步提高和各领域对计算机使用的不断深入,人与计算机的交互活动越来越成为人们日常生活中的一个重要组成部分。鼠标和键盘等传统的的人机交互方式越来越显示出它们的局限性,尤其在虚拟现实、增强现实和可穿戴计算等新兴的应用中变得更为明显。近年来,手势交互作为一种新的人机交互方式被越来越多地采用,特别是基于视觉的手势交互,由于其简单、自然、直观和非侵犯性等特性已成为手势交互的重要方式之一。 手势是一种自然、直观、易于学习的人机交互手段。以人手直接作为计算机的输入设备,人机间的通讯将不再需要中间的媒体,用户可以简单地定义一种适当的手势来对周围的机器进行控制。手势研究分为手势合成和手势识别,前者属于计算机图形学的问题,后者属于模式识别的问题。手势识别技术分为基于数据手套和基于计算机视觉两大类。 1.1 手势识别的发展 最初的研究主要集中在做一种专用硬件设备来进行输入。例如数据手套,即人可以戴上一个类似于手套的传感器,计算机通过它可以获:取手的位置、手指的伸展状况等丰富信息。如l993年B.Thamas等人做的自由手遥控目标的系统是凭借数据手套作为输入的媒介,但这需要实验者呆上一个专用设备。之后人们又致力于标记手势的研究,即通过在手上作标记,例如在手腕和手指处贴上或画上特殊颜色的圆点,用来识别手势。这虽然给识别带来了方便,但同样给实验者带来麻烦。最后人们终于把注意力集中到自然手上,通过专用加速硬件和脱机训练,一些研究者成功地研制了手势系统,但其识别的手势仅限几种。例如Freeman 和Roth等人提出的基于方向直方图的手势识别系统。l994年,作

简易常用-Word文档使用技巧方法大全(超全)

Word文档使用技巧方法大全 Word2000、2003、2007、2010快捷键使用大全总结常用快捷键 快捷键作用 一、字体类 Ctrl+B 使字符变为粗体 Ctrl+I 使字符变为斜体 Ctrl+U 为字符添加下划线 Ctrl+Shift+D 双下划线 Ctrl+Shift+< 缩小字号 Ctrl+Shift+> 增大字号 Ctrl+] 逐磅增大字号 Ctrl+[ 逐磅减小字号 Ctrl+Shift+F 改变字体 Ctrl+Shift+P 改变字号 Ctrl+D 改变字符格式("格式"菜单中的"字体"命令) Shift+F3 切换字母大小写(一次首字母变成大写,两次单词变成大写) CTRL+SHIFT+A 将所选字母设为大写 二、格式类 Ctrl+Shift+C 复制格式 Ctrl+Shift+V 粘贴格式 Ctrl+1 单倍行距(1为主键盘的数字键)

Ctrl+2 双倍行距 Ctrl+5 1.5 倍行距 Ctrl+0 在段前添加一行间距 Shift+F1(单击)需查看文字格式了解其格式的文字 Ctrl+E 段落居中 Ctrl+J 两端对齐 Ctrl+L 左对齐 Ctrl+R 右对齐 Ctrl+Shift+J 分散对齐 Ctrl+M 左侧段落缩进 Ctrl+Shift+M 取消左侧段落缩进 Ctrl+T 创建悬挂缩进 Ctrl+Shift+T 减小悬挂缩进量 Ctrl+Shift+S 应用样式 Ctrl+Shift+N 应用"正文"样式 Alt+Ctrl+1 应用"标题1"样式 Alt+Ctrl+2 应用"标题2"样式 Alt+Ctrl+3 应用"标题3"样式 三、编辑和文字移动 Backspace 删除左侧的一个字符 Ctrl+Backspace 删除左侧的一个单词 Delete 删除右侧的一个字符 Ctrl+Delete 删除右侧的一个单词 F2(然后移动插入移动选取的文字或图形点并按Enter键)

基于摄像头的手势识别技术初步版本

基于摄像头的手势识别技术 1、手势识别的概念 手势是姿势的一个子集,姿势这个概念没有精确的定义。一般认为,手势概念经过人的于转化为的于势动作,观察者看到的是于势动作的图像雎1。手势的产生过程如图1-1所示。 图1-1 手势识别的过程则找一个从图像V到概念动作G的变换而,如图下所示。 2、手势识别流程 手势识别流程包手势图像获取、手势分割、手势特征提取、手势识别四大部分,如图2-1所示。 图2-1

3. 手势建模 在手势识别框架中,手势模型是一个最基本的部分。根据不同的应用背景,于势识别采用的模型会有不同,而对于不同的手势模型,采用的手势检测与跟踪算法、特征提取、识别技术也会有差别。手势建模主要分为基于表观的手势模型与基于三维的于势模型。 基于表观的手势建模是一种二维建模,从二维平面观察得到的平面图像信息描述于的特征。 基于表观的手势模型主要包括基于颜色的模型与基于轮廓的模型两种。 基于颜色的手势模型是把手势图像看作像素颜色的集合,通过提取手部的颜色的特征来描述手势。 基于颜色的手势模型的常用特征是颜色直方图。基于轮廓的手势模型是把手看作一个轮廓,通过提取手部图像中手的轮廓的几何特征来描述手势。 4. 手势检测与跟踪 手势检测与跟踪是手势识别处理流程中最前端的处理部分,它处理从摄像头获取到手势图像(序列),从中检测和分割手势对象。如果是动态手势识别,还要对手进行跟踪。 基于运动信息的方法: 基于运动信息的方法是假设在视频中只有手是运动物体。 其中一种方法是背景减法。 它要求背景静止不变,把视频中的每帧与背景相减,背景相同的部分变为零,不同的部分就认为是运动的物体,即手。

word使用技巧大全

1 常用快捷键 Ctrl+C 复制所选文本或对象 Ctrl+C连续2次调出剪切板 Ctrl+X 剪切所选文本或对象 Ctrl+V 粘贴文本或对象 Ctrl+] 逐磅增大字号 Ctrl+[ 逐磅减小字号 Shift+Enter 换行符 Ctrl+Enter 分页符 Ctrl+A 包含整篇文档 F1 显示当前程序或者winodws的帮助内容。 F2 选中一个文件“重命名” F3 在桌面时打开“查找:所有文件”对话框 ALT+TAB 切换当前程序 ALT+ESC 切换当前程序 PRINTSCREEN 将当前屏幕以图象方式拷贝到剪贴板ALT+PRINTSCREEN 将当前活动程序窗口以图象方式拷贝到剪贴板 winodws键或CTRL+ESC 打开开始菜单 Windows徽标键+TAB键在任务栏上的按钮间循环 Windows徽标键+E键启动“我的电脑” Windows徽标键+D键快速显示桌面 Windows徽标键+R键执行“运行”命令 Windows徽标键+F键搜索文件或者文件夹 Windows徽标键+F1键显示Windows帮助 Windows徽标+PRINTSCREEN 将屏幕复制到剪贴板(包括鼠标光标)Windows徽标+SCROLLLOCK 将屏幕复制到剪贴板(不包括鼠标光标)

2 图形技巧 2.1 绘制图形的技巧 2.1.1 画直线 画直线的同时按着Shift键,将可以画出15°、30°、45°、60°、75°等具有特殊角度的直线。按住Ctrl键可画出自中间向两侧延伸的直线,同时按住这两个键则可画出自中间向两侧延伸的具有特殊角度的直线。 2.1.2 画弧 按住Shift键的同时可画出45度圆弧(画圆弧方法:打开绘图工具栏,单击“自选图形/基本形状/弧形”),按住Ctrl键可画出自中间向两侧延伸的圆弧,同时按住这两个键则可画出自中间向两侧延伸的45°圆弧,按住Alt键可画出一端固定的圆弧,同时按住Ctrl和Alt键则可画出一端固定的45°圆弧。 2.1.3 画矩形 按住Shift键可绘制出一个特殊的矩形——正方形,按住Ctrl键可绘出自中间向四周延伸的矩形,同时按住这两个键则可画出自中间向四周延伸的正方形。画圆时与此类似。 由此可见结合键盘画图的奇妙效果。 2.2 选择图形的技巧 如果需要选择部分图形,则可在按住Shift键的同时依次进行选择或单击绘图工具栏上的“选择对象”按钮,然后用鼠标画出一个框将所需要的图形罩住即可。 如果是各图形层叠在一起的情况,则可以首先选中最上面的图形,然后按Tab键或“Shift+Tab”组合键依次选择即可。 小提示:如果你发现某图形选择起来很困难(鼠标变不成十字形状),这种情况常发生在多个图形混杂在一起的情况,同样点击“选择对象”按钮后你会发现选择很容易。

基于手势识别的人机交互综述

基于手势识别的人机交互综述 摘要:近年来,得益于虚拟现实、人机界面技术、计算机视觉等领域的发展,基于手势识别的人机交互技术得到大力的推动。本文就基于手势识别的人机交互技术展开综述。首先概括手势交互的涉及领域,回顾其发展史和国内外研究现状。接着阐明它的基本界定和分类,并在此基础上分析其热点关键技术。然后实例讨论了几种类型手势交互的典型应用。最后给出了结论。 关键词:虚拟现实;手势交互;计算机视觉;手势识别;特征跟踪 1.引言 人机交互技术通过输入、输出设备,以有效的方式实现交互主体与交互客体的对话。当前的人机交互技术已经从过去交互主体适应交互客体,发展为交互客体不断地适应交互主体的习惯和以交互主体为中心的新阶段[1,2,3,4]。以用户为中心的,新型、自然的人机交互技术逐渐成为开发者和科研工作者的关注重点。这类交互方式要求输入与输出能够最大限度地符合交互主体的行为习惯,并能够在交互主体的脑中顺利构建交互环路。由于手势具有极强的信息表述功能,加之人手操作行为本身就是人与世界相互作用的主要方式,因此,基于手识别的人机交互技术相关研究有着重要的理论价值和应用价值。基于手势识别的人机交互技术涉及计算机科学、认知心理学、行为学等诸多方面的知识。本文不能面面俱到,仅就手势交互的基本问题:手势语义的分类,以及当前发展概况、研究热点技术和典型系统应用等相关问题进行综述。 2.研究现状 目前,基于视觉的手势交互已被广泛的研究,由于手势本身的多义性及时空差异性,加之手形变的高维度及视觉问题本身的不适定性,基于视觉的手势识别一直是一项极富挑战性的究课题[5]。需要解决的核心问题是对手形的识别,对手势的跟踪等。传统的方法主要分为两大类:(1)基于模型(model-base)的方法;(2)基于表征(appearance-based)的方法[6]。这些方法及其衍生算法极大程度地依赖于计算机科学中虚拟现实、机器视觉、模式识别、人机交互等多个领域的交流与合作。相关的国际会议:CHI、ICCV、CVPR、ICAT、IEEE VR 为研究者提供了一个能充分交流的空间,并吸引了越来越多的研究人员共同参与合作。此外,学科之间的交流也吸引了心理学研究人员的共同参与。他们以从用户为中心出发,为基于手势交互研究和开发提出了宝贵意见[7]。纵观手势交互的发展历程,其研究重点也从早期简单的系统框架、低层特征提取[8]、手形模板匹配[8]等问题转变到关节式物体跟踪[9,10, 11]、跟踪性能评价[12]、操作型手势解析[14]等问题上。我国在基于手势识别的人机交互领域的研究近年来得到了长足的发展。研究机构集中在国内的研究所和高校的科研单位。目前国内手势交互的研究成果主要有:中国科学院软件研究所[15]的研究中,对二阶自回归过程动力学模型(Auto-Regressive Process, ARP)进行训练和学习,进而建立基于ARP 的预测模型,实现了人手运动的鲁棒性跟踪,在出现跟踪丢失的情况下在后续序列中可以自动恢复正确跟踪。中国科学院自动化研究所模式识别实验室提出一种基于区域的多连接体(手指)的三维运动跟踪算法[13],用多约束融合的方法以及手指的运动特性,建立多刚体的三维运动描述,通过三类基本约束条件,把跟踪问题归结为一个约束误差优化问题。清华大学的崔锦实博士,提出一种基于回归-优化方法的关节式物体的姿态估计方法[16]。该方法把回归分析与全局优化搜索相结合,保证了估计的精度和连续性;针对现有滤波器在高维非线性多峰

WORD使用技巧大全(史上最强哦)

1.问:WORD里边怎样设置每页不同的页眉?如何使不同的章节显示的页眉不同? 答:分节,每节可以设置不同的页眉。文件——页面设置——版式——页眉和页脚——首页不同 2.问:请问word中怎样让每一章用不同的页眉?怎么我现在只能用一个页眉,一改就全部改了?答:在插入分隔符里,选插入分节符,可以选连续的那个,然后下一页改页眉前,按一下“同前”钮,再做的改动就不影响前面的了。简言之,分节符使得它们独立了。这个工具栏上的“同前”按钮就显示在工具栏上,不过是图标的形式,把光标移到上面就显示出”同前“两个字来了 3.问:如何合并两个WORD文档,不同的页眉需要先写两个文件,然后合并,如何做?答:页眉设置中,选择奇偶页不同/与前不同等选项 4.问:WORD编辑页眉设置,如何实现奇偶页不同? 比如:单页浙江大学学位论文,这一个容易设;双页:(每章标题),这一个有什么技巧啊?答:插入节分隔符,与前节设置相同去掉,再设置奇偶页不同 5.问:怎样使WORD文档只有第一页没有页眉,页脚?答:页面设置-页眉和页脚,选首页不同,然后选中首页页眉中的小箭头,格式-边框和底纹,选择无,这个只要在“视图”——“页眉页脚”,其中的页面设置里,不要整个文档,就可以看到一个“同前”的标志,不选,前后的设置情况就不同了。 6.问:如何从第三页起设置页眉?答:在第二页末插入分节符,在第三页的页眉格式中去掉同前节,如果第一、二页还有页眉,把它设置成正文就可以了

●在新建文档中,菜单—视图—页脚—插入页码—页码格式—起始页码为0,确定; ●菜单—文件—页面设置—版式—首页不同,确定; ●将光标放到第一页末,菜单—文件—页面设置—版式—首页不同—应用于插入点之后,确定。第2步与第三步差别在于第2步应用于整篇文档,第3步应用于插入点之后。这样,做两次首页不同以后,页码从第三页开始从1编号,完成。 7.问:WORD页眉自动出现一根直线,请问怎么处理?答:格式从“页眉”改为“清除格式”,就在“格式”快捷工具栏最左边;选中页眉文字和箭头,格式-边框和底纹-设置选无 8.问:页眉一般是---------,上面写上题目或者其它,想做的是把这根线变为双线,WORD中修改页眉的那根线怎么改成双线的?答:按以下步骤操作去做: ●选中页眉的文字,包括最后面的箭头 ●格式-边框和底纹 ●选线性为双线的 ●在预览里,点击左下小方块,预览的图形会出现双线 ●确定▲上面和下面自己可以设置,点击在预览周围的四个小方块,页眉线就可以在不同的位置

2019年全球主要手势识别技术系统细分行业分析

2019年全球主要手势识别技术系统细分行业分析 1、以数据手套为输入设备的手势识别系统 目前使用广泛的人机交互设备是数据手套(DataGlove)。数据手套反馈各关节的数据,并经一个位置跟踪器返回人手所在的三维坐标,从而来测量手势在三维空间中的位置信息和手指等关节的运动信息。这种系统可以直接获得人手在3D空间中的坐标和手指运动的参数,数据的精确度高,可识别的手势多且辨识率高。缺点是数据手套和位置跟踪器价格昂贵,有时也会给用户带来不便,如持戴的手部出汗等。 由于神经网络很适合用快速、交互的方式进行训练,可用于静态手势和动态手势的输入,网络连接的权值也可以根据情况调整,各种用户都能适应手势识别系统。它的缺点是对设备的依赖性高,一旦需更换数据手套,则须重新训练网络。 2、以摄像机为输入设备的手势识别系统 输入设备可用单个或多个摄像头或摄像机来采集手势信息,经计算机系统分析获取的图像来识别手势。摄像头或摄像机的价格相对较低,但计算过程较复杂,其识别率和实时性均较差。其优点是学习和使用简单灵活,不干扰用户,是更自然和直接的人与计算机的交互方式。 目前较成功的实现手势识别的系统,均为依据手掌轮廓区域的几何特征,如手的重心及轮廓、手指的方向和形状等进行分析完成识别,或根据手掌的其他特征,如手掌的运动轨迹、手掌的肤色及纹理等进行分析识别。 手势模型的选取在手势识别系统中,对确定识别范围起着关键性作用。模型的选取往往跟具体应用有关, 不同的应用目的选取不同的模型。比如,对于某个给定的目的,可以先建立简单粗糙的模型,而后再跟据需要建立精细有效的手势模型,这对于实现自然的人机交互是必须的,可使绝大部分手势都能被系统正确的识别出来。 目前,手势模型有基于表观的手势模型和基于3D模型的手势模型。前者通过分析手势在图像(序列)里的表观特征给手势建模,它是建立在手(臂)图像的表观之上的。后者的建模方法则略有不同,其先对手和臂的运动姿态建模,然后再估计手势模型参数。 图表1:同一手势的5种模型图 资料来源:蒂华森咨询

表情识别技术综述

表情识别技术综述 摘要:表情识别作为一种人机交互的方式,成为研究的热点。基于对表情识别的基本分析,文章重点介绍了面部表情识别的国内外研究情况和面部表情特征的提取方法。 关键词:表情识别;特征提取;表情分类。 前言:进入21世纪,随着计算机技术和人工智能技术及其相关学科的迅猛发展,整个社会的自动化程度不断提高,人们对类似于人和人交流方式的人机交互的需求日益强烈。计算机和机器人如果能够像人类那样具有理解和表达情感的能力,将从根本上改变人与计算机之间的关系,使计算机能够更好地为人类服务。表情识别是情感理解的基础,是计算机理解人们情感的前提,也是人们探索和理解智能的有效途径。如果实现计算机对人脸表情的理解与识别将从根本上改变人与计算机的关系,这将对未来人机交互领域产生重大的意义。 正文:一、面部表情识别的国内外研究情况 面部表情识别技术是近几十年来才逐渐发展起来的,由于面部表情的多样性和复杂性,并且涉及生理学及心理学,表情识别具有较大的难度,因此,与其它生物识别技术如指纹识别、虹膜识别、人脸识别等相比,发展相对较慢,应用还不广泛。但是表情识别对于人机交互却有重要的价值,因此国内外很多研究机构及学者致力于这方面的研究,并己经取得了一定的成果。 进入90年代,对面部表情识别的研究变得非常活跃,吸引了大量的研究人员和基金支持。美国、日本、英国、德国、荷兰、法国等经济发达国家和印度、新加坡都有专门的研究组进行这方面的研究。其中MIT的多媒体实验室的感知计算组、CMu、Ma州大学的计算机视觉实验室、Standford大学、日本城蹊大学、大阪大学、ArR研究所的贡献尤为突出。 国内的清华大学、哈尔滨工业大学、中科院、中国科技大学、南京理工大学、北方交通大学等都有专业人员从事人脸表情识别的研究,并取得了一定的成绩。在1999年的国家自然科学基金中的“和谐人机环境中情感计算理论研究”被列为了重点项目。同时中国科学院自动化所、心理所以及国内众多高校也在这方面取得了一定的进展。2003年,在北京举行了第一届中国情感计算与智能交互学术会议,会议期间集中展示了国内各研究机构近几年来从认知、心理、模式识别、系统集成等多种角度在情感计算领域取得的研究成果,一定程度上弥补了我国这方面的空白。国家“863”计划、“973”项目、国家自然科学基金等也都对人脸表情识别技术的研究提供了项目资助。 二、面部表情特征的提取方法 表情特征提取是表情识别系统中最重要的部分,有效的表情特征提取工作将使识别的性能大大提高,当前的研究工作也大部分是针对表情特征的提取。 目前为止的人脸面部表情特征提取方法大都是从人脸识别的特征提取方法别演变而来,所用到的识别特征主要有:灰度特征、运动特征和频率特征三种阎。灰度特征是从表情图像的灰度值上来处理,利用不同表情有不同灰度值来得到识别的依据。运动特征利用了不同表情情况下人脸的主要表情点的运动信息来进行识别。频域特征主要是利用了表情图像在不同的频率分解下的差别,速度快是其显著特点。在具体的表情识别方法上,分类方向主要有三个:整体识别法和局部识别法、形变提取法和运动提取法、几何特征法和容貌特征法。 整体识别法中,无论是从脸部的变形出发还是从脸部的运动出发,都是将表情人脸作为一个整体来分析,找出各种表情下的图像差别。其中典型的方法有:基于特征脸的主成分分析(prineipalComponentAnalysis,pCA)法、独立分量分析法(Indendent ComPonent Analysis,ICA)、Fisher线性判别法(Fisher’s Linear Discriminants,FLD)、局部特征分析(LoealFeatureAnalysis,LFA)、Fishe诞动法(Fisher^ctions)、隐马尔科夫模型法(HideMarkovModel,HMM)和聚类分析法。

相关主题