搜档网
当前位置:搜档网 › 基于视觉手势识别的研究_综述

基于视觉手势识别的研究_综述

基于视觉手势识别的研究_综述
基于视觉手势识别的研究_综述

基于视觉手势识别的研究—综述

任海兵,祝远新,徐光 ,林学 ,张哓平

(清华大学计算机科学与技术系,北京100084)

摘 要: 手势是一种自然而直观的人际交流模式.基于视觉的手势识别是实现新一代人机交互所不可缺少的一

项关键技术.然而,由于手势本身具有的多样性、多义性、以及时间和空间上的差异性等特点,加之人手是复杂变形体及视觉本身的不适定性,因此基于视觉的手势识别是一个极富挑战性的多学科交叉研究课题.本文从手势建模、手势分析和手势识别等三个方面综述了基于视觉手势识别的研究现状及其应用.

关键词: 手势识别;人机交互;计算机视觉中图分类号: TP24216 文献标识码: A 文章编号: 037222112(2000)022*******

Vision 2Ba sed Recognition of Hand Ge sture s :A Survey

RE N Hai 2bing ,ZH U Y uan 2xin ,X U G uang 2y ou ,LI N Xue 2yin ZH ANG X iao 2ping

(Dept.o f Computer Science and Technology ,Tsinghua University ,Beijing 100084,China )

Abstract : Hand gestures play a natural and intuitive communication m ode for all human dialogs.The ability for computer to vi 2sually recognize hand gestures is essential for future human 2computer interaction.H owever ,vision 2based recognition of hand gestures is an extremely challenging interdisciplinary project due to following three reas ons :(1)hand gestures are rich in diversities ,multi 2mean 2ings ,and space 2time varieties ;(2)human hands are complex non 2rigid objects ;(3)computer vision itself is an ill 2posed problem.This paper presents a survey on visual recognition of hand gestures from points of m odeling ,analysis and recognition techniques of vision 2based hand gestures recognition.

K ey words : hand gestures recognition ;human 2computer interaction ;computer vision

1 引言

人与计算机的交互活动越来越成为人们日常生活的一个重要组成部分.特别是最近几年,随着计算机技术的迅猛发展,研究符合人际交流习惯的新颖人机交互技术变得异常活跃,也取得了可喜的进步.这些研究包括人脸识别、面部表情识别、唇读、头部运动跟踪、凝视跟踪、手势识别、以及体势识别等等.总的来说,人机交互技术已经从以计算机为中心逐步转移到以人为中心,是多种媒体、多种模式的交互技术.

基于视觉的手势识别研究正是顺应了这一潮流.然而,不同文化背景对手势的定义是有区别的.从手势识别的角度考虑,本文把手势定义为“手势是人手或者手和臂结合产生的各种姿势或动作,它包括静态手势(指姿态,单个手形)和动态手势(指动作,由一系列姿态组成)”.由于手势本身具有的多样性、多义性以及时间和空间上的差异性等特点,加之人手是复杂变形体以及视觉本身的不适定性,因此基于视觉的手势识别是一个多学科交叉的、富有挑战性的研究课题.为了寻找突破口,

必须研究人际交流中的手势用法,从而确定合理的研究范围.

一个基于视觉的手势识别系统的总体构成如图1所示.首先,通过一个或多个摄像机获取视频数据流.接着,系统根据手势输入的交互模型检测数据流里是否有手势出现.如果有,则把该手势从视频信号中切分出来.然后,选择手势模型进行手势分析,分析过程包括特征检测和模型参数估计.识别阶段,根据模型参数对手势进行分类并根据需要生成手势描述.最后,系统根据生成的描述去驱动具体应用.限于篇幅,本文仅从手势建模、手势分析和手势识别等三个方面介绍手势识别的研究及其应用.在文章的结尾给出一些基本结论.

图1 连续动态手势识别系统构成图

收稿日期:1999206201;修订日期:1999209210

基金项目:国家自然科学基金(N o.69873022)资助项目

 

第2期2000年2月

电 子 学 报

ACT A E LECTRONICA SINICA V ol.28 N o.2

Feb. 2000

 

图2 手势模型分类 图3 表示同一个手姿态的各种人手模型(a)有纹理的3D体模型

(b)3D网格模型(c)3D骨架模型(d)二值影像(e)轮廓

 

2 手势建模

手势模型对于手势识别系统至关重要,特别是对确定识别范围起关键性作用,模型的选取根本上取决于具体应用.对于某个给定的应用,一个非常简单并且粗糙的模型(例如,文献[5]使用图像梯度方向直方图去跟踪人手以及识别静态手势)可能就是充分的.然而,如果要实现自然的人机交互,那么必须建立一个精细有效的手势模型(例如,文献[16]使用了3D人手模型),使得识别系统能够对用户所做的绝大多数(如果不是所有的)手势作出正确的反应(识别或拒识).从目前的文献来看,几乎所有的手势建模方法都可以归结为两大类:基于表观的手势建模和基于3D模型的手势建模.基于表观的手势模型是建立在手(臂)图像的表观之上,它通过分析手势在图像(序列)里的表观特征去给手势建模.基于3D模型的手势建模方法考虑了手势产生的中间媒体(手和臂),一般遵循两步建模过程:首先给手和臂的运动以及姿态建模,然后从运动和姿态模型参数估计手势模型参数.图2对这两类手势模型进行了进一步的分类.图3给出表示同一种手姿态的几种模型,可以在这些人手模型的基础上进一步建立相应的手势模型.

211 基于3D模型的手势模型

基于3D手(臂)模型的手势模型又可以分为体模型、网格模型、几何模型以及骨架模型.人体3D体模型主要用于跟踪和识别身体姿态[15],跟踪和识别的基本方法是基于合成的分析方法,简短地说就是首先合成人体的3D模型,然后改变模型的参数直到模型和真实人体映射出同样的视觉图像,从而分析身体姿态.然而,即使这样的模型相当成熟,它们还是太复杂以致于不能实时地渲染.更适合计算机实时处理的方法是使用简单的3D几何结构去给人体建模.象广义锥和超二次曲面这样一类包含圆柱体、球体、椭圆体以及超矩形的结构常常用来近似身体某一部分,例如指节、前臂、或上臂[13,15].这些几何结构的参数相对简单一些,例如只用3个参数(高度、半径以及颜色)就可以完全地描述一个圆柱体.然后,把简单的身体部分模型连结起来就可以得到象手、臂或腿等更复杂的身体部分3D模型.使用手(臂)3D模型时存在两个主要问题:其一,参数空间的维数高;其二,通过视觉技术获取这些模型的参数困难重重并且非常复杂.

最常使用的3D模型是3D骨架模型,其参数是经过简化的关节角度参数和指节长度.人手的物理特性可以为3D骨架模型提供两组约束:静态约束(关节角度范围)和动态约束(运动依赖关系).文献[16]使用了26个自由度的骨架模型并且利用了这样的约束条件.文献[17]使用了带有类似约束条件的27个自由度的骨架模型.

212 基于表观的手势模型

第一类基于表观的手势模型使用2D灰度图像本身建立手势模型.例如,文献[11]把人手的完整图像序列作为手势模板.在手指跟踪应用里,仅仅手指的图像也可以用作模板[8].文献[4]提出运动历史图像作为手势模型.运动历史图像是指在某个时间区间上累加图像序列里各单个像素点的运动位置而形成的2D图像.

第二类基于表观的手势模型建立在手(臂)的可变形2D 模板的基础上.可变形2D模板是物体轮廓上某些点的集合,一般把它用作插值节点去近似物体轮廓.模板由平均点集合、点可变性参数,以及所谓的外部变形构成.平均点集合描述了某一组形状的“平均”形状,点可变性参数描述了允许的形变.通常称这两组参数为内部参数.外部变形或者外部参数描述了一个可变形模板的全局运动,例如旋转、平移等.基于可变形模板的人手模型通常被用于人手跟踪[7].文献[1]基于可变形模板跟踪人手以及进行手势识别.最近,文[14]把2D可变形模板扩展成3D可变形模型(3D点分布模型)用于手势跟踪.

第三类基于表观的手势模型建立在图像属性的基础上.我们把从图像属性抽取的参数统称为图像属性参数,它们包括:轮廓、边界、图像矩、图像特征向量以及区域直方图特征等等.例如,文献[7]使用了基于边界的轮廓特征.由于图像矩计算简单,因此常被用作图像属性参数.其它常被使用的属性参数还包括Z ernike矩、方向直方图[12]、颜色直方图[5]等等.

第四类基于表观的手势模型通过计算图像运动参数,抽取手势模型参数.这类表观模型主要用在动态手势识别里.例如,文献[6]通过运动边界点以及方差约束计算光流,然后通过向量聚类以及运动平滑性约束抽取手势的运动轨迹,并根据轨迹坐标建立手势模型.文献[10]通过区域相关性计算光流,然后进行光流聚类,把图像中运动区域分割成“运动块”,这些运动块分别对应于手、臂或身体其它部分等.文献[19]提出的时空表观模型也是基于运动图像的.跟上面这些模型不同,他们利用图像的变阶运动参数模型及鲁棒回归分析的方法去估计图像的运动参数,并同时分割出对应的运动区域.然

911

第 2 期任海兵:基于视觉手势识别的研究—综述

后,基于图像运动参数的物理意义以及运动区域的形状特征构造帧间表观特征,最后由帧间表观特征构造手势的时空表观模型.

3 手势分析

311 特征检测

手势分析阶段的任务就是估计选定的手势模型的参数.分析阶段一般由特征检测和参数估计两个串行任务组成.在特征检测过程中,首先必须定位做手势的主体(人手).根据所用的线索不同,可以把定位技术分为基于颜色定位、基于运动定位、以及多模式定位等三种.绝大多数颜色定位技术依赖于直方图匹配[5]或者利用皮肤的训练数据建立查找表的方法[9].基于颜色定位技术的主要缺点是在不同的光照条件下皮肤颜色变化较大,这经常导致未被发现的皮肤区域或者误检测出非皮肤区域.利用限制性背景或者颜色手套[17],使得高效地、甚至实时地定位人手成为可能,然而对用户以及对接口设备施加了明显限制.

基于运动的定位s技术通常跟某些假设一起使用.例如,假设通常情况下只有一个人在做手势,并且手势者相对于背景(静止的)的运动量很小,因此,图像里的主要运动分量通常是手(臂)运动.文献[10,12]就使用了这种定位技术.为了克服利用单个线索定位的局限,基于多线索融合(即多模式)定位技术已经被提出来了.文献[2]中利用颜色、运动、和其它视觉线索的融合;另外,文献[19]基于运动和颜色信息的融合定位人手,达到了较好分割效果.

尽管不同手势模型的参数各不相同,但是用于计算模型参数的图像特征基元通常是非常相似的.常用的图像特征基元包括灰度图像[4,11]、二值影像[16,18]、区域[3、9、10、19]、边界及轮廓[6,13]或者指尖[8,17]等.

312 模型参数估计

3D手模型通常涉及到两组参数:角度参数(关节角度等)和直线参数(指骨长度和手掌尺度等).从检测出的特征去估计这些运动学参数通常包括两个环节:初始参数估计和参数随时间的更新.到目前为止,所有3D人手模型都假设直线参数是预先已知的.这个假设把求解人手关节角度问题转化为逆运动学问题.给定3D终端效应器的3D位置和运动学链的基点,逆运动学的任务就是找出链里的指节之间的关节角度.逆运动学问题本质是病态的,允许有多个解,并且计算量大,因而不能用于实时问题.某些更简单的解决方法是让用户交互式地初始化模型参数[16].一旦估计出人手模型的初始参数,利用某种预测/平滑策略就可以更新参数估计.最常用的策略是卡尔曼滤波和预测.

如前所述,共有四类基于表观的手势模型.基于灰度图像本身的表观模型有许多不同的参数.在最简单的情况下,可以选择模型视图序列作为参数[11],也可以使用序列里各帧图像关于平均图像的特征分解表示.最近文献[4]累积图像序列里的时/空信息,从而形成单个2D图像,即所谓的运动历史图像.然后,基于2D图像描述技术(如几何矩描述或者特征分解)去参数化那些2D图像.基于可变形2D模板表观模型的典型参数是模板节点的均值m和它们的方差v.通过在训练集上进行主成分分析(Primary C omponent Analysis,PC A)可得到模型参数.与可变形模板模型参数相联系的还有外部变形参数(指手或身体在工作区间里的旋转和平移运动).可以在类似于刚体运动估计的框架下估计模型参数的更新,所不同的是可变形模板需要估计由于模板可变性dv而引起的附加位移.基于图像属性表观模型的常用参数是手形几何矩、Z ernike 矩、以及朝向直方图等等.这些图像特征参数易于估计,但是它们对图像中其它非手物体非常敏感.

基于运动图像表观模型的参数包括平移运动参数,旋转运动参数,以及图像变形参数等等.文献[6]通过对图像的平移运动参数进行聚类,抽取人手在图像平面的运动轨迹.文献[3]基于宽基线立体视觉跟踪人手及头部运动,然后把人手在3D空间的平移运动速度作为模型参数.文献[10]中使用的手势模型参数,包括图像块的平移运动以及旋转运动参数.而在文献[19]中提出的时空表观手势模型参数则更丰富,包括平移运动参数、旋转运动参数,膨胀参数、变形参数、以及方位参数等等.

4 手势识别

手势识别就是把模型参数空间里的轨迹(或点)分类到该空间里某个子集的过程.静态手势对应着模型参数空间里一个点,而动态手势则对应着模型参数空间里的一条轨迹,因此它们的识别方法有所不同.静态手势识别算法包括基于经典参数聚类技术的识别和基于非线性聚类技术的识别.

与静态手势不同,动态手势涉及时间及空间上下文.绝大多数动态手势被建模为参数空间里的一条轨迹.不同用户做手势时存在的速率差异、熟练程度会在轨迹的时间轴上引起非线性波动,如何消除这些非线性波动是动态手势识别技术必须克服的一个重要问题.考虑到对时间轴的不同处理,现有的动态手势识别技术可以分归三类:基于隐马尔可夫模型(Hidden Markov M odels,H M M)的识别,基于动态时间规整(Dy2 namic T ime Warping,DT W)的识别,基于压缩时间轴的识别.

在基于H M M的识别算法里,每种手势有一个H M M.可观察符号对应着模型参数空间里的向量(点),例如几何矩向量[9,18],Z ernike矩,特征图像系数向量,或者3D空间的运动速度[3]等等.基于H M M识别技术的优点包括提供了时间尺度不变性,保持了概率框架,以及具有自动分割和分类能力.

DT W方法是具有非线性时间规一化效果的模式匹配算法,使用某种指定属性的非线性规整函数对时间轴上的波动近似建模,通过弯曲其中一个模式的时间轴使之跟另一个模式达到最大程度的重叠(此时的残差距离最小)从而消除两个时空表示模式之间的时间差别.实际上,它是H M M的简化,对于比较简单的时间序列,它们二者是等价的.文献[13]基于DT W匹配两个运动模式.文献[11]假设两个序列的时间终点是一样的,然后利用经过修改的在时间上向后匹配的DT W方法进行弹性匹配.利用DT W算法从时间上对准了两个模式之后,利用规一化的相关运算来寻找两个模式之间的相似性.文献[19]采用的最优动态规划匹配算法也属于基于DT W的识别算法.DT W方法的优点是概念上简单,也比较有效,在测试模式和参考模式之间允许充分的弹性,从而实现正确的分类.

021 电 子 学 报2000年

基于压缩时间轴的识别就是首先利用某种特定属性的函数,把模型参数空间的一条轨迹压缩为单个点(例如在时间方向求和),然后利用静态手势识别算法完成动态手势的识别.文献[4]提出基于运动历史图像的动态手势识别就利用了基于压缩时间轴的识别方法.

5 结论与展望

考虑到手势本身的多样性、多义性、差异性等特点以及技术的局限,在可预见的将来要想从整体上解决一般手势的识别问题是不现实的.为了寻找突破口,必须研究手势分类和人际交流中的手势用法,从而为确定合理的识别范围及建立符合人类行为习惯的交互模型提供指导.

总体上说,现有的手势模型可以归为两大类:基于3D手(臂)模型的手势模型和基于表观的手势模型.原理上,基于3D手(臂)模型的手势模型适合于给所有手势建模,而基于表观的手势模型通常只适用于给交流性手势.然而,一方面,基于3D手(臂)模型的手势模型不仅参数多,计算复杂性高,而且为抽取模型参数而使用的许多近似过程导致模型参数的估计很不可靠.另一方面,基于表观的手势模型的计算复杂性低,易于达到实时.因此,目前绝大部分手势识别系统都采用了基于表观的手势模型.不过,最近随着计算机性能的提高,已经有人开始把经过简化的3D几何模型用于识别一定数量的交流性手势.

成功的手势识别策略应该考虑手势的时间-空间上下文,即考虑手势的语法规则.语法规则既要反映手势的语言学特征,又要反映手势的空间特征.然而,到目前为止只有很少数量的系统使用语法规则.基于单摄像机在复杂背景下实时识别多种手势是手势识别的发展方向.正如鼠标并没有取代键盘一样,手势识别系统并不是为了取代键盘,相反,手势识别将增强现有的人机交互模式,从而实现更直接、更自然、更和谐的人机接口,并且促成一些新的应用,例如手语识别等.研究多模态交互技术已逐渐成为研究人员的共识.英语的语音识别与唇语理解结合起来已成为不少人研究的课题.使用口语与手势接口进行分子结构设计的研究是虚拟现实应用的一个较为成功的例子.

参考文献

[1] T.Ahmad,C.J.T aylor,https://www.sodocs.net/doc/e812465530.html,nitis,T.F.C ootes.T racking and recognis2

ing hand gestures,using statistical shape m odels.Image and Vision

C om puting,1997,15:345~352

[2] Y.Az oz,L.Devi,and R.Sharma.Vision2Based Human Arm T racking

for G esture Analysis Using Multim odal C onstraint Fusion.Proc.1997

Advanced Display Federated Laboratory Sym p.,Adelphi,Md.,1997 [3] David Alan Becker,Sensi.A Real2T ime Recognition,Feedback and

T raining System for T’ai Chi G estures.(David Alan Becker,M aster

thesis),MIT M edia Lab,M ay,1997

[4] A.Bobick,J.Davis.Real2time recognition of activity using tem poral

tem plates.Proc.of Third IEEE W orkshop on applications of com puter

vision,Florida,1996,39~42

[5] G.Bradski,Boon2Lock Y eo,M inerva M.Y eung.G esture for video con2

tent navigation.SPIE3656(Proc.of the IS&T/SPIE C on f.on S torage

and Retrieval for Image and Video Database VII),San Jose,California,

1999,230~242

[6] Quek F.Unencumbered gestural interaction.IEEE Multimedia,1996:

36~47

[7] R.Cipolla and N.J.H ollinghurst.Human2robot interface by pointing

with uncalibrated stereo vision.image and vision com puting,M ar.

1996,14:171~178

[8] J.L.Crowley,F.Berard,J.C outaz.Finger tracking as a input device for

augmented reality.Proc.Int’l W orkshop on Automatic Face and G es2

ture Recognition,Zurich,S witzerland,1995,195~200

[9] T.S tarner,J.W eaver,et al.Real2time american sign language recogni2

tion using desk and wearable com puter based video.IEEE T rans.

PM AI,1998,20(12):1371~1375

[10] R.Culter and M.Turk.View2based interpretation of real2time optical

flow for gesture recognition.Proc.of3rd Int′l C on f.Automatic Face and

G esture Recognition,Japan,1998

[11] T rev or J.Darrell,Irfan A.Essa,Alex P.Pentland.T ask2specific gesture

analysis in real2time using interpolated views.IEEE T rans.PAMI,Dec.

1996,18(12):1236~1242

[12] W.T.Freeman,K.T anaka,J.Ohta,and k.K yuma.C om puter vision for

com puter games.Proc.Int’l C on f.Automatic Face and G esture Recog2

nition,K illington,Oct.1996:100~105

[13] D.M.G avrila,L.S.Davis.T owards3D m odel2based tracking and

recognition of human m ovement:a multi2view approach.Proc.Int’l

W orkshop on Automatic Face and G esture Recognition,S witzerland,

1995:272~277

[14] T ony Heap,David H ogg.T owards3D hand tracking using a deformable

m odel.Proceedings of the Second International C on ference on Automat2 ic Face and G esture Recognition,Verm ont,1996:140~145

[15] C.Wren,A.Azarbayejani,et al.P finder:real2time tracking of the hu2

man body.Proc.Int’l C on f.Automatic Face and G esture Recognition,

K illington,1996,51~56

[16] J.J.K uch,Vision2based hand m odeling and tracking for virtual telecon2

ferencing and telecollaboration.Proc.IEEE Int’l C on f.C om puter Vi2

sion,Cambridge,M ass.,1995

[17] J.Lee and T.L.K unii.M odel2based analysis of hand posture.IEEE

C om puter G raphics and Applications,Sept.1995:77~86

[18] V.I.Pavlovic,R.Sharma et al.G estural interface to a visual com puting

environment for m olecular biologists.Proc.of the2nd Int′l C on f.on

Automatic Face and G esture Recognition,Verm ont,1996:30~35 [19] G.Xu,Y.Zhu,Y.Huang et al.Automatic visual recognition of is olated

hard gestures with com puting spatio2tem poral representations.Proc.of

the1998Sym p.on Image,S peech,S ignal Processing and R obotics(IS2

SPR’98),1998,H ong K ong,I:49~54

任海兵 1998年毕业于清华大学计算机科学与技术系,获工学学士学位.同年,被保送到清华大学计算机应用专业直读博士学位,师从徐光 教授.

祝远新 1995年毕业于清华大学计算机科学与技术系,获工学学士学位.同年,被保送到清华大学计算机应用专业直读博士学位,师从徐光 教授.1999年,获得清华大学计算机应用专业博士学位.同年,进入University of M iss ouri2C olumbia读博士后.

121

第 2 期任海兵:基于视觉手势识别的研究—综述

手势识别技术综述

手势识别技术综述 作者单位:河北工业大学计算机科学与软件学院 内容摘要: 手势识别是属于计算机科学与语言学的一个将人类手势通过数学算法针对人们所要表达的意思进行分析、判断并整合的交互技术。一般来说,手势识别技术并非针对单纯的手势,还可以对其他肢体动作进行识别,比如头部、胳臂等。

但是这其中手势占大多数。本文通过对手势识别的发展过程、使用工具、目的与市场等进行综述,梳理出手势识别发展的思路,让读者对手势识别有一个总体上的认识,同时也可以让读者在此基础上进行合理想象,对手势识别的未来有一个大体印象。 Abstract: Gesture recognition is an interactive technology using mathematical arithmetic to the analysis,judge and assembly meaning that people want to convey which belongs to computer science and Linguistics.In general, gesture recognition technology is not for simple gestures expressed by hands ,it can also aim to other body movement recognition, such as the head, arm and so on. But the gesture accounted for most of the analysis. In this paper, by describing the development process, tools used , objective and market of gesture recognition , we can sort out the ideas of the development of gesture recognition, and let readers have an overall understanding of gesture recognition. At the same time, it can let the reader imagine that on hand gesture recognition based on reason ,and have a general impression of its future. 1.定义 说到手势识别,首先要对手势识别中的手势有一个清晰的认知。手势在不同的学科中有不同含义,而在交互设计方面,手势与依赖鼠标、键盘等进行操控的区别是显而易见的,那就是手势是人们更乐意接受的、舒适而受交互设备限制小的方式,而且手势可供挖掘的信息远比依赖键盘鼠标的交互模式多。在学术界,人们试图对手势定义一个抽象、明确而简洁的概念以为手势及其应用的研究提供依据。1990年Eric Hulteen和Gord Kurtenbach曾发表的题为“Gestures in Human-Computer Communication”中定义:“手势为身体运动的一部分,它包括一部分信息,而且是一种能被观察到的有意义的运动。挥手道别是一种手势,而敲击键盘不是一种手势,因为手指的运动没有被观察,也不重要,它只表示键盘

三种简单手势识别

简单手势识别

一、背景 随着计算机的发展,人机交互技术由传统的鼠标键盘时代发展到了以语音输入、动作识别等技术为代表的自然交互时代n1。特别是视觉计算技术的发展,使计算机获得了初步视觉感知的能力,能“看懂”用户的动作。手势识别作为一种直观自然的输入方式,把人们从传统接触性的输入装置中解放出来,可以以一种更自然的方式与计算机交互,使计算机界面变得更加易‘引。 手势主要分为静态手势和动态手势两种,动态手势可以看作是连续的静态手势序列。动态手势具有丰富和直观的表达能力,与静态手势结合在一起,能创造出更丰富的语义。利用动态手势识别构建新型的交互界面,是新一代的人机交互界面对输入方式自然性的要求,可以弥补传统交互方式的不足。基于视觉和手势识别研究正处于蓬勃发展的阶段,仍存着的许多值得研究的问题。研究基于视觉的动态手势识别对于构建更加好友的人机交互界面很有意义。

二、手势识别概述 2.1、手势识别的概念 手势是姿势的一个子集,姿势这个概念没有精确的定义。一般认为,手势概念经过人的手转化为的手势动作,观察者看到的是手势动作的图像。手势的产生过程如图2-1所示。 图2-1 手势的产生过程 手势识别的过程则找一个从图像V到概念动作G的变换而,如图2-2所示。

2.2、手势识别流程 随着计算机的发展,人机交互技术由传统的鼠标键盘时代发展到了以语音输入、动作识别等技术为代表的自然交互时代n1。特别是视觉计算技术的发展,使计算机获得了初步视觉感知的能力,能“看懂”用户的动作。手势识别作为一种直观自然的输入方式,把人们从传统接触性的输入装置中解放出来,可以以一种更自然的方式与计算机交互,使计算机界面变得更加容易。 手势主要分为静态手势和动态手势两种,动态手势可以看作是连续的静态手势序列。动态手势具有丰富和直观的表达能力,与静态手势结合在一起,能创造出更丰富的语义。利用动态手势识别构建新型的交互界面,是新一代的人机交互界面对输入方式自然性的要求,可以弥补传统交互方式的不足。基于视觉和手势识别研究正处于蓬勃发展的阶段,仍存着的许多值得研究的问题。研究基于视觉的动态手势识别对于构建更加好友的人机交互界面很有意义。

基于手势识别的智能电视交互专利技术综述

基于手势识别的智能电视交互专利技术综述 智能电视具有操作系统,支持第三方应用资源实现功能扩展,支持多网络接入功能,具备人机交互、与其他智能设备进行交互等。随着计算机视觉的发展和人机交互的需要,手势识别研究取得了蓬勃的发展,通过手势识别对智能电视进行控制和操作,能够更轻松、高效地使用电视设备。文章利用专利数据库对智能电视手势识别技术进行了数据统计和分析,对该领域的专利申请趋势等情况做了归纳总结。 标签:智能电视;手势识别;发展状况;专利 Abstract:Intelligent TV has the operating system,which supports the third party application resources to realize the function expansion,supports the multi-network access function,has the man-machine interaction,and carries on the interaction with other intelligent devices. With the development of computer vision and the need of human-computer interaction,the research of gesture recognition has made great progress. By controlling and operating intelligent TV through gesture recognition,one can more easily and more efficiently use TV equipment. This paper makes use of patent database to analyze the data of intelligent TV gesture recognition technology,and summarizes the trend of patent application in this field. Keywords:intelligent TV;gesture recognition;development status;patent 引言 电视是家庭娱乐休闲必不可少的家用电器。如今,电视依然是最为普及的信息传播载体,用户在观看普通节目的同时,还可以上网、娱乐等。从用户的角度出发,通过自然简单、人性化的方式完成交互,无疑是用户完成电视操作的最佳方式。而手势具有直观、自然、丰富的特点,是一种符合人们日常习惯的交互手段,是表達信息和特定意图的良好载体,由于手势具有上述特性,因此在对智能电视进行操控中得到了良好的运用,实现了对智能电视自然灵活地操作。 1 基于手势识别的智能电视控制技术发展状态分析 1.1 技术分解 本文通过检索获得的专利申请进行统计分析,对基于手势识别的智能电视控制所涉及的具体技术和应用领域进行分解。 根据手势采集设备可以将手势识别系统大致分为基于数据手套和基于视觉的两种手势识别系统。其中,数据手套通过多个传感器反馈各关节的数据,并通过位置跟踪器返回人手所在的三维坐标,从而获取手势在三维空间中的位置信息和手指的运动信息。通过数据手套可以直接获取人手在三维空间中的位置和运动

基于Android的视觉手势识别毕业论文

基于Android的视觉手势识别 --相册管理实现

毕业设计(论文)原创性声明和使用授权说明 原创性声明 本人郑重承诺:所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得及其它教育机构的学位或学历而使用过的材料。对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。 作者签名:日期: 指导教师签名:日期: 使用授权说明 本人完全了解大学关于收集、保存、使用毕业设计(论文)的规定,即:按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。 作者签名:日期:

学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。 作者签名:日期:年月日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 涉密论文按学校规定处理。 作者签名:日期:年月日 导师签名:日期:年月日

关于计算机视觉的手势识别综述

关于计算机视觉的手势识别综述 蒋指挥 (江苏科技大学江苏镇江 213022) 摘要:计算机技术的高速发展也产生了许多新领域,在此对以计算机视觉为基础的手势检测识别技术展开综述。主要阐述该技术的发展历程、实现方法、研究现状以及其存在的不足之处和发展方向。结果表明简单的可穿戴设备的手势识别和深度视觉传感器的手势识别和多方法交叉融合的手势识别是未来该领域的发展方向。 关键词:计算机视觉;手势识别;人机交互 A survey of gesture recognition in computer vision//Jiang Zhi Hui Abstract;With the rapid development of computer technology, a lot of new fields have been developed. In this paper, the technology of gesture detection and recognition based on computer vision is reviewed. This paper describes the development of the technology, the realization method, the research status and its shortcomings and development direction. The results show that the simple wearable device for hand gesture recognition and depth vision sensor for hand gesture recognition and multi method cross fusion for gesture recognition is the future direction of the development of the field. Key words:Computer vision; gesture recognition; human-computer interaction 计算机在我们的生活中越来越不可或缺,我们同时也对计算机提出了更高的要求,计算机视觉的手势识别正是对计算机应用拓展的重要途径,例如现在的VR技术,就是应用了手势识别才实现的。ABIResearch公司高级分析师约书亚·弗拉德(JoshuaFlood)指出:“免提操作或手势识别很快将成为高端旗舰智能手机、媒体平板电脑和智能眼镜区别于其他同类产品的一个关键因素。三星电子最新推出银河S4已经将这项技术用于其手机中,并以其全新的用户体验获得用户交口称赞。此外,在一系列新型智能眼镜产品即将发布之时,不难想象这类技术将被采用。”其实手势识别技术涵盖了许多领域,比如物理学、生物学等,实现手势识别的方式有很多种从一开始的二维手型识别、二维手势识别到后来的三维手势识别,正是计算机视觉技术的发展使得手势识别的实现方式更加多样。但目前的技术仍然很繁琐,冗杂的可穿戴设备就直接影响了使用者的舒适感,其还有很大的发展空间。 1、手势识别的发展历程及其实现方法

视觉识别系统(VI手册)

. . 视觉识别系统(手册)设计项目明细表 一.基础设计系统 :标志设计 □标志及标志创意说明 □标志墨稿 □标志反白效果图 □标志标准化制图 □标志方格坐标制图 □标志预留空间与最小比例限定□标志特定色彩效果展示 :标准字体 □全称中文字体 □简称中文字体 □全称中文字体方格坐标制图 □简称中文字体方格坐标制图 □全称英文字体 □简称英文字体 □全称英文字体方格坐标制图 □简称英文字体方格坐标制图 :标准色(色彩计划) □标准色(印刷色) □辅助色系列 □下属产业色彩识别 □背景色使用规定 □色彩搭配组合专用表 □背景色色度、色相 :造型(吉祥物) □吉祥物彩色稿及造型说明 □吉祥物立体效果图 □吉祥物基本动态造型 □吉祥物造型单色印刷规范 □吉祥物展开使用规范 :象征图形 □象征图形彩色稿(单图形) □象征图形延展效果稿 □象征图形使用规范 □象征图形组合规范

. :专用印刷字体 □专用印刷字体 :基本要素组合规范 □标志与标准字组合多种模式 □标志与象征图形组合多种模式 □标志吉祥物组合多种模式 □标志与标准字、象征图形、吉祥物组合多种模式 □基本要素禁止组合多种模式 二.应用设计系统 :办公事物用品设计 □高级主管名片 □中级主管名片 □员工名片 □信封 □国内信封 □国际信封 □大信封 □信纸 □国内信纸 □国际信纸 □特种信纸 □便笺 □传真纸 □票据夹 □合同夹 □合同书规范格式 □档案盒 □薪资袋 □识别卡(工作证) □临时工作证 □出入证 □工作记事簿 □文件夹 □文件袋 □档案袋 □卷宗纸 □公函信纸 □备忘录 □简报 □签呈 .

. . □文件题头 □直式、横式表格规范 □电话记录 □办公文具 □聘书 □岗位聘用书 □奖状 □公告 □维修网点名址封面及内页版式 □产品说明书封面及内页版式 □考勤卡 □请假单 □名片盒 □名片台 □办公桌标识牌 □及时贴标签 □意见箱 □稿件箱 □企业徽章 □纸杯 □茶杯、杯垫 □办公用笔、笔架 □笔记本 □记事本 □公文包 □通讯录 □财产编号牌 □培训证书 □国旗、企业旗、吉祥物旗旗座造型□挂旗 □吊旗 □竖旗 □桌旗 :公共关系赠品设计□贺卡 □专用请柬 □邀请函及信封 □手提袋 □包装纸 □钥匙牌 □鼠标垫 □挂历版式规范 □台历版式规范 □日历卡版式规范 □明信片版式规范

手势识别---人工神经网络

手势识别---人工神经网络 一.手势识别综述 随着计算机性能的逐步提高和各领域对计算机使用的不断深入,人与计算机的交互活动越来越成为人们日常生活中的一个重要组成部分。鼠标和键盘等传统的的人机交互方式越来越显示出它们的局限性,尤其在虚拟现实、增强现实和可穿戴计算等新兴的应用中变得更为明显。近年来,手势交互作为一种新的人机交互方式被越来越多地采用,特别是基于视觉的手势交互,由于其简单、自然、直观和非侵犯性等特性已成为手势交互的重要方式之一。 手势是一种自然、直观、易于学习的人机交互手段。以人手直接作为计算机的输入设备,人机间的通讯将不再需要中间的媒体,用户可以简单地定义一种适当的手势来对周围的机器进行控制。手势研究分为手势合成和手势识别,前者属于计算机图形学的问题,后者属于模式识别的问题。手势识别技术分为基于数据手套和基于计算机视觉两大类。 1.1 手势识别的发展 最初的研究主要集中在做一种专用硬件设备来进行输入。例如数据手套,即人可以戴上一个类似于手套的传感器,计算机通过它可以获:取手的位置、手指的伸展状况等丰富信息。如l993年B.Thamas等人做的自由手遥控目标的系统是凭借数据手套作为输入的媒介,但这需要实验者呆上一个专用设备。之后人们又致力于标记手势的研究,即通过在手上作标记,例如在手腕和手指处贴上或画上特殊颜色的圆点,用来识别手势。这虽然给识别带来了方便,但同样给实验者带来麻烦。最后人们终于把注意力集中到自然手上,通过专用加速硬件和脱机训练,一些研究者成功地研制了手势系统,但其识别的手势仅限几种。例如Freeman 和Roth等人提出的基于方向直方图的手势识别系统。l994年,作

VI标识视觉识别系统概念及内容

VI标识视觉识别系统概念及内容 一、目的: 企业可以通过VI设计实现这一目的。对内征得员工的认同感,归属感,加强企业凝聚力,对外树立企业的整体形象,资源整合,有控制的将企业的信息传达给受众,通过视觉符码,不断的强化受众的意识,从而获得认同。 VI标识视觉识别系统是公司对外形象的重要组成部分,为了使内蒙古红太阳食品有限公司的VI张贴整齐划一,达到视觉识别效果,使公司整体形象达到最佳状态。 二、概念: VI即(Visual Identity),通译为视觉识别,是CIS系统中最具传播力和感染力的层面。人们所感知的外部信息,有83%是通过视觉通道到达人们心智的。也就是说,视觉是人们接受外部信息的最重要和最主要的通道。企业形象的视觉识别,即是将CI的非可视内容转化为静态的视觉识别符号,以无比丰富的多样的应用形式,在最为广泛的层面上,进行最直接的传播。VI一般包括基础部分和应用部分两大内容。其中,基础部分一般包括:企业的名称、标志、标识、标准字体、标准色、辅助图形、标准印刷字体、禁用规则等等;而应用部分则一般包括:标牌旗帜、办公用品、公关用品、环境设计、办公服装、专用车辆等等。 VI视觉识别设计将企业品牌所有的视觉项目予以统一规划,使品牌具有统一的视觉识别系统,是消费者对品牌有感官的识识。企业识别中,视觉识别是最直接、最具体的,很快能让消费者接受与吸收,达到识别、认识目的。 三、VI设计的主要内容: 1、办公事物用品设计: 名片、信封、信纸、便笺、传真纸、票据夹、合同夹、合同书规范格式、档案盒、薪资袋、识别卡(工作证)、临时工作证、出入证、工作记事簿、文件夹、文件袋、档案袋、卷宗纸、公函信纸、备忘录、简报、签呈、文件题头、直式、横式表格规范、电话记录、办公文具、聘书、岗位聘用书、奖状、公告、产品说明书封面及内页版式、考勤卡、请假单、名片盒、名片台、办公桌标识牌、及时贴标签、意见箱、稿件箱、企业徽章、纸杯、茶杯、杯垫、

基于手势识别的人机交互综述

基于手势识别的人机交互综述 摘要:近年来,得益于虚拟现实、人机界面技术、计算机视觉等领域的发展,基于手势识别的人机交互技术得到大力的推动。本文就基于手势识别的人机交互技术展开综述。首先概括手势交互的涉及领域,回顾其发展史和国内外研究现状。接着阐明它的基本界定和分类,并在此基础上分析其热点关键技术。然后实例讨论了几种类型手势交互的典型应用。最后给出了结论。 关键词:虚拟现实;手势交互;计算机视觉;手势识别;特征跟踪 1.引言 人机交互技术通过输入、输出设备,以有效的方式实现交互主体与交互客体的对话。当前的人机交互技术已经从过去交互主体适应交互客体,发展为交互客体不断地适应交互主体的习惯和以交互主体为中心的新阶段[1,2,3,4]。以用户为中心的,新型、自然的人机交互技术逐渐成为开发者和科研工作者的关注重点。这类交互方式要求输入与输出能够最大限度地符合交互主体的行为习惯,并能够在交互主体的脑中顺利构建交互环路。由于手势具有极强的信息表述功能,加之人手操作行为本身就是人与世界相互作用的主要方式,因此,基于手识别的人机交互技术相关研究有着重要的理论价值和应用价值。基于手势识别的人机交互技术涉及计算机科学、认知心理学、行为学等诸多方面的知识。本文不能面面俱到,仅就手势交互的基本问题:手势语义的分类,以及当前发展概况、研究热点技术和典型系统应用等相关问题进行综述。 2.研究现状 目前,基于视觉的手势交互已被广泛的研究,由于手势本身的多义性及时空差异性,加之手形变的高维度及视觉问题本身的不适定性,基于视觉的手势识别一直是一项极富挑战性的究课题[5]。需要解决的核心问题是对手形的识别,对手势的跟踪等。传统的方法主要分为两大类:(1)基于模型(model-base)的方法;(2)基于表征(appearance-based)的方法[6]。这些方法及其衍生算法极大程度地依赖于计算机科学中虚拟现实、机器视觉、模式识别、人机交互等多个领域的交流与合作。相关的国际会议:CHI、ICCV、CVPR、ICAT、IEEE VR 为研究者提供了一个能充分交流的空间,并吸引了越来越多的研究人员共同参与合作。此外,学科之间的交流也吸引了心理学研究人员的共同参与。他们以从用户为中心出发,为基于手势交互研究和开发提出了宝贵意见[7]。纵观手势交互的发展历程,其研究重点也从早期简单的系统框架、低层特征提取[8]、手形模板匹配[8]等问题转变到关节式物体跟踪[9,10, 11]、跟踪性能评价[12]、操作型手势解析[14]等问题上。我国在基于手势识别的人机交互领域的研究近年来得到了长足的发展。研究机构集中在国内的研究所和高校的科研单位。目前国内手势交互的研究成果主要有:中国科学院软件研究所[15]的研究中,对二阶自回归过程动力学模型(Auto-Regressive Process, ARP)进行训练和学习,进而建立基于ARP 的预测模型,实现了人手运动的鲁棒性跟踪,在出现跟踪丢失的情况下在后续序列中可以自动恢复正确跟踪。中国科学院自动化研究所模式识别实验室提出一种基于区域的多连接体(手指)的三维运动跟踪算法[13],用多约束融合的方法以及手指的运动特性,建立多刚体的三维运动描述,通过三类基本约束条件,把跟踪问题归结为一个约束误差优化问题。清华大学的崔锦实博士,提出一种基于回归-优化方法的关节式物体的姿态估计方法[16]。该方法把回归分析与全局优化搜索相结合,保证了估计的精度和连续性;针对现有滤波器在高维非线性多峰

基于卷积神经网络的简单背景手势识别方法概述

基于卷积神经网络的简单背景手势识别方法概述 摘要在手勢识别研究方法日益成熟的今天,研究人员把主要精力放在新算法的研究以及旧方法的改进上,均取得了很好的成果。本文利用时下流行的卷积神经网络训练方法,避开大量的算法研究工作,把主要工作放在手势数据的获取以及处理上,在一定的数据范围内取得了很好的结果。在一定程度上给手势识别工作提供了新的思路。 关键词手势识别;手势数据;卷积神经网络 Abstract Today,as gesture recognition research methods become more and more mature,researchers have made great efforts to focus on the research of new algorithms and the improvement of old methods. In this paper,we use the popular Convolutional Neural Network (CNN)training method to avoid a lot of algorithm research work. The main work is on the acquisition and processing of gesture data,and it has achieved good results in a certain data range. To a certain extent,it provides a new idea for gesture recognition. Keywords Gesture recognition;Gesture data;Convolutional neural network 前言 以输入数据来区分,手势识别可以分为静态手势识别和动态手势识别。动态手势识别是基于视频流数据,实现手势动作捕捉,本质上是把视频流分为每一帧图像数据,处理每一帧图像之间的关系,从而识别出动态手势的含义。静态手势识别也称为手型识别,其输入数据是一副静态的手势图像,计算机系统通过前期对大量手势图像的训练学习,熟知手势图像的特征,从而识别出这一副静态手势图像的含义。本文的主要工作是通过卷积神经网络方法对简单背景的手势图像进行训练,得到训练模型,利用该训练模型对新采集的手势图像数据进行识别,达到预期的识别率。 1 研究方法 手势识别的研究方法有很多种,例如利用SIFT特征提取配合SVM训练的方法[1],利用HOG特征提取的研究方法[2]等。但这些研究方法对于图像质量太多依赖,如SIFT方法太过依赖局部梯度主方向,而获取局部梯度主方向往往都会有偏差,因此图像质量不佳容易导致特征提取的错误。且SIFT是一种只利用到灰度性质的算法,忽略了色彩信息,对于彩色图像的识别无能为力。 而本文采用的卷积神经网络方法则不存在该问题,卷积神经网络对于图像的容错性较强,可以不考虑图像质量、色彩等影响,关键是训练的样本量足够大,就可以得到相对理想的结果。且卷积神经网络的算法通用性强,对于识别任何类型的静态图像,都可以用几乎相同的训练模型进行,区别仅仅在于某些参数的调

手势识别综述

手势识别综述 【摘要】介绍了手势识别的定义、分类,手势识别的过程,动态手势识别的过程。 【关键词】手势建模;傅里叶描述子;动态手势 1手势定义和分类 通常在人机交互领域手势定义为:人类通过手掌和手指的不同姿势组合形成的具有特定含义的信息的集合体称为手势。 手势通常可以分为操作性手势和交流性手势:如钢琴伴奏家在弹奏钢琴时的手指动作属于操作性手势,通过十个手指的不同组合,在键盘上发出不同声音形成乐曲的弹奏,只有操作的含义,不含有视觉上信息。马路上交警指挥路况时手上的动作属于交流性手势,通过司机观察交通警察手上不同动作理解警察的意思,含有视觉上的信息。 按照手势在表达的信息中所处的地位分为自主性手势和非自主性手势:哑语演示时表演者手上的手势动作完全表达了哑语表演者的思想,手势在语义交流中占主导地位,属于自主性手势,演员表演节目时有时为了更好的表达情感会用手势加深语义表达,但是手势只是为了更好表达意思,起到对演员表达思想的补充,这种手势动作这属于非自主性手势,在语义表达中不占主导地位。按照手势在交流活动中手势的作用对象分为离心手势和向心手势:比如说话人在下命令时手指向受命人这种手势属于离心手势,例如交通警察在交通管制中的手势属于离心手势,当听到某消息时听者会有相应的情感反应这时的手势属于向心手势,例如小朋友表示不同意时摇手即为向心手势。当操作者利用手势表达思想的时候有两种方式,一种是手臂不动完全通过手指和手掌的运动来表达操作者的意思,还有一种是忽略手指的运动,通过手的运动轨迹来表达思想。当我们做研究时会遇到手和手指同时运动的情况这时为了分类方便,需要做相应约束,当手是动的应忽略手指的动作,反之如果手指在动这时应忽略手的运动轨迹。因为基于表观的手势识别最终面临的是手的2D图像如果手和手指的运动同时考虑的话会给分类造成不必要的麻烦。 2手势识别的分类 按照对手势数据采集的方式分为数据手套型和摄像头型。 2.1数据手套 虚拟现实中重要组成部分,是一种通用的人机接口他可以将手指的复杂动作通过传感器反应到虚拟环境中去,在虚拟环境中真实再现手部动作。数据手套使用的效果关键是手套能不能将手指、手掌、手腕的弯曲真实的以数据形势反演到系统数据库中,让系统根据模型对手势进行有效识别,由于手部软组织和计算复杂性,数据手套的计算速度总是存在延时,同时从人机交互的角度手套佩戴也十分不方便,如果多人使用还存在卫生等问题,因此数据手套目前来说只是应用在试验阶段,真正推广到社会应用还有很多问题要解决。例如由海军某课题组开发的某型飞机训练仿真系统采用了数据手套,将人的动作如拉升飞机操纵杆通过数据手套反应到系统中,但是不足之处是手套存在一定的延时,通常第二个动作都准备做了,第一个动作系统往往还没执行,这和真实的飞机操作存在很大的差别,但是要想系统及时接受数据手套传感来的数据,往往对系统的中央处理器要求很高,需要大量投入经费和人力,存在一定的矛盾。因此数据手套在虚拟仿真中往

企业文化与企业视觉识别系统

企业文化与企业视觉识别系统 : [摘要] 本文通过对企业文化和企业视觉识别系统的含义,企业文化的建设需要视觉识别系统的支持,企业视觉识别系统的完善离不开企业文化的不断提升等几个方面的探讨,指出两者是互为表里,相辅相成的有机整体。 [关键词] 企业文化视觉识别系统 日本知名学者日下公人在《新文化产业论》中指出:“21世纪的经济学将由文化与产业两部分构成”、“文化将成为经济进步的新形象”。企业文化与企业形象相互交融,渗透影响企业的经营管理,从而形成企业的文化生产力。企业文化作为一种极难模仿的核心竞争力,对现代企业在全球化竞争中树立形象、打造自我品牌有着无可比拟的作用。而企业文化内涵主要通过识别系统(包括理念识别、行为识别、视觉识别)向外界彰显和传达。其中视觉识别系统是整个企业识别系统的最终表现环节,也是最直接、最实际、最有成效的部分。因此,企业视觉识别系统是企业特征的形象载体,特色鲜明、创意独特的视觉识别系统是树立企业形象,弘扬企业文化的关键。本文旨在通过探讨企业文化和企业视觉识别系统的相互关系,进一步加深对企业文化、企业形象及企业视觉识别系统重要作用的认识。 一、企业文化与企业视觉识别系统的含义 所谓企业文化,多数学者将它解释为:企业在长期的运转和发展过程中形成的经营思想、价值观念、行为规范、思维方式等的综合体。它伴随着企业的成立而产生,随着企业的发展不断变化。企业文化是企业的意识形态,是其取之不尽,用之不竭的精神源泉。 企业视觉识别系统,简称VI,是企业识别系统的重要组成部分。它是在理念识别(MI)和行为识别(BI)的基础上,通过一系列形象设计,将企业经营理念、行为规范等,即企业文化内涵,传达给社会公众的系统策略,是企业全部视觉形象的总和。企业VI包括:标志、包装、标准色等元素以及这些元素在企业内部制服、交通工具、文具等介质上的应用。它着力于组织整体形象的塑造,在大众中提升企业声誉度和亲和力,从而达到对企业及其产品产生一致的认同感和价值观的目的。 从两者的内涵来看,企业文化是企业形象和品牌的根基和立足点,企业视觉识别系统是企业形象的具体视觉化表现。也就是说,企业视觉识别系统的核心内容是通过

基于计算机视觉的手势跟踪与识别技术的研究毕业论文

基于计算机视觉的手势跟踪与识别技术的研究

毕业设计(论文)原创性声明和使用授权说明 原创性声明 本人郑重承诺:所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得及其它教育机构的学位或学历而使用过的材料。对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。 作者签名:日期: 指导教师签名:日期: 使用授权说明 本人完全了解大学关于收集、保存、使用毕业设计(论文)的规定,即:按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。 作者签名:日期:

学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。 作者签名:日期:年月日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 涉密论文按学校规定处理。 作者签名:日期:年月日 导师签名:日期:年月日

基于视觉的实时手势识别技术及应用

Abstract With the development of technology, a natural human-computer interaction is urgent for the users. The natural human-computer interaction is user friendly. As an important technology of human-computer interaction, the gesture recognition has become a research hotspot in recent years. The gesture recognition can be divided into two categories: vision-based gesture recognition and inertial sensor-based gesture recognition. Compared to inertial sensor-based gesture recognition, vision-based gesture recognition is more important because of its intuition, convenience, and freedom. In this thesis, we carefully study the key techniques of vision-based gesture recognition, including gesture segmentation, gesture extraction, recognition of static gesture, and recognition of dynamic gesture. At last, we apply our vision-based gesture recognition technology in a human-computer interaction system to test its performance. This system can recognize three gestures: “scissor”, “rock”, “paper”, and let the user play a “scissor-rock-paper” game. Using the skin color information and the motion information, the gesture can be segmented accurately. The skin color information is obtained in real time by using the YCbCr Gaussian skin color model; the background subtraction method is used to extract the motion region; the skin color region and the motion region are fused to obtain the skin color motion region; the morphological method is used to denoise the skin color region. The search algorithm extracts the gesture contour and denoises it through the connected region analysis to obtain the final gesture. For static gesture recognition, we extract the HOG features of the training samples, train the SVM model, and identify the samples according to the trained model. The HOG feature of the training sample is analyzed by the experiment. The experimental results show that this method can identify the different directions of the same gesture and achieves the average recognition accuracy at 93.08%. Considering the scale variability of HOG feature, this thesis adopts the volume semantic local binary patterns (VSLBP) algorithm to extract features, and uses SVM to design a classifier for real-time hand gesture recognition. Based on the three models of "scissors", "rock" and "paper", the LBP algorithm is used to extract the feature to train the SVM model. The tested samples are identified according to the trained model. The experimental results show that the average recognition accuracy is 94.42%. Finally, this algorithm is applied in a human-computer interaction to realize the recognition three gestures: "scissors", -II-

VI企业视觉识别系统

VI企业视觉识别系统--定义 一.基础部分 1.企业标志设计 企业标志及标志创意说明 企业标志是造形单纯、意义明确的标准的视觉符号。企业标志具有象征功能、识别功能,是企业形象、特征、信誉和文化的浓缩。标志承载着企业的无形资产,是企业日常经营活动、广告宣传、文化建设、对外交流必不可少的元素。 标志反白效果图 标志反白效果图即将标志图转为灰度图后做黑白部分的颠倒。在无法使用彩色印刷或彩色打印的情况下,反白效果图就作为某些特殊环境下使用的规范。 标志方格坐标制图 标志方格坐标制图主要运用于制作招牌、户外看板、指示牌、建筑外观等无法使用负片放大的大型制作项目的情况下,为确保快速绘制出准确的标志,将标志图形整体比例关系及定位线、基线的相互关系等,通过数字定位在坐标方格中作出明确的规定,在制作的过程中须严格遵循并以此作为监督标准,从而确保标志要素在任何场合的正确表现。 标志墨稿 标识的黑白稿即是标志的墨稿。 标志标准化制图 标志标准制作图是将圆形整体比例关系及定位线的相互关系通过格子等数字化定作出明确规定,在制作过程中严格遵守,以便求取准确的标志图形。方格制图是制作对外应用系统等无法使用负片放大的大型制作项目的精确绘制 标志预留空间与最小比例限定 标志预留空间与中文标准表字最小比例限定规范,是为了确保企业标志及其文字等元素组合在应用中的识别性与独立性,而专门设定的,在应用设计项目时,应不小于最小预留空间和最小比例。 标志特定色彩效果展示 2.企业标准字体 企业全称中文字体?? 企业完整名称的文字表现格式和字体

企业全称中文字体方格坐标制图 企业全称中文字体方格坐标制作图是指在精确的坐标图中,将全称中文字体按整体比例关系及定位线、基线的相互关系通过方格子等数字化定位作出明确规定,须在制作过程中严格遵守,以便求取准确字体。坐标方格制图是制作招牌、看板、建筑外观、路牌等无法使用负片放大的大型制作项目的精确绘制。 企业全称英文字体?? 企业英文完整名称书写格式和字体 企业全称英文字体方格坐标制图 企业全称英文字体方格坐标制作图是指在精确的坐标图中,将全称英文字体按整体比例关系及定位线、基线的相互关系通过方格子等数字化定位作出明确规定,须在制作过程中严格遵守,以便求取准确字体。坐标方格制图是制作招牌、看板、建筑外观、路牌等无法使用负片放大的大型制作项目的精确绘制。 企业简称中文字体?? 企业简称的中文书写格式和字体 企业简称中文字体方格坐标制图 企业简称中文字体方格坐标制作图是指在精确的坐标图中,将简称中文字体按整体比例关系及定位线、基线的相互关系通过方格子等数字化定位作出明确规定,须在制作过程中严格遵守,以便求取准确字体。坐标方格制图是制作招牌、看板、建筑外观、路牌等无法使用负片放大的大型制作项目的精确绘制。 企业简称英文字体?? 企业英文简称的书写格式和字体 企业简称英文字体方格坐标制图 企业简称英文字体方格坐标制作图是指在精确的坐标图中,将简称英文字体按整体比例关系及定位线、基线的相互关系通过方格子等数字化定位作出明确规定,须在制作过程中严格遵守,以便求取准确字体。坐标方格制图是制作招牌、看板、建筑外观、路牌等无法使用负片放大的大型制作项目的精确绘制。 3.企业标准色(色彩计划) 企业标准色(印刷色) 企业标准色,是为了增加企业可识别性而特定的专用色彩。运用在所有视觉传达设计媒体上,通过色彩具有的知觉刺激与心理反应,以突出企业经营理念、产品特质、公司精

相关主题