搜档网
当前位置:搜档网 › 基于计算机视觉的检测技术

基于计算机视觉的检测技术

基于计算机视觉的检测技术
基于计算机视觉的检测技术

基于计算机视觉的检测技术

化工与环境学院董守龙学号:10805001

摘要:计算机视觉检测技术是一个发展迅速、应用广泛的新的技术领域。本文就基于计算机视觉的检测技术进行了概述,介绍了几种典型的应用,包括汽车牌照自动识别技术、特定目标识别技术、生物特征鉴别技术、机器人视觉系统等,并分别就其涉及的主要问题进行了分析。

关键词:图像技术;图像处理;计算机视觉;机器人视觉

近年来,图像技术受到人们广泛的关注。在人类接收的信息中有80%来自视觉即图像( Image)信息,这是人类最有效和最重要的信息获取、交流方式。随着计算机的普及,人们越来越多地利用计算机帮助人类获取与处理视觉(图像)信息。图像技术就是对视觉图像获取与加工处理技术的总称。根据抽象程度和处理方法的不同,图像技术可分为三个层次:图像处理、图像分析和图像理解。这三个层次的有机结合也称为图像工程。

图像处理是较低层的操作,主要在图像象素级上进行处理。比较狭义的图像处理主要包括对图像分割以改善视觉效果,或对图像压缩编码以减少传输时间或存储容量。图像分析则是进入中层的操作,分割和特征提取是把原来以象素描述的图像转变成简洁的非图形形式的符号描述。即图像分析是一个图像进而数据出的处理,数据可以是对某一特征测量所得的结果,或是基于测量的符号表示。图像理解也经常被称为计算机视觉,主要是高层操作。图像理解进一步研究图像中的目标和它们之间的联系,其处理过程和方法与人类的思维推理有不少类似之处。

随着计算机的普及和大规模集成电路技术的发展,计算机视觉检测技术(AVI)实现成本已大大降低,并得到广泛应用。计算机视觉的应用领域主要包括对照片、视频资料如航空照片、卫星照片、视频片段等的解释、精确制导、移动机器人视觉导航、医学辅助诊断、工业机器人的手眼系统、地图绘制、物体三维形状分析与识别及智能人机接口等。下面将就一些主要的重点应用展开介绍。

1 汽车牌照自动识别技术

近年来交通问题引发的关注越来越多,智能交通系统(Intelligent Transportation System,ITS)的研究也越发广泛而深入。汽车牌照识别(License Plate Recognition,LPR)技术作为智能交通系统的关键技术,在交通流量监测、交通诱导控制、路桥收费、违章车辆监控等方面有着广泛的应用前景,对实现交通事业现代化有着重大意义。

汽车牌照自动识别系统以车牌号码自动识别为基础,可以对车辆进行自动验证、监视和报警。车牌识别系统集中了先进的光电、计算机控制、图像处理、模式识别、远程数据访问等技术,可以实现对监控路面过往的每一辆机动车的特征图像和车辆全景图像的全天候实时记录,计算机可以根据所拍摄的图像进行牌照自动识别。

LPR系统包括三个关键子系统,分别是车牌区域定位系统、车牌字符分割系统和车牌字符识别系统。牌照图像通常由CCD摄像机等摄影摄像设备获得,有时为了提高图像质量会采用主动红外照明摄像或使用其他特殊的传感器。获得的图像质量受多方面条件的影响,因此多数情况下需要对得到的摄影图像进行预处理。

车牌的定位检测是车牌识别中关键的一步,定位的准确与否直接关系到系统的识别精度和识别速度;同时,这也是整个环节的难点所在,由于牌照位于图像上任意位置,加上光照不均匀、反光、拍摄角度倾斜、复杂背景干扰以及车牌本身折损等原因,牌照精确定位难度较大。车牌定位算法有很多,如局部阀值二值化与自适形态滤波法、基于小波变换的边缘检测法等,是一个研究的热点。

在区域定位获得车牌图像之后需要对车牌上的字符进行分割以便识别,先把多行或多字符图像中的每个字符从整个图像中切割出来成为单个字符。由于车牌上的字符类型较少、变化较小,所以常采用简单的直接分割法。

字符识别系统首先要对字符进行位置、大小归一化处理,如果是英文大写字母和数字还要进行字符细化处理。然后将牌照上的字符分为两大类:汉字和符号(包括英文大写字母和数字)。对于汉字,采用汉字的字符笔划密度和字符复杂指数特征对汉字进行粗分类,再采用模板匹配法识别汉字。而对于符号,通过对车辆牌照上英文字符和数字字符结构特征的详细分析,选择字符中的细节点特征、闭合曲线特征和拐角点特征作为字符识别的依据,根据这些特征来识别牌照上的英文字母和数字字符。

2 特定目标识别技术

早期进行数字图像处理的目的之一是要通过采用数字技术提高照片的质量,辅助进行航空照片和卫星照片的读取判别与分类。由于需要判读的照片数量很多,需要借助自动的视觉系统进行,于是产生了许多航空照片和卫星照片判读系统与方法。自动判读的进一步应用就是对所关注特定目标的自动识别和实时分类,并与制导系统相结合。目前常用的制导方式包括激光制导、电视制导和图像制导,在导弹系统中常常将惯性制导与图像制导结合,利用图像进行精确的末端制导。

特定目标识别技术中很重要的一个研究方向是动目标检测技术。在军事领域,现代战争要求我们必须能尽早尽快地发现来袭目标;在实施高精度、高准确性的军事打击时,也需要精确、快速定位并识别出攻击目标。在复杂战场条件下,如何快速检测并识别出运动目标成为各国军方的研究热点。军事领域常使用的成像传感器有合成孔径雷达、毫米波雷达、红外成像仪、激光成像仪、全彩色成像仪、光谱成像仪等。

特定目标识别技术在视觉监视上的应用需求也相当广泛。随着多媒体技术的发展和计算机性能的提高,近年来基于图像处理的自动监控技术得到了广泛的应用。传统可视化的监控系统要求监控人员不停的监视屏幕,获得视频信息,通过人为的理解和判断才能得到相应的结论并做出相应的决策。如果能实现对特定被监控目标的自动检

测、提取、识别、跟踪,则可节省人力、物力,大大提高工作效率,所以人们对基于视频图像的监控系统的智能化要求越来越迫切。

运动目标检测主要方法有背景相减法、两帧差分法和光流分析法等。背景相减方法是利用当前图像与背景图像的差分来检测运动区域的一种技术,通过分析不同时间的两幅序列图像相减构成的残差图像来获取信息;两帧差分法即提取连续两帧的视频图像进行相减运算得到差分图像,在差分图像上检测运动变化区域;光流分析法是对图像的运动场进行估计,利用图像序列关于时间和空间的灰度变化来估计位置速度场的方法,其基本思想是通过计算出光流场来模拟运动场。

3 生物特征鉴别技术

近年来,基于生物特征( biometrics) 的鉴别技术得到了广泛重视,主要集中在对指纹、虹膜、人脸、声音等特征上,这其中大多都与视觉信息有关。与生物特征识别密切相关的另一个重要应用是用于构成智能人机接口。现在计算机与人的交流基本局限于键盘、鼠标,其他输入手段还不成熟,计算机也无法识别用户的真实身份。利用计算机视觉技术可以让计算机检测到用户是否存在、鉴别用户身份、识别用户的体势(如点头、摇头)等。此外,这种人机交互方式还可推广到一切需要人机交互的场合,如入口安全控制、过境人员的验放等。

由于指纹的唯一性、不变性和排列规律性,指纹识别已经成为生物特征鉴别技术中最常见、最成熟的技术。指纹识别在过去主要应用于刑侦系统,现在已广泛应用于民用市场,如考勤、门禁、保险箱柜、机动车等。计算机对输入的指纹图像进行预处理,以实现指纹的分类、定位、提取形态和细节特征,然后根据所提取的特征对指纹进行比对和识别。

虹膜识别是当前应用较为方便和精确的一种识别技术,虹膜的高度独特性、稳定性及不可更改的特点,是虹膜可用作身份鉴别的物质基础。虹膜识别技术将虹膜的可视特征转换成一个512个字节的Iris Code(虹膜代码),这个代码模板存储后可用于后期识别。虹膜识别技术与相应的算法结合后,可以达到很高的准确度。两个不同的虹膜信息有75%匹配信息的可能性是1/1000000,两个不同的虹膜产生相同Iris Code的可能性是1/1052。比其他生物认证技术的准确度高几个到几十个数量级。虹膜识别技术在国际上已经开始在各行各业以各种形式进行应用,但国内的应用还很有限。

人脸识别与其他方法比较,更直接、友好、方便,可以通过非接触方式获得,使用者无任何心理障碍,所以人脸识别技术成为人们最容易接受的身份鉴别方式之一。人脸检测是人脸识别的关键环节,人脸检测就是对所输入的图像进行检测,判断图像是否存在人脸,如果存在则返回人脸在图像中的确切位置和范围。由于人脸表情千变万化,可能会有附属物如眼镜、胡须、装饰等,同时图像质量受摄录器材和光照影响很大,人脸识别技术在应用中还面临很多棘手的问题,识别率不高。

4 机器人视觉系统

工业机器人的手眼系统是计算机视觉应用最为成功的领域之一,可快速获取大量信息,使信息加工、控制及信息集成更容易实现。由于工业现场的诸多因素,如光照条件、成像方向均是可控的,有利于构成实际的系统。可以利用计算机视觉检测系统对生产现场进行实时、非接触式产品检测及生产监控,这在现代制造业和一些工业、工程领域已经有了较广泛的应用。

移动机器人与工业机器人不同,它具有行为能力,所以必须解决行为规划问题,使机器人能以智能和灵活的方式对其周围的环境做出反应。随着移动式机器人的发展,越来越多地要求提供视觉能力,包括道路跟踪、回避障碍、特定目标识别等。机器人视觉系统涉及视频信息获取技术、视频信号处理技术、计算机技术、模式识别技术以及人工智能技术等。

机器人视觉主要是借助于计算机来模拟人的视觉功能从客观事物的图像中提取

信息,进行处理并加以理解,最终用于实际检测、测量和控制。其研究中引入了主动视觉的方法,使用距离传感器,并采用了多传感器融合等技术,以实现对道路和障碍的识别处理。机器人视觉系统需要完成从二维投影图像到三维客观世界的变换,也就是根据这种二维投影图像去重建三维的客观世界。

机器人视觉系统除用于工业现场监控外,还可用于一些特殊的场合,如海洋石油开采、海底勘查的水下机器人;用于医疗外科手术及研究的医用机器人;帮助人类探索宇宙的空间机器人;完成特殊任务的核工业机器人和军用机器人等。

计算机视觉检测技术是一个前沿的多学科交叉融合的学科,具有广泛的应用领域和诱人的应用前景。前人的研究虽然提出、解决了一些问题,但由于计算机视觉问题的特殊性和复杂性,还有大量的问题需要研究。研究的重点包括对新方法、新手段的探索;当然,在原有问题上采用新的描述方法、求解手段也是一个可能的突破点。在计算机视觉中计算理论占有十分重要的地位,计算理论的进步、新计算模型的提出可以解决以往一些困难的问题;另一方面,感知手段的进步也可以起到同样的作用。总之,随着对定量研究的重视,新的描述方式、求解手段的研究,以及感知手段的改进,计算机视觉的研究必将迎来一个更加繁荣的时代。

参考文献

[1] 马颂德,张正友.计算机视觉[M].北京:科学出版社,1998:52-60.

[2] 叶声华,邾贵,王仲,等.视觉检测技术及应用[J].中国工程科学,1999,1(1):49-52.

[3] 洪少春.基于计算机的视觉检测技术的原理及应用研究[J].萍乡高专学报,2005,(4):107-111.

[4] 马玉真,胡亮,方志强,等.计算机视觉检测技术的发展及应用研究[J].济南大学学报,2004,18(3):1-7.

[5] 陈宏彩.汽车牌照定位检测技术研究[J].河北省科学院学报,2007,24(3):92-94.

[6] 王德彪,程大章.基于视频图像的运动目标检测技术[J].低压电器,2002,(22):25-27.

[7] 乔世坤.静止背景中基于边界的运动目标检测技术研究[D].哈尔滨:哈尔滨工程大学,2007.

[8] 周兵.运动对象检测及其在视频监控中的应用[D ].北京;北京航空航天大学,2003.

[9] 王崇文,李见为,林国清,等.指纹取像与指纹识别[J].计算机工程与应用,2002,28 (4) :10-12.

[10]洪少春.计算机视觉检测技术在制造业上的应用及发展[J].菏泽学院学报,2006,28(2):43-46.

[11]黎志刚,段锁林,赵建英,等.机器人视觉伺服控制及应用研究的现状[J].2007,28(1):6-13.

人工智能与计算机视觉

过去几年,全球的互联网公司包括谷歌、微软、Facebook以及中国的百度、阿里巴巴都在加强人工智能领域的投资,设立自己的人工智能研究院。vivo是第一家设立专攻人工智能方向研究院的中国手机公司。此举是vivo内部已经确立的一份3-5年的中长期发展的战略规划,未来对人工智能的发展研究是必然趋势,vivo公司创始人兼CEO沈炜曾表示“人工智能和5G的结合将会是5G时代手机发展的趋势”。 今年我们看到vivo在产品上不少创新,比如AI拍照、商用屏下指纹技术等等,这些都是基于生物特征(biometrics)的鉴别技术,除此之外还有对人脸、虹膜、指纹、声音等特征上的识别,这些大多涉及到视觉信息,正是体现了计算机视觉的应用性,那什么是计算机视觉呢? 计算机视觉技术的概念 正像其它学科一样,一个大量人员研究了多年的学科,却很难给出一个严格的定义,模式识别如此,目前火热的人工智能如此,计算机视觉亦如此。与计算机视觉密切相关的概念有视觉感知(visual perception),视觉认知(visual cognition),图像和视频理解( image and video understanding)。这些概念有一些共性之处,也有本质不同。 从广义上说,计算机视觉就是“赋予机器自然视觉能力”的学科。自然视觉能力,就是指生物视觉系统体现的视觉能力。一则生物自然视觉无法严格定义,在加上这种广义视觉定义又“包罗万象”,同时也不太符合40多年来计算机视觉的研究状况,所以这种“广义计算机视觉定义”,虽无可挑剔,但也缺乏实质性内容,不过是一种“循环式游戏定义”而已。 实际上,计算机视觉本质上就是研究视觉感知问题。视觉感知,根据维科百基(Wikipedia)的定义, 是指对“环境表达和理解中,对视觉信息的组织、识别和解释的过程”。根据这种定

计算机视觉与数字摄影测量的结合展望

计算机视觉与数字摄影测量的结合展望摘要:摄影测量在进入数字摄影测量时代就已经与计算机视觉技术紧密的联系在了一起,计算机视觉技术的快速发展给近景摄影测量带来了巨大的变革。本文分别简要介绍了摄影测量和计算机视觉技术,重点阐述了两者的异同点,最后做出总结。 关键字:计算机视觉;数字摄影测量;差异;影响匹配 1前言 摄影测量的发展经过了三个阶段,现已进入数字摄影测量阶段。数字摄影测量以数字影像为基础,通过计算机分析和量测来获取被摄物体的三维空间信息,正在成为国际公认的地球空间数据获取的重要手段[1]。数字摄影测量利用一台计算机,加上专业的摄影测量软件,就代替了过去传统的、所有的摄影测量的仪器。其中包括纠正仪、正射投影仪、立体坐标仪、转点仪、各种类型的模拟测量仪以及解析测量仪。数字摄影测量的发展,计算机不仅可以代替人工进行大量的计算,而且已经完全可能代替人眼来识别同名点,从而为摄影测量开辟了真正的自动化道路[2]。 计算机视觉是一个相对年轻而又发展迅速的领域。80年代以来,计算机视觉的研究已经历了从实验室走向实际应用的发展阶段,而计算机工业水平的飞速提高以及人工智能、并行处理和神经元网络等学科的发展,更促进了计算机视觉系统的实用化和涉足许多复杂视觉过程的研究[3]。其目标是使计算机具有通过二维图像认知三维环境信息的能力,这种能力将不仅使机器能感知三维环境中物体的几何信息,包括它的形状、位置、姿态、运动等,而且能对它们进行描述、存储、识别与理解[4]。数字摄影测量具有类似的目标,也面临着相同的基本问题。数字摄影测量学涉及多个学科,如图像处理、模式识别以及计算机图形学等。由于它与计算机视觉的联系十分紧密,有些专家将其看成是计算机视觉的分支。 2数字摄影测量与计算机视觉的差异 2.1出发点不同导致基本参数物理意义不同 计算机视觉是研究怎样用计算机模拟人的眼睛,实现机器人的视觉,它是以眼睛(摄影机)中心与光轴构成的坐标系为准,它定义的平移量是空间坐标系相对于摄影机坐标系的平移量。而摄影测量是测绘地形图的重要生产手段,它以空间(地面)统一坐标系为基准,如在一个地区进行航空摄影测量,所有摄影机的空间位置与影像的坐标都相对于该空间坐标系。因此,在摄影测量中的“外定向”是确定影像在空间相对于物体的位置与方位;而计算机视觉通常从另一个方向描述这个问题:搜索物体相对于影像的位置与方位。 2.2出发点不同导致基本公式的不同 由于物体与影像基本关系之间的差异,从而引起计算机视觉与摄影测量之间的基本公式的差异。计算机视觉与摄影测量都是研究物体与影像关系的,因此,描述三维物体与二维影像坐标之间的关系公式是它们的基本公式。计算机视觉最基本的公式用齐次坐标的投影方程表达为[5,6]:

计算机视觉检测技术及其在机械零件检测中的应用_张文景

第33卷第5期 1999年5月 上海交通大学学报 JO U RN A L O F SHA N GHA I JIA O T O NG U N IV ERSIT Y Vol.33No.5 M ay 1999  收稿日期:1998-03-16 基金项目:上海市科技发展基金资助项目(951111052)作者简介:张文景(1971~),男,博士生. 文章编号:1006-2467(1999)05-0635-04 计算机视觉检测技术及其在机械零件检测中的应用 张文景, 张文渊, 苏键锋, 许晓鸣 (上海交通大学自动化系,上海200030) 摘 要:基于计算机视觉检测(A VI)技术在检测系统的智能化、柔性、快速性等方面较接触式检测方法具有更大的优越性,综述了其基本原理和分类以及近年来此方面的研究成果.分析了利用AVI 技术对机械零件进行检测的一般方法和系统构成,并探讨了基于CAD 的AV I 的关键环节.最后对AVI 技术的发展趋势提出了作者的观点. 关键词:计算机视觉;计算机视觉检测;计算机辅助设计;机械零件中图分类号:TP 391 文献标识码:A Automated Visual Inspection and Its Application on Inspection of Machined Parts ZH A N G Wen -j ing , ZH AN G W en -y uan , SU J ian -f eng , X U X iao -ming Dept.of Automation,Shang hai Jiaotong Univ.,Shanghai 200030,China Abstract :With development of co mputer vision ,automated visual inspection (AV I )has mor e applications in a variety of fields in industry.AVI takes more advantages in intellig ence,flex ibility and speed o f inspec-tio n sy stem than contacted inspection.T he recent achievemens r esearched by internatio nal scholars in the field of AVI w ere surveyed .Principle and classificatio n o f inspection techniques w ere intro duced .T he anal-ysis for g ener al methods and sy stem of AVI o f machined par ts w as presented.Key technolo gy o f AVI based on CAD w as also discussed.Some o pinio ns about development of AVI w ere proposed at last. Key words :com puter vision;autom ated visual inspection(AVI);com puter aided design (CAD);m achine parts 随着CIM S 的推广应用,企业在向柔性化、自动化发展的进程中,提出了对计算机辅助质量(CAQ )系统的需求.目前,计算机辅助检测计划(CAIP)系统已成为CAQ 系统的重要组成部分,它的核心问题是解决如何检测零件.在柔性制造中坐标测量机(CM M )是重要的检测手段,在制造企业中得到广泛的应用.随着柔性制造系统(FM S)的推广,人们对 检测系统的智能化、柔性、快速性等方面提出了更高的要求,以适应多品种、小批量生产的需要.计算机视觉技术得到不断发展,由于计算机视觉系统可以快速获取大量信息,且易于同设计信息及加工控制信息集成,用于工况监视、现场监控的计算机视觉系统已广泛地应用在工业、商业等领域[1,2].计算机视觉作为一种检测手段已经越来越引起人们的重视,逐步形成一种新的检测技术——计算机视觉检测(Autom ated Visual Inspectio n ,AVI )技术. 本文综合了国内外在AVI 方面的研究成果,总结了利用AVI 技术检测机械零件的一般方法和系

计算机视觉技术

目录 1立体视觉 (1) 1.1计算机视觉技术 (1) 2立体视觉技术 (3) 2.1双目立体视觉技术 (3) 致谢 (8) 附录: (9)

立体视觉 我的毕业论文排版样文 1立体视觉 1.1计算机视觉技术 计算机视觉既是工程领域也是科学领域中的一个富有挑战性的重要研究领域。计算机视觉是一门综合性的学科,它已经吸引了来自各个学科的研究者参加到对它的研究之中,其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学、神经生理学和认知科学等[18]。 视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断和军事等领域中各种智能自主系统中不可分割的一部分。由于它的重要性,一些先进国家,例如美国把对计算机视觉的研究列为对经济和科学有广泛影响的科学和工程中的重大基本问题,即所谓的重大挑战。“计算机视觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力。机器视觉需要图像信号,纹理和颜色建模,几何处理和推理,以及物体建模。一个有能力的视觉系统应该把所有这些处理都紧密地集成在一起[19]。”作为一门学科,计算机视觉开始于60 年代初,但在计算机视觉的基本研究中的许多重要进展是在80 年代取得的。现在计算机视觉已成为一门不同于人工智能、图象处理、模式识别等相关领域的成熟学科[20]。 不少学科的研究目标与计算机视觉相近。这些学科包括图像处理、图像识别、景物分析、图像理解等。由于历史发展或领域本身的特点这些学科互有差别,但又有某种程度的相互重叠。为了清晰起见,把这些与计算机视觉有关的学科从研究目标和方法角度加以归纳[21]。 (1)图像处理 图像处理技术把输入图像转换成具有所希望特性的另一幅图像。例如,可通过处理使输出图像有较高的信噪比,或通过增强处理突出图像的细节,以便于操作员的检验。在计算机视觉研究中经常利用图像处理技术进行预处理和特征抽取。 (2)图像识别 图像识别技术根据从图像抽取的统计特性或结构信息,把图像分成预定的类别。在计算机视觉中图像识别技术经常用于对图像中的某些部分(例如分割区域)的识别和分类。 第 1 页(共9页)

计算机视觉的应用

运动目标检测 目录 基于统计背景模型的运动目标检测方法 背景模型提取 运动目标检测 后处理 基于统计背景模型的运动目标检测方法 问题:(1)背景获取:需要在场景存在运动目标的情况下获得背景图像(2)背景扰动:背景中可以含有轻微扰动的对象,如树枝、树叶的摇动,扰动部分不应该被看做是前景运动目标(3)外界光照变化:一天中不同时间段光线、天气等的变化对检测结果的影响(4)背景中固定对象的移动:背景里的固定对象可能移动,如场景中的一辆车开走、一把椅子移走,对象移走后的区域在一段时间内可能被误认为是运动目标,但不应该永远被看做是前景运动目标(5)背景的更新:背景中固定对象的移动和外界光照条件的变化会使背景图像发生变化,需要及时对背景模型进行更新,以适应这种变化(6)阴影的影响:通常前景目标的阴影也被检测为运动目标的一部分,这样讲影响对运动目标的进一步处理和分析首先利用统计的方法得到背景模型,并实时地对背景模型进行更新以适应光线变化和场景本身的变化,用形态学方法和检测连通域面积进行后处理,消除噪声和背景扰动带来的影响,在HSV色度空间下检测阴影,得到准确的运动目标。 背景模型提取 前提假设在背景模型提取阶段,运动目标在场景区域中运动,不会长时间停留在某一位置视频流中某一像素点只有在前景运动目标通过时,它的亮度值才发生大的变化,在一段时间内,亮度值主要集中在很小的一个区域中,可以用这个区域内的平均值作为该点的背景值。具体实现过程:在YUV颜色空间下,Y值的变化范围为0~255,将该范围划分成若干区间[0,T][T,2T]…[Nt,255],n=255/T,对于每个像素点,统计一段时间内每个区间内亮度值的出现的次数。找出出现次数最多的那个区间,将该区间内所有值的平均值作为背景模型在该点的亮度值。这种方法不受前景运动目标的影响。 运动目标检测 检测当前图像和背景图像中对应像素点的差异,如果差值大于一定阈值,则判定该像素为前景运动目标

人机交互中的计算机视觉技术.

人机交互中的计算机视觉技术 基于视觉的接口概念 计算机视觉是一门试图通过图像处理或视频处理而使计算机具备“ 看” 的能力的计算学科。通过理解图像形成的几何和辐射线测定, 接受器(相机的属性和物理世界的属性, 就有可能 (至少在某些情况下从图像中推断出关于事物的有用信息, 例如一块织物的颜色、一圈染了色的痕迹的宽度、火星上一个移动机器人面前的障碍物的大小、监防系统中一张人脸的身份、海底植物的类型或者是 MRI 扫描图中的肿瘤位置。计算机视觉研究的就是如何能健壮、有效地完成这类的任务。最初计算机视觉被看作是人工智能的一个子方向, 现在已成为一个活跃的研究领域并长达 40年了。 基于视觉的接口任务 至今,计算机视觉技术应用到人机交互中已取得了显著的成功,并在其它领域中也显示其前景。人脸检测和人脸识别获得了最多的关注, 也取得了最多的进展。第一批用于人脸识别的计算机程序出现在 60年代末和 70年代初,但直到 90年代初,计算机运算才足够快,以支持这些实时任务。人脸识别的问题产生了许多基于特征位置、人脸形状、人脸纹理以及它们间组合的计算模型, 包括主成分分析、线性判别式分析、 Gabor 小波网络和 .Active Appearance Model(AAM . 许多公司,例如Identix,Viisage Technology和 Cognitec System,正在为出入、安全和监防等应用开发和出售人脸识别技术。这些系统已经被部署到公共场所, 例如机场、城市广场以及私人的出入受限的环境。要想对人脸识别研究有一个全面的认识,见。 基于视觉的接口技术进展 尽管在一些个别应用中取得了成功,但纵使在几十年的研究之后,计算机视觉还没有在商业上被广泛使用。几种趋势似乎表明了这种情形即将会发生改变。硬件界的摩尔定律的发展, 相机技术的进步, 数码视频安装的快速增长以及软件工具的可获取性(例如 intel 的 OpenCV libraray使视觉系统能够变得小巧、灵

关于计算机视觉的若干思考

浅谈计算机视觉 当看到幻灯片上播放的两张看上去相同的图片,一张毫无秘密,一张却隐藏着机密的时候,我觉得很是神奇,原来还会有这种加密方式。不同于摩斯密码,我觉得这种加密方式正是计算机时代的一个代表。 机器视觉,计算机视觉,图像处理,图像分析,这些名词好像都出现在了 老师的课堂上,通过查阅资料得知,这些名词在技术和应用领域上他们都有着相当大部分的重叠,这些学科的基础理论大致是相同的,甚至让人怀疑他们是同一学科被冠以不同的名称。 但是,又好像存在着一些细小的不同。例如,机器视觉主要是指工业领域 的视觉研究,例如自主机器人的视觉,用于检测和测量的视觉。这表明在这一领域通过软件硬件,图像感知与控制理论往往与图像处理得到紧密结合来实现高效的机器人控制或各种实时操作。计算机视觉的研究对象主要是映射到单幅或多幅图像上的三维场景,例如三维场景的重建。计算机视觉的研究很大程度上针对图像的内容。图像处理与图像分析的研究对象主要是二维图像,实现图像的转化,尤其针对像素级的操作,例如提高图像对比度,边缘提取,去噪声和几何变换如图像旋转。这一特征表明无论是图像处理还是图像分析其研究内容都和图像的具体内容无关。这里,我就计算机视觉进行初步的了解与分析。 计算机视觉,顾名思义,即为利用计算机对图像进行处理的过程。不管进 行何种场景的应用,都必须进行识别,运动,场景重现,图像恢复等基本问题的算法处理。其系统主要包括:图像获取,预处理,特征提取,检测分割,高级处理等基本组成。

下面就图像加密过程进行初步分析:首先,进行图像的获取,拿到一张图片利用一个或多个图像感知器提取数字图像,根据感知器的类型会得到不同类型的数字图像;接着,进行预处理,在对图像实施具体的计算机视觉方法来提取某种特定的信息前,一种或一些预处理往往被采用来使图像满足后继方法的要求。例如:二次取样保证图像坐标的正确;平滑去噪滤除感知器引入的设备噪声等;然后,进行特征提取,提取出这幅图像的特征要素;进行检测分割,分割出所要进行隐藏图像的部分,以便于进行后续操作;再进行高级处理,及隐藏信息。 通过查阅资料得知,其中一种隐藏信息的方式为将数字图像转化为二值图像,即只有黑和白的像素,不存在灰色过度的图像,进行处理。利用二值图像的算法主要有图像分块嵌入法,流程修改嵌入法,基于图像特征嵌入法等。但是,利用二值图像嵌入信息,也有不足:在黑白图像中,若把一片全是“0”像素中间突然嵌入一个“1”像素,相当于在一片黑图片当中突然点了一个白点,这会很容易引起人眼的察觉,故而不是很好的信息嵌入策略。 通过了解,我发现有关这一方面的研究还有更深的发展空间,而且在信息化的今天,利用计算机视觉进行图像的处理以及信息的嵌入可以更好的为我们的工作生活提供便利。 且计算机视觉是一个交叉学科,需要多种学科的共同发展,符合当今时代特征。所以,在我看来,计算机视觉是一个未来前景广阔,信息集成度高,市场认可度高的研究方向。

计算机视觉检测技术及其在机械零件检测中的应用

泰山职业技术学院2006级毕业论文 目录 摘要 (1) 1自动检测的原理和方法 (2) 1.1检测和检验的不同意义 (2) 1.1.1质量控制中的检测 (2) 1.1.2质量控制中的检验 (3) 1.2统计质量控制基础 (3) 1.2.1统计质量控制的推断 (3) 1.2.2制造中的偏差 (4) 2计算机视觉检测技 (4) 2.1 AVI技术 (4) 2.1.1视觉检测分类 (5) 2.1.2视觉检测方法 (5) 2.1.3视觉检验方法 (5) 2.2机械零件的AVI (5) 2.3基于CAD的AVI (6) 2.4 AVI技术展望 (7) 参考文献 (8) 致谢 (9)

计算机视觉检测技术及其在机械零件检测中的应用 张文景,张文渊,苏键锋,许晓鸣 摘要:基于计算机视觉检测(AVI)技术在检测系统的智能化、柔性、快速性等方面较接触式检测方法具有更大的优越性,综述了其基本原理和分类以及近年来此方面的研究成果.分析了利用AVI技术对机械零件进行检测的一般方法和系统构成,并探讨了基于CAD的AVI的关键环节.最后对AVI技术的发展趋势提出了作者的观点. 关键词:计算机视觉;计算机视觉检测;计算机辅助设计;机械零件 中图分类号:TP 391 文献标识码:A Automated Visual Inspection and Its Application on Inspection of Machined Parts ZHANG Wen-jing,ZHANG Wen-yuan,SU Jian-feng, XU Xiao-ming Dept. of Automation, Shanghai Jiaotong Univ., Shanghai 200030, China Abstract:With development of computer vision,automated visual inspection (AVI) has more applications in a variety of fields in industry.AVI takes more advantages in intelligence,flexibility and speed of inspection system than contacted inspection.The recent achievemens researched by international scholars in the field of AVI were surveyed.Principle and classification of inspection techniques were introduced.The analysis for general methods and system of AVI of machined parts was presented.Key technology of AVI based on CAD was also discussed.Some opinions about development of AVI were proposed at last. Key words:computer vision;automated visual inspection(AVI);computer aided design(CAD);machine parts

计算机视觉期末考点

计算机视觉重点考点集锦 手工整理,如有错误,慎之! 第一章 1、计算机视觉:研究用计算机来模拟生物视觉功能的科学和技术. 2、视觉表示框架的三个阶段(也就是提取三阶段):1)第一阶段是将输入的原始图像进行处理,抽取基本特征形成基元图。2)第二阶段(中期阶段)是指在以观测者为中心的坐标系中,由输入图像和基元图恢复场景可见部分的深度、法线方向、轮廓等,形成二维半图。3)第三阶段(后期阶段)是在以物体为中心的坐标系中,由输入图像、基元图、二维半图来恢复、表示和识别三维物体。 第三章 1、二值图像的特点:a.假定二值图像大小为mxn,其中物体像素值为1,背景像素值0;b.二值图像处理的算法简单,易于理解和实现,计算速度快;c. 二值视觉所需的内存小,对计算设备要求低;d.二值视觉系统技术可用于灰度图像视觉系统 2、二值图像的获取:1)通过图像的阙值2)通过硬件实现3)通过软件实现 3、图像分割:把图像划分成区域,使每一个区域都对应一个候选的目标。 4、图像二值化:设一副灰度图像中物体的灰度分布在某一区间内,通过阙值运算后的图像为二值图像 5、投影分类及作用:1)水平/垂直投影;给定直线上的投影;对角线投影(仿射变换)2)投影能表现图像的某种信息。 6、4-连通成分序贯法(标记算法)步骤: 1)从左到右,从上到下扫描图像 2)①如果上面点和左面点有一个标记,复制这一标记②如果两点相同的标记,复制这一标记③如果两点有不同标记,则复制上点标记且将两个标记输入到等价表中作为等价标记④否则给这一像素点分配一个新的标记并将这个标记输入到等价表 3)如考虑更多的点,回到第二步 4)在等价表中的每一等价集中找到最低的标记 5)扫描图像,用等价表中的最低标记取代每一个标记 7、欧拉数:E=C—H,连通成分数(C)—空洞数(H) 8、扩展与收缩:1)要掌握用结构元进行扩展与收缩 2)先扩展后收缩:补上不希望存在的洞 3)先收缩后扩展:去除孤立的噪声点 4)定义:①扩展:如果背景和洞的像素点临点显1,则该点从0变为1 ②收缩:如果物体像素点连点为0,则将该点从1变为0 9、开、关运算:1)开运算:先腐蚀后膨胀,去除比结构元小的区域的像素点 2)关运算:显膨胀后腐蚀,填充比结构元小的孔洞 第四章

计算机视觉简介

人们常说:眼睛是心灵的窗户,通过眼睛人们可以轻易地交流情感,眼睛也是与外界交流的窗口,这些都是通过“看”来完成的。 人们可以很容易“看到”一幅画,但这一“简单”过程并不如此简单,大致上它可以分为以下几个阶段:首先是通过眼睛将图成像在视网膜上;其次大脑对图像进行理解;最后根据处理的结果做出反应。用比较专业一点的语言来描述,该过程包括了识别、描述与理解三个层次;这其中还隐含了边缘检测(各物体的轮廓等)、图像的分割(各物体区域的划分)等阶段。以上实际上概述了视觉系统的三个层次,即低层阶段:基于图像特征提取及分割阶段;中层阶段:基于物体的几何模型与图像特性表达阶段;高层阶段:基于景物知识的描述、识别与理解阶段,这是根据先验知识介入的程度划分的,且实现起来也越来越困难。 毫无疑问,如何人工实现这一过程是极具挑战性和应用前景的一项工作,计算机视觉也因此而应运而生。计算机视觉是研究用计算机和成像设备来模拟人和生物视觉系统功能的技术学科,其目标是从图像或图像序列中获取对外部世界的认知和理解,即利用二维图像恢复三维环境中物体的几何信息,比如形状、位置、姿态、运动等,并能描述、识别与理解。 计算机视觉的基础是各种成像设备,例如CCD(Charge Coupled Device )摄像机(数码相机属于此类型)、红外摄像机、医学上常用的核磁共振成像、X射线成像等,这些设备不仅可以成像,还可以获取比人眼更丰富的图像,人们可以形象地把摄像机看成计算机视觉的视网膜部分。可以说从人类拍摄出第一幅图像开始,就为计算机视觉的诞生奠定了基础。 而计算机视觉的核心是数字电子计算机,其发展可谓突飞猛进,在计算和存储能力上,人脑已经无法与之相比,人们的目标就是利用计算机非凡的计算处理能力来代替人脑实现对图像的理解,而计算机日新月异的发展也使得这一愿望越来越成为可能。 用于指导“计算机”这个大脑运作的核心是计算机视觉的理论方法,计算机视觉使用的理论方法主要基于几何、概率和运动学计算与三维重构的视觉计算理论,它的基础包括射影几何学、刚体运动力学、概率论与随机过程、图像处理、人工智能等理论。在20世纪70年代,视觉研究大多采用模式识别的方法;80年代,开始采用空间几何的方法以及物理知识进行视觉研究;90年代以后,随着智能机器人视觉研究的发展,引入了许多新的理论与技术如主动视觉理论、不变量理论、融合技术等,并应用于许多计算机视觉系统中。 研究计算机视觉,不得不提的是英国已故科学家戴维·马尔(David Marr),他在计算机视觉发展史上可谓写下了浓重的一笔。在20世纪70年代末,他提出了第一个

浅谈机器人视觉技术

浅谈机器人视觉技术 摘要 机器人视觉是使机器人具有视觉感知功能的系统,是机器人系统组成的重要部分之一。机器人视觉可以通过视觉传感器获取环境的二维图像,并通过视觉处理器进行分析和解释,进而转换为符号,让机器人能够辨识物体,并确定其位置。机器人视觉广义上称为机器视觉,其基本原理与计算机视觉类似。计算机视觉研究视觉感知的通用理论,研究视觉过程的分层信息表示和视觉处理各功能模块的计算方法。而机器视觉侧重于研究以应用为背景的专用视觉系统,只提供对执行某一特定任务相关的景物描述。机器人视觉硬件主要包括图像获取和视觉处理两部分,而图像获取由照明系统、视觉传感器、模拟-数字转换器和帧存储器等组成。本文介绍了机器人的发展以及视觉计算理论和视觉的关键技术。 关键词:机器人、视觉、计算、关键技术 一、机器人发展概述 科学技术的发展,诞生了机器人。社会的进步也提出要求,希望创造出一种能够代替人进行各种工作的机器,甚至从事人类不能及的事情。自从1959年诞生第一台机器人以来,机器人技术取得了很大的进步和发展,至今已成为一门集机械、电子、计算机、控制、传感器、信号处理等多学科门类为一体的综合性尖端科学。当今机器人技术的发展趋势主要有两个突出的特点:一个是在横向上,机器人的应用领域在不断扩大,机器人的种类日趋增多;另一个是在纵向上,机器人的性能不 断提高,并逐步向智能化方向发展。前者是指应用领域的横向拓宽,后者是在性能及水平上的纵向提高。机器人应用领域的拓宽和性能水平的提高,二者相辅相成、相互促进。 智能机器人是具有感知、思维和行动功能的机器,是机构学、自动控制、计算机、人工智能、微电子学、光学、通讯技术、传感技术、仿生学等多种学科和技术的综合成果阎。智能机器人可获取、处理和识别多种信息,自主地完成较为复杂的操作任务,比一般的工业机器人具有更大的灵活性、机动性和更广泛的应用领域。要使机器人拥有智能,对环境变化做出反应,首先,必须使机器人具有感知

计算机视觉各种方法

第33卷第1期自动化学报Vol.33,No.1 2007年1月ACTA AUTOMATICA SINICA January,2007 车辆辅助驾驶系统中基于计算机视觉的 行人检测研究综述 贾慧星1章毓晋1 摘要基于计算机视觉的行人检测由于其在车辆辅助驾驶系统中的重要应用价值成为当前计算机视觉和智能车辆领域最为活跃的研究课题之一.其核心是利用安装在运动车辆上的摄像机检测行人,从而估计出潜在的危险以便采取策略保护行人.本文在对这一问题存在的困难进行分析的基础上,对相关文献进行综述.基于视觉的行人检测系统一般包括两个模块:感兴趣区分割和目标识别,本文介绍了这两个模块所采用的一些典型方法,分析了每种方法的原理和优缺点.最后对性能评估和未来的研究方向等一系列关键问题给予了介绍. 关键词行人检测,车辆辅助驾驶系统,感兴趣区分割,目标识别 中图分类号TP391.41 A Survey of Computer Vision Based Pedestrian Detection for Driver Assistance Systems JIA Hui-Xing ZHANG Yu-Jin Abstract Computer vision based pedestrian detection has become one of the hottest topics in the domain of computer vision and intelligent vehicle because of its potential applications in driver assistance systems.It aims at detecting pedestrians appearing ahead of the vehicle using a vehicle-mounted camera,so as to assess the danger and take actions to protect pedestrians in case of danger.In this paper,we give detailed analysis of the di?culties lying in the problem and review most of the literature.A typical pedestrian detection system includes two modules:regions of interest(ROIs) segmentation and object recognition.This paper introduces the principle of typical methods of the two modules and analyzes their respective pros and cons.Finally,we give detailed analysis of performance evaluation and propose some research directions. Key words Pedestrian detection,driver assistance system,ROIs segmentation,object recognition 1引言 车辆辅助驾驶系统中基于计算机视觉的行人检测是指利用安装在运动车辆上的摄像机获取车辆前面的视频信息,然后从视频序列中检测出行人的位置.由于它在行人安全方面的巨大应用前景,成为智能车辆、计算机视觉和模式识别领域的前沿研究课题.欧盟从2000年到2005年连续资助了PROTECTOR[1]和SAVE-U[2]项目,开发了两个以计算机视觉为核心的行人检测系统;意大利Parma[3]大学开发的ARGO智能车也包括一个行人检测模块;以色列的MobilEye[4]公司开发了芯 收稿日期2006-3-14收修改稿日期2006-6-17 Received March14,2006;in revised form June17,2006 国家自然科学基金(60573148),教育部高等学校博士学科点专项科研基金(20060003102)资助 Supported by National Natural Science Foundation of P.R.China(60573148),Specialized Research Fund for the Doc-toral Program of Higher Education(20060003102) 1.清华大学电子工程系北京100084 1.Department of Electronic Engineering,Tsinghua University, Beijing100084 DOI:10.1360/aas-007-0084片级的行人检测系统;日本本田汽车公司[5]开发了基于红外摄像机的行人检测系统;国外的大学如CMU[6]、MIT[7,8]和国内的西安交通大学[9]、清华大学[10]也在该领域做了许多研究工作. 车辆辅助驾驶系统中基于计算机视觉的行人检测属于计算机视觉中人体运动分析的研究范畴,其主要任务是在运动摄像机下快速准确地检测行人.本文主要针对这一特定领域对相关的文献进行综述,重点分析常用方法的原理和优缺点,以期对相关的科技人员起到指导作用.对监控系统和体育运动分析领域中人体检测感兴趣的读者可以参考综述文献[11~14]. 行人检测除了具有一般人体检测具有的服饰变化、姿态变化等难点外,由于其特定的应用领域还具有以下难点:摄像机是运动的,这样广泛应用于智能监控领域中检测动态目标的方法便不能直接使用;行人检测面临的是一个开放的环境,要考虑不同的路况、天气和光线变化,对算法的鲁棒性提出了很高的要求;实时性是系统必须满足的要求,这 c 2007by Acta Automatica Sinica.All rights reserved.

计算机视觉

计算机视觉 计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,用电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。这里所指的信息指Shannon定义的,可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。 目录 1定义 2解析 3原理 4相关 5现状 6用途 7异同 8问题

9系统 10要件 11会议 12期刊 1定义 计算机视觉是使用计算机及相关设备对生物视觉的一种模拟。它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息,就像人类和许多其他类生物每天所做的那样。 计算机视觉是一门关于如何运用照相机和计算机来获取我们所需的,被拍摄对象的数据与信息的学问。形象地说,就是给计算机安装上眼睛(照相机)和大脑(算法),让计算机能够感知环境。我们中国人的成语"眼见为实"和西方人常说的"One picture is worth ten thousand words"表达了视觉对人类的重要性。不难想象,具有视觉的机器的应用前景能有多么地宽广。 计算机视觉既是工程领域,也是科学领域中的一个富有挑战性重要研究领域。计算机视觉是一门综合性的学科,它已经吸引了来自各个学科的研究者参加到对它

的研究之中。其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学,神经生理学和认知科学等。 2解析 视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断,和军事等领域中各种智能/自主系统中不可分割的一部分。由于它的重要性,一些先进国家,例如美国把对计算机视觉的 计算机视觉与其他领域的关系 研究列为对经济和科学有广泛影响的科学和工程中的重大基本问题,即所谓的重大挑战(grand challenge)。计算机视觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力。机器视觉需要图象信号,纹理和颜色建模,几何处理和推理,以及物体建模。一个有能力的视觉系统应该把所有这些处理都紧密地集成在一起。作为一门学科,计算机视觉开始于60年代初,但在计算机视觉的基本研究中的许多重要进展是在80年代取得的。计算机视觉与人类视觉密切相关,对人类视觉有一个正确的认识将对计算机视觉的研究非常有益。为此我们将先介绍人类视觉。 3原理 计算机视觉就是用各种成象系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成处理和解释。计算机视觉的最终研究目标就是使计算机能象人那样通过视觉观察和理解世界,具有自主适应环境的能力。要经过长期的努力才能达到的目标。因此,在实现最终目标以前,人们努力的中期目标是建立一种视觉系统,这个系统能依据视觉敏感和反馈的某种程度的智能完成一定的任务。例如,计算机视觉的一个重要应用领域就是自主车辆的视觉导航,还没有条件实现象人那样能识别和理解任何环境,完成自主导航的系统。因此,人们努力的研究目标是实现在高速公路上具有道路跟踪能力,可避免与前方车辆碰撞的视觉辅助驾驶系统。这里要指出的一点是在计算机视觉系统中计算机起代替人脑的作用,但并不意味

计算机视觉期末复习

一、 1.什么是计算机视觉?理解计算机视觉问题的产生原理。 研究用计算机来模拟生物视觉功能的技术学科。具体来说,就是让计算机具有对周围世界的空间物体进行传感、抽象、分析判断、决策的能力,从而达到识别、理解的目的。 2.直方图的均衡化 处理的“中心思想”是把原始图像的灰度直方图从比较集中的某个灰度区间变成在全部灰度范围内的均匀分布。直方图均衡化就是对图像进行非线性拉伸,重新分配图像像素值,使一定灰度范围内的像素数量大致相同。直方图均衡化就是把给定图像的直方图分布改变成“均匀”分布直方图分布。 是将原图像通过某种变换,得到一幅灰度直方图更为均匀分布的新图像的方法。设图像均衡化处理后,图像的直方图是平直的,即各灰度级具有相同的出现频数,那么由于灰度级具有均匀的概率分布,图像看起来就更清晰了。 二、 1.常见的几何变换:平移T x 为点(x ,y )在x 方向要平移的量。 旋转 变尺度:x 轴变大a 倍,y 轴变大b 倍。 2.卷积掩膜技术:(,)(,)(,)(,)m n f i j h i m j n g m n =--∑∑ 对应相乘再相加 掩膜的有效应用——去噪问题 3. 均值滤波器(低通):抑制噪声 主要用于抑制噪声,对每一个目标像素值用其局部邻域内所有像素值的加权均值置换。con 命令 高斯滤波器:一个朴素的道理,距离目标像素越近的点,往往相关性越大,越远则越不相干。所以,高斯 滤波器根据高斯函数选择邻域内各像素的权值 medfilt1 。 区别方法是:高通滤波器模板的和为0,低通滤波器模板的和为1 常用的非线性滤波器:中值滤波;双边滤波;非局部滤波 4.边缘检测算子:通过一组定义好的函数,定位图像中局部变换剧烈的部分(寻找图像边缘)。主要方法有:Robert 交叉梯度,Sobel 梯度,拉普拉斯算子,高提升滤波,高斯-拉普拉斯变换(都是高通滤波器) Canny 边缘检测 算法步骤:1. 用高斯滤波器平滑图像. 2. 用一阶偏导有限差分计算梯度幅值和方向. 3. 对梯度幅值进行非极大值抑制 . 4. 用双阈值算法检测和连接边缘. 5.分割(大题 伪码?) (1)经典方法是基于灰度阈值的分割方法 *介绍单值阈值,它把一幅灰度图像转换成二值图像 *求T 的常用的方法是求解灰度直方图中的双峰或者多峰,并以两峰之间的谷底作为阈值。 *全局阈值是指整幅图像使用同一个阈值做分割处理,并产生一个二值图,区分出前景对象和背景。适用于背景和前景对比度大的图像 算法实现:-- 选取一个合适的阈值T ,逐行扫描图像 – 凡灰度级大于T 的,颜色置为255;凡灰度级小于T 的,颜色置为0 (2)自适应阈值:解决单值阈值无法工作的一个方法是将图像分割为子图像,并分别进行阈值化处理 6.Hough 变换:可用于将边缘像素连接起来得到边界曲线,主要优点在于受噪声和曲线间断的影响较小(鲁棒性好) ???≤>=T y x f T y x f y x g ),( 0),( 1),(如果如果1100cos sin 0[1][1]sin cos 0001x y x y θθθθ-?? ? = ? ???110000[1][1]0000a x y x y b ab ?? ?= ? ???(,)1[,][,]k l N h i j f k l M ∈=∑????? ??=1010001]1[]1[0011y x T T y x y x

浅谈计算机视觉与数字摄影测量

浅谈计算机视觉与数字摄影测量 发表时间:2018-06-19T16:47:42.070Z 来源:《基层建设》2018年第12期作者:熊健1 汪军2 施航3 [导读] 摘要:计算机视觉是数字摄影测量的重要组成部分,研究其相关课题有着重要意义。 1江苏省地质勘查技术院江苏南京 210000;2安徽省第四测绘院安徽合肥 230000 3华东冶金地质勘查局八一一地质队安徽滁州 239000 摘要:计算机视觉是数字摄影测量的重要组成部分,研究其相关课题有着重要意义。本文首先对相关内容做了概述,分析了计算机视觉与数字摄影测量的处理流程,并结合相关实践经验,分别从多个角度与方面就计算机视觉技术在影像处理系统中的实际应用展开了研究,阐述了个人对此的几点看法与认识,望有助于相关工作的实践。 关键词:计算机;视觉;数字摄影;测量 1前言 计算机视觉与数字摄影测量是一项实践性较强的综合性工作,其具体实施方法的特殊性不言而喻。该项课题的研究,将会更好地提升对计算机视觉的分析与掌控力度,从而通过合理化的措施与途径,进一步优化该项工作的最终整体效果。 2计算机视觉技术核心问题 视觉问题复杂性的本质在于相对声音等物理信号的描述,视觉信号充满了非常丰富的信息,描述起来也更加困难。比如,很多图像中蕴含了大量简单(如颜色、形状、纹理、几何特征等)及复杂(如场景、字符、物体分布、人物而部特征、人体姿势等)信息并具有较大的动态范围和主观性,如何攻克图像信息提取过程中的各种难题一直是当今计算機图像学研究的热点问题。而且,在科学家们还未完全破译生物视觉系统的奥秘的前提下,大多数CV问题只能采用“逆向推导机制”—依据己知或假设的关联将视觉系统的输入(数字图像)和输出(语义描述)对应起来,通过图片猜测真实世界物体具有的形状,照明度以及颜色分布。因此,基于概率论和数理统计的数学模型是最适合解决这类逆推问题的工具,这也是目前CV领域普遍采用各种统计模型和机器学习算法的本质原因。由于各种学习机制和统计模型需要基于先验知识并建立在对待测图像内容的约束、简化及假设的基础上,和生物视觉几亿年的发展进化相比,其建立的数学模型也只能片而而且粗糙地描绘出视觉系统输入与输出之间的关系。因此,对某组特定图像检测时表现十分优秀的系统,往往对另一组语义相同的图片素手无策;很多看似稳定的机器学习机制,在增加样本种类和数量后,检测率反而会下降;很多设计复杂的检测算法在实际应用中的表现反而不如一些简单且基本的数学描述困。 3计算机视觉与数字摄影测量的处理流程 3.1立体视觉 立体视觉是计算机视觉中的一个重要分支,一直是计算机视觉研究的重点和热点之一,在20多年的发展过程中,逐渐形成了自己的方法和理论。立体视觉的基本原理是从两个(或多个)视点观察同一景物,以获取在不同视角下的感知图像,通过三角测量原理计算像像素间的位置偏差(即视差)来获取景物的三维信息,这一过程与人类视觉的立体感知过程是类似的。一个完整的立体视觉系统通常可分为图像获取、摄像机定标、特征提取、影像匹配、深度确定及内插等6个大部分。其中影像匹配是立体视觉中最重要也是最困难的问题,也是计算机视觉和数字摄影测量的核心问题。 3.2影像匹配 立体视觉的最终目的是为了恢复景物可视表面的完整信息。当空间三维场景被投影为二维图像时,同一景物在不同视点下的图像会有很大不同,而且场景中的诸多因素,如光照条件,景物几何形状和物理特性、噪声干扰和畸变以及摄像机特性等,都被综合成单一的图像中的灰度值。因此,要准确地对包含了如此之多不利因素的图像进行无歧义的匹配,显然是十分困难的。 在摄影测量中最基本的过程之一就是在两幅或者更多幅的重叠影像中识别并定位同名点,以产生立体影像。在模拟摄影测量和解析摄影测量中,同名点的识别是通过人工操作方式完成的;而在数字摄影测量中则利用计算机代替人工解决同名点识别的问题,即采用影像匹配的方法。 3.3多目立体视觉 根据单张相片只能确定地面某个点的方向,不能确定地面点的三维空间位置,而有了立体像对则可构成与地面相似的立体模型,解求地面点的空间位置。双目立体视觉由不同位置的两台或者一台摄像机(CCD)经过移动或旋转拍摄同一幅场景,就像人有了两只眼睛,才能看三维立体景观一样,然后通过计算空间点在两幅图像中的视差,获得该点的三维坐标值。现在的数字摄影测量中的立体像对技术通常是在一条基线上进行的,但是由于采用计算机匹配替代人眼测定影像同名像对时存在大量的误匹配,使自动匹配的结果很不可靠。其存在的问题主要是,对存在特殊结构的景物,如平坦、缺乏纹理细节、周期性的重复特征等易产生假匹配;在摄像机基线距离增大时,遮挡严重,能重建的空间点减少。为了解决这些问题,降低双目匹配的难度,自1986年以来出现了三目立体视觉系统,即采用3个摄像机同时摄取空间景物,通过利用第三目图像提供的信息来消除匹配的歧义性。采用“多目立体视觉技术”可以利用摄影测量的空中三角测量原理,对多度重叠点进行“多方向的前方交会”,既能较有效地解决随机的误匹配问题,同时又能增加交会角,提高高程测量的精度。这项技术的应用,将很大程度地解决自动匹配结果的不可靠性,提高数字摄影测量系统的准确性。 4计算机视觉技术在影像处理系统中的实际应用 4.1计算机视觉技术关于图像的预处理的應用 影像测量系统在采集图像的时候,很容易受到周围环境的影响,例如:电磁波的干扰,光的折射,温度的影响等,这将很容易导致测量系统采集到事物图像在播发过程中都会夹杂着刺耳的噪声,对测量物品的边缘描述过于模糊,使得零件的精准度的测量受到了影响。因此需要把计算机视觉技术和影响测量系统的应用结合在一起,在测量产品,处理图像过程中,需要进行原始图像的修改和清晰度的矫正并且选择性的过滤影响产品测量的噪声。由于在测量过程中结合了计算机视觉技术,所以在图像的预处理的时候,不需要对图画质量的降低,可以运用计算机视觉技术对于图像进行修改,重要的部位采用灰色直方图修改技术特别标出,其他部位选择性消除。虽然计算机技术跟影像测量系统的结合很好的处理了这些的问题,但是也要避免在测量过程中受到噪音的干扰,从而使得图像变质。因此,在测量的时候可以先对周围环境进行预处理,采用计算机视觉技术中的边缘保持滤波算法降低周围环境的噪声影响,从而保证了测量图像的精确性。 4.2计算机视觉技术关于图像边缘处理的应用

相关主题