搜档网
当前位置:搜档网 › 计算机视觉技术概述

计算机视觉技术概述

计算机视觉技术概述
计算机视觉技术概述

计算机视觉现状及应用发展研究

目录

摘要 (3)

绪论 (4)

第一章概述 (5)

1.1 计算机视觉技术是什么 (5)

1.2 计算机视觉技术的原理 (5)

第二章计算机视觉技术的发展 (7)

2.1 计算机视觉技术的发展 (7)

2.2 计算机视觉现状 (9)

第三章计算机视觉技术的应用 (11)

3.1 应用概述 (11)

3.2视觉测试技术 (12)

3.3计算机视觉在工农业检测中的应用 (13)

第四章计算机视觉技术的图像处理方发 (14)

4.1 图像的增强 (14)

4.2图像的平滑 (14)

4.3 图像的数据编码和传输 (14)

4.4 边缘锐化 (15)

4.5 图像的分割 (15)

4.5.1数据驱动的分割 (15)

4.5.2模型驱动的分割 (16)

4.5.3图像分割的半自动方法 (16)

4.6 图像的识别 (17)

4.7视觉技术的研究 (17)

4.7.1计算机视觉研究的对象与方法 (18)

4.7.2计算机视觉的应用领域 (18)

第五章计算机视觉的发展趋势 (20)

5.1 计算机视觉的发展趋势 (20)

参考文献 (22)

摘要

计算机视觉技术集数字图像处理、数字信号处理、光学、物理学、几何学、应用数学、模式识别7XA.工智能等知识于一体.其应用已经涉及到计算几何、计算机图形学、图像处理、机器人学等领域。文中简要地回顾了计算机视觉技术的发展史。利用工业摄像镜头替代目视作为传感器,通过图像采集。图像处理,图像识别等一系列操作。达到在线对包装产品进行标签检测的目的。

关键词计算机视觉图像处理视觉系统图像识别检测标签

绪论

计算机视觉系统一般有光源、摄像机、采集卡及PC软件系统等组成,可以完成图像的采集与处理、目标的识别功能,视觉系统的结构一般是从系统的模型的角度理解的。

计算机视觉既是工程领域,也是科学领域中的一个富有挑战性重要研究领域。计算机视觉是一门综合性的学科,它已经吸引了来自各个学科的研究者参加到对它的研究之中。其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学,神经生理学和认知科学等。

计算机视觉学所研究的对象,简单地说就是研究如何让计算机通过图象传感器或其它光传感器来感知、分析和理解周围环境。

人类感知外界环境主要通过视觉,听觉和触觉等四大感觉系统。其中视觉系统是最复杂的。人类从外界获得的信息中视觉信号量最大。

模仿人类的视觉系统,计算机视觉系统中信息的处理和分析大致可以分成两个阶段:图象处理阶段又称视觉处理中的低水平和中水平阶段;图象分析、理解阶段又称视觉处理中的高水平处理阶段。

在图象分析和理解阶段,计算机根据事先存贮在数据库中的预知识模型,识别出各个基元或某些基元组合所代表的客观世界中的某些实体称之为模型匹配以及根据图象中各基元之间的关系在预知识的指导下得出图象所代表的实际景物的含义,得出图象的解释或描述。

必须强调,预知识在视觉系统中起着相当重要的作用。在预知识库中存放着各种实际可能遇到的物体的知识模型,和实际景物中各种物体之间的约束关系。计算机的作用是根据被分析的图象中的各基元及其关系,利用预知识作为指导,通过匹配,搜索和推理等手段,最终得到对图象的描述。在整个过程中预知识时刻提供处理的样板和证据。每一步的处理结果随时同预知识进行对比。有时,处理的中间结果和最终结果还要馈送给预知识库作为知识的更新和积累。

第一章概述

1.1 计算机视觉技术是什么

计算机视觉(Computer Vision, CV)是一门研究如何让计算机达到人类那样“看”的学科。更准确点说,它是利用摄像机和电脑代替人眼使得计算机拥有类似于人类的那种对目标进行分割、分类、识别、跟踪、判别决策的功能。计算机视觉是使用计算机及相关设备对生物视觉的一种模拟,是人工智能领域的一个重要部分,它的研究目标是使计算机具有通过二维图像认知三维环境信息的能力。计算机视觉是以图象处理技术、信号处理技术、概率统计分析、计算几何、神经网络、机器学习理论和计算机信息处理技术等为基础,通过计算机分析与处理视觉信息。作为一个新兴学科,计算机视觉是通过对相关的理论和技术进行研究,从而试图建立从图像或多维数据中获取“信息”的人工智能系统。计算机视觉是一门综合性的学科,它已经吸引了来自各个学科的研究者参加到对它的研究之中。其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学,神经生理学和认知科学等。计算机视觉也是当前计算机科学中的一个非常活跃的领域,计算机视觉领域与图像处理,模式识别,投影几何,统计推断,统计学习等学科密切相关,近年来,与计算机图形学,三维表现等学科也发生了很强的联系。

目前,计算机视觉技术已经应用在制造业、工业检验、文档分析、医疗诊断、军事目标跟踪、自主导航等系统当中

1.2 计算机视觉技术的原理

计算机视觉就是用各种成象系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成处理和解释。计算机视觉的最终研究目标就是使计算机能象人那样通过视觉观察和理解世界,具有自主适应环境的能力。要经过长期的努力才能达到的目标。因此,在实现最终目标以前,人们努力的中期目标是建立一种视觉系统,这个系统能依据视觉敏感和反馈的某种程度的智能完成一定的任务。例如,计算机视觉的一个重要应用领域就是自主车辆的视觉导航,还没有条件实现象人那样能识别和理解任何环境,完成自主导航的系统。因此,人们努力的研究目标是实现在高速公路上具有道路跟踪能力,可避免与前方车辆碰撞的视觉辅助驾驶系统。这里要指出的一点是在计算机视觉系统中计算机起代替人脑的作用,但并不意味着计算机必须按人类视觉的方法完成视觉信息的处理。计算机视觉可以而

且应该根据计算机系统的特点来进行视觉信息的处理。但是,人类视觉系统是迄今为止,人们所知道的功能最强大和完善的视觉系统。如在以下的章节中会看到的那样,对人类视觉处理机制的研究将给计算机视觉的研究提供启发和指导。因此,用计算机信息处理的方法研究人类视觉的机理,建立人类视觉的计算理论,也是一个非常重要和信人感兴趣的研究领域。这方面的研究被称为计算视觉(Computational Vision)。计算视觉可被认为是计算机视觉中的一个研究领域。

第二章计算机视觉技术的发展

2.1 计算机视觉技术的发展

计算机视觉是在20世纪50年代从统计模式识别开始的.当时的工作主要集中在二维图像分析和识别上,如光学字符识别.工件表面、显微图片和航空图片的分析和解释等.60年代,Roberts(1965)通过计算机程序从数字图像中提取出诸如立方体、楔形体、棱柱体等多面体的三维结构,并对物体形状及物体的空间关系进行描述[Roberts 1965]。到了70年代,已经出现了一些视觉应用系统『Guzman 1969,Maekworth 1973,』。70年代中期,麻省理工学院(MIT)人工智能(AI)实验室正式开设“机器视觉”(Machine Vision)课程,由国际著名学者B.K.P.Hom 教授讲授。80年代以来,计算机视觉的研究已经历r从实验室走向实际应用的发展阶段。而计算机工业水平的飞速提高以及人工智能、并行处理和神经元网络等学科的发展,更促进了计算机视觉系统的实用化和涉足许多复杂视觉过程的研究。目前,计算机视觉技术正在广泛的应用于计算几何、计算机图形学、图像处理、机器人学等多个领域中。

二十年前,计算机的出现使工作场所出现革命化发展。直到现在,约75%的办公室工作通过计算机和互联网来实现。1990年,大约15%美国家庭拥有了一台计算机,现在增加到70%。计算机视觉(Computer v|si0n)一词最早出现在P.H.Westonl 975 年的论文中。计算机视觉是以视觉处理理论为中心,属于人工智能范畴的一个新领域。它也是以图像处理、模式识别、计算机技术和生理学心理学为基础的信息处理科学中的一个重要分支。计算机视觉技术集数字图像处理、数字信号处理、光学、物理学、几何学、应用数学、模式识别及人工智能等知识于一体,其应用已经涉及到计算几何、计算机图形学、图像处理、机器人学等领域。计算机视觉既是工程领域,也是科学领域中的一个富有挑战性重要研究领域。

计算机视觉研究的目标有两个:一个是开发从输入的图像数据自动构造场景描述的图像理解系统,另一个是理解人类视觉,以便有朝一日用机器代替人去作人类难以达到或根本无法达到的工作。当前,计算机视觉也是人工智能及机器人科学中颇为活跃的和卓有成效的热门研究课题。

视觉理解是计算机视觉系统的一个重要处理环节,当前,具有视党反馈功能的机器人已能代替人完成各种复杂的任务,如:产品的自动装配、焊接和检验、生物医学中的自动诊断、遥感照片的自动解释、各种车辆的自动导航等。这种赋

予机器以类似人的视觉信息处理能力并为人类自身服务的美好愿望在一定范围或特定任务下已部分地成为现实。今天,计算机视觉的应用已渗透到机器人、天文、地理、医学、化学、物理等宏观及微观世界的各个研究领域。有人预言,计算机视觉是实现智能机器人和第五代计算机的关键因素之一。

计算机视觉是一个复杂的处理过程,景物理解及景物分析是其处理要点之一。用机器实现景物理解必须将输入的图像和预先存入的有关物体结构和环境约束知识进行交互作用,建立明确而有意义的描述理解。这种过程可归结为从一幅图像中提取景物信息,完成某些计算,在不同阶段的理解过程引入相关的先验知识,从而完成理解处理。类似的工作实际上早在50年代就已经开始了。目前,三维物体及景物分析工作的重点在三维物体与自然景物的识Ⅱ与分析上。80年代,在计算机视觉研究中占主导地位的是Mart教授提出的视觉计算理论框架,在这种框架下,Marr认为视觉可看做是三个层次的信息处理过程,而且要从计算理论、算法描述及硬件实现三个方面去实现三个层次的工作。三维物体识别研究自Mart教授创立视觉计算理论后取得了重大进展。这一理论的要点在于把视觉看成一个过程,它从外部世界的图像逐步产生对景物的三个层次的描述,即:

a)初始简图——这是基本意义的灰度变动的局部几何性质,以线条勾画出的草图形式出现

b)二维半简图——该图主要描述物体可视面的表面方向和观察点到表面的距离} c)三维模型表示——这是物体形状的全部而清晰的描述。有人认为,Marr 教授的视觉计算理论是肘计算机视觉研究的最杰出的贡献。

90年代,Rosenfeld认为应重视三个方面的工作,一是计算的鲁棒性问题,二是主动视觉(active vision)的研究,三是定性视觉的研究(qualitative vision)。有人把视觉定义为“根据获得的图像理解景物信息的处理过程,而计算机视觉主要是利用计算机提供的手段和方法去完成这一信息处理过程。具体包括:视觉信息的获取图像预处理、分割、描述、识别理解等几步工作。1965年,L.Roberts 关于“三维物体的感知”一文提出了几种获取三维信息的基本方法。这些基本方法至今还被计算机视觉研究领域普遍采用。目前,获取视觉信息的主要方法有主动法和被动法两大类,主动法需要对测试物体加入特殊的人造光源其中包括:三角光法、结构光法和飞行时间法。三角光法类似三角测量法,此法需逐点测量,费时较多。结构光法是把已知结构的图像投影到被渊物体表面,由于该物体表面的取向不同,标准图案会产生畸变,利用这畸变可算出物体表面的三维坐标。标准图像一般用细线、方格等。这种方法最早由日本学者Y.Shirai提出,具体做法可采用激光扫描或投影仪来实现。飞行时间测距法是以雷达原理为基础的方法。这种方法可直接测得物体表面距离而获得三维信息,它不涉及图像处理问题。

具体实现可采用激光雷达或超声雷达,超声雷达的缺点是聚焦比较困难,但是处理方法比较简单。

被动法是在自然光条件下获得三维信息的方法。其中包括:体视法、阴影恢复形状法、由运动恢复形状法、纹理恢复形状和灰度体视法等。体视法与人的视觉原理有许多相似之处,由不同位置上的摄像机获取两幅(或多幅)图像,根据三角测量原理,利用立体图像中的对应点的视差计算出景物的三维信息。因此,两幅图像的匹配是体视法的关键。早期的匹配主要基于区域的灰度相关计算,现代方法则侧重于特征匹配。因而,只能获得稀疏的特征信息,要用各种内插法获取整幅图像的三维信息。体视法体现了Marr教授的理论精髓。形状分析法是根据图像中灰度阴影分布、物体的运动、纹理结构等信息分析计算景物的三维信息。运动序列图像分析法是依靠物体或摄像机运动时得到多幅序列图像,通过对三维运动参数的计算分析获取三维信息。此方法基本属于形状分析法,它在计算机视觉研究中较受重视,已成为一个重要分支。总之,三维信息获取是计算机视觉研究的基础,也是目前非常活跃的课题之一。无论在理论上还是实践上都有举足轻重的作用三维信息获取中的重要环节——三维定标系统研究也是极受重视的课题。为提高定标的精度曾做了大量的研究工作,并提出了不少算法。

2.2 计算机视觉现状

计算机视觉领域的突出特点是其多样性与不完善性。这一领域的先驱可追溯到更早的时候,但是直到20世纪70年代后期,当计算机的性能提高到足以处理诸如图像这样的大规模数据时,计算机视觉才得到了正式的关注和发展。然而这些发展往往起源于其他不同领域的需要,因而何谓“计算机视觉问题”始终没有得到正式定义,很自然地,“计算机视觉问题”应当被如何解决也没有成型的公式。

尽管如此,人们已开始掌握部分解决具体计算机视觉任务的方法,可惜这些方法通常都仅适用于一群狭隘的目标(如:脸孔、指纹、文字等),因而无法被广泛地应用于不同场合。

对这些方法的应用通常作为某些解决复杂问题的大规模系统的一个组成部分(例如医学图像的处理,工业制造中的质量控制与测量)。在计算机视觉的大多数实际应用当中,计算机被预设为解决特定的任务,然而基于机器学习的方法正日渐普及,一旦机器学习的研究进一步发展,未来“泛用型”的电脑视觉应用或许可以成真。

人工智能所研究的一个主要问题是:如何让系统具备“计划”和“决策能力”?从而使之完成特定的技术动作(例如:移动一个机器人通过某种特定环境)。这一问题便与计算机视觉问题息息相关。在这里,计算机视觉系统作为一个感知器,

为决策提供信息。另外一些研究方向包括模式识别和机器学习(这也隶属于人工智能领域,但与计算机视觉有着重要联系),也由此,计算机视觉时常被看作人工智能与计算机科学的一个分支。

物理是与计算机视觉有着重要联系的另一领域。

计算机视觉关注的目标在于充分理解电磁波——主要是可见光与红外线部分——遇到物体表面被反射所形成的图像,而这一过程便是基于光学物理和固态物理,一些尖端的图像感知系统甚至会应用到量子力学理论,来解析影像所表示的真实世界。同时,物理学中的很多测量难题也可以通过计算机视觉得到解决,例如流体运动。也由此,计算机视觉同样可以被看作是物理学的拓展。

另一个具有重要意义的领域是神经生物学,尤其是其中生物视觉系统的部分。

在整个20世纪中,人类对各种动物的眼睛、神经元、以及与视觉刺激相关的脑部组织都进行了广泛研究,这些研究得出了一些有关“天然的”视觉系统如何运作的描述(尽管仍略嫌粗略),这也形成了计算机视觉中的一个子领域——人们试图建立人工系统,使之在不同的复杂程度上模拟生物的视觉运作。同时计算机视觉领域中,一些基于机器学习的方法也有参考部分生物机制。

计算机视觉的另一个相关领域是信号处理。很多有关单元变量信号的处理方法,尤其是对时变信号的处理,都可以很自然的被扩展为计算机视觉中对二元变量信号或者多元变量信号的处理方法。但由于图像数据的特有属性,很多计算机视觉中发展起来的方法,在单元信号的处理方法中却找不到对应版本。这类方法的一个主要特征,便是他们的非线性以及图像信息的多维性,以上二点作为计算机视觉的一部分,在信号处理学中形成了一个特殊的研究方向。

除了上面提到的领域,很多研究课题同样可被当作纯粹的数学问题。例如,计算机视觉中的很多问题,其理论基础便是统计学,最优化理论以及几何学。

如何使既有方法通过各种软硬件实现,或说如何对这些方法加以修改,而使之获得合理的执行速度而又不损失足够精度,是现今电脑视觉领域的主要课题。

第三章计算机视觉技术的应用

3.1 应用概述

智能计算机不但使计算机更便于为人们所使用,同时如果用这样的计算机来控制各种自动化装置特别是智能机器人,就可以使这些自动化系统和智能机器人具有适应环境,和自主作出决策的能力。这就可以在各种场合取代人的繁重工作,或代替人到各种危险和恶劣环境中完成任务。

应用范围从任务,比如工业机器视觉系统,比方说,检查瓶子上的生产线加速通过,研究为人工智能和计算机或机器人,可以理解他们周围的世界。计算机视觉和机器视觉领域有显著的重叠。计算机视觉涉及的被用于许多领域自动化图像分析的核心技术。机器视觉通常指的是结合自动图像分析与其他方法和技术,以提供自动检测和机器人指导在工业应用中的一个过程。在许多计算机视觉应用中,计算机被预编程,以解决特定的任务,但基于学习的方法现在正变得越来越普遍。计算机视觉应用的实例包括用于系统:(1)控制过程,比如,一个工业机器人;(2)导航,例如,通过自主汽车或移动机器人;(3)检测的事件,如,对视频监控和人数统计;(4)组织信息,例如,对于图像和图像序列的索引数据库;

(5)造型对象或环境,如,医学图像分析系统或地形模型;(6)相互作用,例如,当输入到一个装置,用于计算机人的交互;(7)自动检测,例如,在制造业的应用程序。

其中最突出的应用领域是医疗计算机视觉和医学图像处理。这个区域的特征的信息从图像数据中提取用于使患者的医疗诊断的目的。通常,图像数据是在形式显微镜图像,X射线图像,血管造影图像,超声图像和断层图像。的信息,可以从这样的图像数据中提取的一个例子是检测的肿瘤,动脉粥样硬化或其他恶性变化。它也可以是器官的尺寸,血流量等。这种应用领域还支持通过提供新的信息,医学研究的测量例如,对脑的结构,或约医学治疗的质量。计算机视觉在医疗领域的应用还包括增强是由人类的解释,例如超声图像或X射线图像,以降低噪声的影响的图像。

第二个应用程序区域中的计算机视觉是在工业,有时也被称为机器视觉,在那里信息被提取为支撑的制造工序的目的。一个例子是质量控制,其中的信息或最终产品被以找到缺陷自动检测。另一个例子是,被拾取的位置和细节取向测量

由机器人臂。机器视觉也被大量用于农业的过程,从散装材料,这个过程被称为去除不想要的东西,食物的光学分拣。

军事上的应用很可能是计算机视觉最大的地区之一。最明显的例子是探测敌方士兵或车辆和导弹制导。更先进的系统为导弹制导发送导弹的区域,而不是一个特定的目标,并且当导弹到达基于本地获取的图像数据的区域的目标做出选择。现代军事概念,如“战场感知”,意味着各种传感器,包括图像传感器,提供了丰富的有关作战的场景,可用于支持战略决策的信息。在这种情况下,数据的自动处理,用于减少复杂性和融合来自多个传感器的信息,以提高可靠性。

一个较新的应用领域是自主车,其中包括潜水,陆上车辆(带轮子,轿车或卡车的小机器人),高空作业车和无人机(UA V)。自主化水平,从完全独立的(无人)的车辆范围为汽车,其中基于计算机视觉的系统支持驱动程序或在不同情况下的试验。完全自主的汽车通常使用计算机视觉进行导航时,即知道它在哪里,或用于生产的环境(地图SLAM)和用于检测障碍物。它也可以被用于检测特定任务的特定事件,例如,一个UA V寻找森林火灾。支承系统的例子是障碍物警报系统中的汽车,以及用于飞行器的自主着陆系统。数家汽车制造商已经证明了系统的汽车自动驾驶,但该技术还没有达到一定的水平,就可以投放市场。有军事自主车型,从先进的导弹,无人机的侦察任务或导弹的制导充足的例子。太空探索已经正在使用计算机视觉,自主车比如,美国宇航局的火星探测漫游者和欧洲航天局的ExoMars火星漫游者。

3.2视觉测试技术

非接触测试技术很多,特别值得一提的是视觉测试技术。现代视觉理论和技术的

发展,不仅在于模拟人眼能完成的功能,更重要的是它能完成人眼所不能胜任的工作,所以视觉技术作为当今最新技术,在电子、光学和计算机等技术不断成熟和完善的基础上得到迅速发展。视觉测试技术是建立在计算机视觉研究基础上的一门新兴测试技术。与计算机视觉研究的视觉模式识别、视觉理解等内容不同,视觉测试技术重点研究物体的几何尺寸及物体的位置测量,如轿车白车身三维尺寸的测量、模具等三维面形的快速测量、大型工件同轴度测量、共面性测量等。它可以广泛应用于在线测量、逆向工程等主动、实时测量过程。视觉测试技术在国外发展很快,早在20 世纪80 年代,美国国家标准局就预计,检测任务的90 %将由视觉测试系统来完成。美国在80 年代就有100 多家公司跻身于视觉测试系统的经营市场,可见视觉测试系统确实很有前途。在1999 年10 月的北京国际机床博览会上已见到国外利用视觉检测技术研制的仪器,如流动式光学三坐标测量机、高速高精度数字化扫描系统、非接触式光学三坐标测量机等先进器。

3.3计算机视觉在工农业检测中的应用

由于计算机视觉技术具有非接触、获得信息量大、作用距离远等特点,特别是随着计算机图像处理技术的不断发展,近几十年来,它在工业、农业、科学研究、军事等方面都获得了十分广泛的应用。下面主要介绍一下计算机视觉技术在工业检测中的应用概况。工业检测: 图像识别技术在工业领域的应用,主要用于能够代替人眼的计算机系统。在高速、大批量、连续自动化生产流水线,往往需要视觉系统进行质量检查、零件辨识和尺寸测量;实际上,在发达国家,几乎任何产品的生产,从半导体芯片到食品饮料,甚至人工钻石,都越发依赖视觉系统的应用,可以用于基于图像处理技术的非接触精密测量、产品表面质量检测与监控、基于机器视觉的工业自动化闭环控制、流水线产品外观质量检测设备、复杂形状非接触精密测量设备。

医疗: B 超、CT、X 光、ECT、内窥镜、病理分析、医学影像、血管造影,细胞图像分析系统等。采用医疗图像分析系统,可对血液细胞自动分类计数、染色体分析、癌症细胞识别等。

公安: 指纹识别、痕迹辨认、电子警察、图像自动跟踪、安全监控等。

石油: 岩石图像分析系统,能够分析含油数量等信息。

金融: 印章支票真伪判别、票证处理、柜员机自动检测、金库监控、运钞车现场自动检测与传输等。其中纸币印刷质量检测系统利用图像处理技术,通过对纸币生产流水线上的纸币20 多项特征(号码、盲文、颜色、图案等) 进行比较分析,检测纸币的质量,替代传统的人眼辨别的方法。

交通: 汽车车牌识别、高速公路收费、违章闯红灯检测、交通管制系统等。采用智能交通管理系统,通过在交通要道放置摄像头,当有违章车辆(如闯红灯) 时,摄像头将车辆的牌照拍摄下来,传输给中央管理系统,系统利用图像处理技术,对拍摄的图片进行分析,提取出车牌号,存储在数据库中,可以供管理人员进行检索。

体育:足球越位及出界报警、保龄球道计分、运动人体动作分析等方面。

商标管理:可以建立商标图像库,利用图像检索技术,对新申请的商标与图像库里的注册商标进行分析,检查是否设计相似或雷同。

数字图书馆:数字多媒体内容的发布和管理。

金相分析:金相图像分析系统能对金属或其它材料的基体组织、杂质含量、组织成分等进行精确、客观地分析,为产品质量提供可靠的依据。

瓶装啤酒生产流水线检测系统:可以检测啤酒是否达到标准的容量、啤酒标签是否完整等。

第四章计算机视觉技术的图像处理方发

计算机视觉系统中,视觉信息的处理技术主要依赖于图像处理方法,它包括图像增强、数据编码和传输、平滑、边缘锐化、分割、特征抽取、图像识别与理解等内容。经过这些处理后,输出图像的质量得到相当程度的改善,既改善了图像的视觉效果,又便于计算机对图像进行分析、处理和识别。

4.1 图像的增强

图像的增强用于调整图像的对比度,突出图像中的重要细节,改善视觉质量。通常采用灰度直方图修改技术进行图像增强。图像的灰度直方图是表示一幅图像灰度分布情况的统计特性图表,与对比度紧密相连。通过灰度直方图的形状,能判断该图像的清晰度和黑白对比度。如果获得一幅图像的直方图效果不理想,可以通过直方图均衡化处理技术作适当修改,即把一幅已知灰度概率分布图像中的像素灰度作某种映射变换,使它变成一幅具有均匀灰度概率分布的新图像,实现使图像清晰的目的。

4.2图像的平滑

图像的平滑处理技术即图像的去噪声处理,主要是为了去除实际成像过程中因成像设备和环境所造成的图像失真,提取有用信息。众所周知,实际获得的陶像在形成、传输、接收和处理的过程中,不可避免地存在着外部干扰和内部干扰,如光电转换过程中敏感元件灵敏度的不均匀性、数字化过程的量化噪声、传输过程中的误差以及人为因素等.均会使图像变质。因此,去除噪声,恢复原始图像是图像处理中的一个重要内容。

4.3 图像的数据编码和传输

数字图像的数据量是相当庞大的,一幅512。512个像素的数字图像的数据量为256 K字节,若假设每秒传输25帧图像,则传输的信道速率为52.4M比特/秒。高信道速率意味瞢高投资,也意味著普及难度的增加,因此。传输过程中,对图像数据进行压缩显得非常重要。数据的压缩主要通过图像数据的编霄和变换压缩完成。图像数据编码一般采用预测编码.即将图像数据的空间变化规律

和序列变化规律用一个预测公式表示.如果知道了,某一像素的前面各相邻像素值之后.可以用公式预测该像素值。该方法可将一幅图像的数据压缩到为数不多的几十个特传输,在接收端再变换回去即可。

4.4 边缘锐化

图像边缘锐化处理主要是加强图像中的轮廓边缘和细节,形成完整的物体边界.达到将物体从图像中分离出来或将表示同一物体表面的区域检测出来的目的。它是早期视觉理论和算法中的基本问题.也是中期和后期视觉成败的重要因素之一。

4.5 图像的分割

图像分割是将图像分成若干部分,每一部分对应于某一物体表面.在进行分割时.每一部分的灰度或纹理符合某一种均匀测度度量。某本质是将像素进行分类。分类的依据是像素的灰度值、颜色、频谱特性、空间特性或纹理特性等。图像分割是图像处理技术的基本方法之一,应用于诸如染色体分类、景物理解系统、机器视觉等方面。图像分割主要有两种方法:一是鉴于度量宅问的灰度闾值分割法。它是根据图像灰度直方图来决定图像空间域像素聚类。二是空间域区域增长分割方法。它是对在某种意义上(如灰度级、组织、梯度等)具有相似性质的像素连通集构成分割区域,该方法有很好的分割效果,但缺点是运算复杂.处理速度慢。

4.5.1数据驱动的分割

常见的数据驱动分割包括基于边缘检测的分割、基于区域的分割、边缘与区域相结合的分割等。对于基于边缘检测的分割,其基本思想是先检测图像中的边缘点,再按一定策略连接成轮廓,从而构成分割区域。难点在于边缘检测时抗噪声性能和检测精度的矛盾,若提高检测精度,则噪声产生的伪边缘会导致不合理的轮廓;若提高抗噪声性能,则会产生轮廓漏检和位置偏差。为此,人们提出各种多尺度边缘检测方法,根据实际问题设计多尺度边缘信息的结合方案,以较好地兼顾抗噪声性能和检测精度。

基于区域的分割的基本思想是根据图像数据的特征将图像空间划分成不同的区域。常用的特征包括:直接来自原始图像的灰度或彩色特征;由原始灰度或彩色值变换得到的特征。方法有阈值法、区域生长法、聚类法、松弛法等。

边缘检测能够获得灰度或彩色值的局部变化强度,区域分割能够检测特征的相似性与均匀性。将两者结合起来,通过边缘点的限制,避免区域的过分割;同时通过区域分割补充漏检的边缘,使轮廓更加完整。例如,先进行边缘检测与连接,再比较相邻区域的特征(灰度均值、方差),若相近则合并;对原始图像分别进行边缘检测和区域生长,获得边缘图和区域片段图后,再按一定的准则融合,得到最终分割结果。

4.5.2模型驱动的分割

常见的模型驱动分割包括基于动态轮廓(Snakes)模型、组合优化模型、目标几何与统计模型。Snakes模型用于描述分割目标的动态轮廓。由于其能量函数采用积分运算,具有较好的抗噪声性,对目标的局部模糊也不敏感,因而适用性很广。但这种分割方法容易收敛到局部最优,因此要求初始轮廓应尽可能靠近真实轮廓。

近年来对通用分割方法的研究倾向于将分割看作一个组合优化问题,并采用一系列优化策略完成图像分割任务。主要思路是在分割定义的约束条件之外,根据具体任务再定义一个优化目标函数,所求分割的解就是该目标函数在约束条件下的全局最优解。以组合优化的观点处理分割问题,主要是利用一个目标函数综合表示分割的各种要求和约束,将分割变为目标函数的优化求解。由于目标函数通常是一个多变量函数,可采用随机优化方法。

基于目标几何与统计模型的分割是将目标分割与识别集成在一起的方法,常称作目标检测或提取。基本思想是将有关目标的几何与统计知识表示成模型,将分割与识别变为匹配或监督分类。常用的模型有模板、特征矢量模型、基于连接的模型等。这种分割方法能够同时完成部分或全部识别任务,具有较高的效率。然而由于成像条件变化,实际图像中的目标往往与模型有一定的区别,需要面对误检与漏检的矛盾,匹配时的搜索步骤也颇为费时。

4.5.3图像分割的半自动方法

从人工参与程度来看,图像分割可分为人工、半自动、自动等三种类型。其中人工分割完全由操作者利用鼠标勾画出分割区域的轮廓,费时费力,且容易受操作者主观因素的影响,重复性差。自动分割不需人机交互,但适应性差,很难实现对一批图像同时获得满意的分割效果。半自动分割将人机交互与自动分割相结合,能够适应不同的图像和需求,且有效降低计算复杂度。目前半自动分割中人机交互的方式有:勾画目标的大致轮廓,构成自动分割的初始化;根据特定的图像和任务调整算法参数;在分割过程中加入人工交互节等。总之,从实用化的角度看,自动分割仍是长期努力的方向。目前更为现实的是在自动分割前或分割过程中加入人

机交互的半自动分割。其发展方向为尽可能少和简便的人机交互。可见,图像分割是图像处理和机器视觉必不可少的重要环节,也是图像理论发展的瓶颈之一。随着计算机速度与容量的快速进展,图像处理与机器视觉实用化系统硕果累累。例如,基于内容的图像检索系统、智能监视系统、视觉引导的智能交通系统、手写体字符/人脸/指纹/虹膜识别系统等。然而有关的理论研究并没有取得突破性进展。

4.6 图像的识别

图像的识别过程实际上可以看作是一个标记过程,即利用识别算法来辨别景物中已分割好的各个物体.给这螳物体赋予特定的标记,它是汁算机视觉系统必须完成的一个任务。按照网像识别从易到难.町分为i类问题?第一类识别问题中.图像中的像素表达了某一物体的某种特定信息。第二类问题中,待识别物是有形的整体。二维图像信息已经足够识别该物体.如文字识别、某些具有稳定可视表面的三维体识别等。第三类问题是由输入的二维图、要素图、2x5维图等.得出被测物体的三维表示。这里存着如何将隐含的三维信息提取出来的问题.当是今研究的热点。目前用于图像识别的方法主要分为决策理论和结构方法。决策理论方法的基础是决策函数,利用它对模式向量进行分类识别.是以定时描述(如统计纹理)为基础的:结构方法的核心是将物体分解成』'模式或模式基元,而不同的物体结构有不同的基元串(或称字符串),通过对未知物体利用给定的模式基元求出编码边界,得到字符串,冉根据字符串判断它的属类。这是一种依赖于符号描述被测物体之间关系的方法。

4.7 视觉技术的研究

人类很多研究都是以延伸人类能力为目的的,早期的工作是在体力上延伸,计算机发明以来,就拓展到对人类脑力和感知能力的延伸上。对人类视觉感知能力的计算机模拟导致了计算机视觉的产生。计算机视觉也经常被称为图像理解,是指研究完成一项任务所需的视觉信息及如何从图像中获取这些信息的研究领域。其基本目的有三个:

(1)根据一幅或多幅二维投影图像计算出观察点到目标物体的距离;

(2)根据一幅或多幅二维投影图像计算出观察点到目标物体的运动参数;

(3)根据一幅或多幅二维投影图像计算出观察点到目标物体的表面物理特性。要达到的最终目的是实现对于三维景物世界的理解,即实现人的视觉系统的某些功能。也就是利用二维投影图像来重构三维物体的可视部分。

4.7.1计算机视觉研究的对象与方法

4.7.1.1 以模型世界为主要对象的视觉基本方法研究

这个阶段以Roberts的开创性工作为标志。在Roberts的工作中引入了三维物体与二维成像的关系,采用了一些简单的边缘特征提取方法并引入了组合线段的方法。这些早期的工作对视觉的发展起了促进作用,但对于稍微复杂的景物便难于奏效。

为他对三维关系的分析仅仅是靠简单的边缘线段的约束关系,并没有充分考虑人类或其他动物视觉系统感知三维空间关系的方式。

4.7.1.2 以计算理论为核心的视觉模型研究

20世纪70年代开始,对计算机视觉的研究进入更为理性化的阶段,主要集中于各种本征特性的恢复,包括三维形状、运动、光源等的恢复。主要出发点是从生理学、光学和射影几何的方法出发,研究成像及其逆问题。在这一阶段中,以Marr为代表的一些研究者提出了以表示为核心、以算法为中间转换过程的一般性视觉处理模型。在其理论中强调表示的重要性以及从不同层次上去研究信息处理问题,在计算理论和算法实现上又特别强调计算理论的重要性。在三维信息的感知方面,根据人类感知深度的不同提出了一系列ShapefromX的方法。

4.7.2计算机视觉的应用领域

计算机视觉的应用领域主要包括对照片、视频资料如航空照片、卫星照片、视频片段等的解释、精确制导、移动机器人视觉导航、医学辅助诊断、工业机器人的手眼系统、地图绘制、物体三维形状分析与识别及智能人机接口等。

早期进行数字图像处理的目的之一就是要通过采用数字技术提高照片的质量,辅助进行航空照片和卫星照片的读取判别与分类。由于需要判读的照片数量很多,于是希望有自动的视觉系统进行判读解释,在这样的背景下,产生了许多航空照片和卫星照片判读系统与方法。自动判读的进一步应用就是直接确定目标的性质,进行实时的自动分类,并与制导系统相结合。目前常用的制导方式包括激光制导、电视制导和图像制导,在导弹系统中常常将惯性制导与图像制导结合,利用图像进行精确的末制导。

工业机器人的手眼系统是计算机视觉应用最为成功的领域之一,由于工业现场的诸多因素,如光照条件、成像方向均是可控的,因此使得问题大为简化,有利于构成实际的系统。与工业机器人不同,对于移动机器人而言,由于它具有行为能力,于是就必须解决行为规划问题,即是对环境的了解。随着移动式机器人的发展,越来越多地要求提供视觉能力,包括道路跟踪、回避障碍、特定目标识别等。目前移动机器人视觉系统研究仍处于实验阶段,大多采用遥控和远视方法。

在医学上采用的图像处理技术大致包括压缩、存储、传输和自动/辅助分类判读,此外还可用于医生的辅助训练手段。与计算机视觉相关的工作包括分类、判读和快速三维结构的重建等方面。长期以来,地图绘制是一件耗费人力、物力和时间的工作。以往的做法是人工测量,现在更多的是利用航测加上立体视觉中恢复三维形状的方法绘制地图,大大提高了地图绘制的效率。同时,通用物体三维形状分析与识别一直是计算机视觉的重要研究目标,并在景物的特征提取、表示、知识的存储、检索以及匹配识别等方面都取得了一定的进展,构成了一些用于三维景物分析的系统。

近年来,基于生物特征(biometrics)的鉴别技术得到了广泛重视,主要集中在对人脸、虹膜、指纹、声音等特征上,这其中大多都与视觉信息有关。与生物特征识别密切相关的另一个重要应用是用于构成智能人机接口。现在计算机与人的交流还是机械式的,计算机无法识别用户的真实身份,除键盘、鼠标外,其他输入手段还不成熟。利用计算机视觉技术可以使计算机检测到用户是否存在、鉴别用户身份、识别用户的体势(如点头、摇头)。此外,这种人机交互方式还可推广到一切需要人机交互的场合,如入口安全控制、过境人员的验放等。

第五章计算机视觉的发展趋势

5.1 计算机视觉的发展趋势

计算机视觉研究经历了近40年的过程,仍面临许多问题。主要由于这一方向是多学科的交叉与结合,同时视觉是一个涉及生理、心理的复杂过程,不仅与眼睛有关,还和大脑的推理、学习有关。研究计算机视觉的目的是要实现对人类视觉的模拟和延伸。对于人类而言,视觉是一个轻而易举的功能,对机器却不同。视觉过程很难用类似于问题求解的方法符号化。随着计算机科学领域中对定量研究的重视,这种状况会得到改善。在计算机视觉的研究过程中,应考虑将功能模拟与认知模拟相结合。人类延伸其他能力的过程中,功能模拟起到了主要作用,但视觉是涉及心理和生理两方面的过程,因此必须在功能模拟的同时重视认知模拟。

计算理论的进步与感知手段的改进有助于计算机视觉的研究。在计算机视觉中计算理论占有十分重要的地位,计算理论的进步,新的计算模型的提出可以解决以往一些困难的问题;另一方面,感知手段的进步也可以起到同样的作用。采用主动视觉可从另一个侧面去处理面对的视觉问题。要实现完整的视觉系统,视觉知识的获取、管理和利用是必不可少的。一个相对完备的视觉系统同时也是一个知识管理系统,在视觉过程中对一幅图像的理解需要大量的关于任务领域的知识,这些知识不同于问题求解中的知识可以明确的显性表示,而且人类获取信息的80%是通过视觉得到的,因而这些知识涉及面之广难以预测,因此视觉系统中的知识管理是一个重要问题。

从以往的研究看,过去的几十年虽然提出、解决了一些问题,但是由于视觉问题的特殊性和复杂性,还有大量的问题需要研究。研究的重点包括对新方法、新手段的探索。当然,在原有问题上采用新的描述方法、求解手段也是一个可能的突破点。在视觉领域中多数的问题不是问题本身正确与否,而是描述是否恰当以及求解是否有效的问题,因而描述方式、求解手段的探索是十分重要的。

目前,过去由于CPU处理能力强大,可以进行较为复杂的图像处理,并且一个Pc可支持多个相机进行多方位的检测,因此PC Based方案受到了广大厂商的青睐。目前国内多数厂商对计算机视觉的认识,已不仅仅停留在PC Based方案层面。嵌入式方案越来越引起厂商们的重视,其具有更大的灵活性,成本又低于PC Based方案,就抗干扰能力来说,嵌入式方案也更能适应工业环境的电子干扰、温度变化、供电电压波动等多种干扰,因此,目前计算机视觉正在向嵌入式的方向发展。

人工智能与计算机视觉

过去几年,全球的互联网公司包括谷歌、微软、Facebook以及中国的百度、阿里巴巴都在加强人工智能领域的投资,设立自己的人工智能研究院。vivo是第一家设立专攻人工智能方向研究院的中国手机公司。此举是vivo内部已经确立的一份3-5年的中长期发展的战略规划,未来对人工智能的发展研究是必然趋势,vivo公司创始人兼CEO沈炜曾表示“人工智能和5G的结合将会是5G时代手机发展的趋势”。 今年我们看到vivo在产品上不少创新,比如AI拍照、商用屏下指纹技术等等,这些都是基于生物特征(biometrics)的鉴别技术,除此之外还有对人脸、虹膜、指纹、声音等特征上的识别,这些大多涉及到视觉信息,正是体现了计算机视觉的应用性,那什么是计算机视觉呢? 计算机视觉技术的概念 正像其它学科一样,一个大量人员研究了多年的学科,却很难给出一个严格的定义,模式识别如此,目前火热的人工智能如此,计算机视觉亦如此。与计算机视觉密切相关的概念有视觉感知(visual perception),视觉认知(visual cognition),图像和视频理解( image and video understanding)。这些概念有一些共性之处,也有本质不同。 从广义上说,计算机视觉就是“赋予机器自然视觉能力”的学科。自然视觉能力,就是指生物视觉系统体现的视觉能力。一则生物自然视觉无法严格定义,在加上这种广义视觉定义又“包罗万象”,同时也不太符合40多年来计算机视觉的研究状况,所以这种“广义计算机视觉定义”,虽无可挑剔,但也缺乏实质性内容,不过是一种“循环式游戏定义”而已。 实际上,计算机视觉本质上就是研究视觉感知问题。视觉感知,根据维科百基(Wikipedia)的定义, 是指对“环境表达和理解中,对视觉信息的组织、识别和解释的过程”。根据这种定

计算机视觉与数字摄影测量的结合展望

计算机视觉与数字摄影测量的结合展望摘要:摄影测量在进入数字摄影测量时代就已经与计算机视觉技术紧密的联系在了一起,计算机视觉技术的快速发展给近景摄影测量带来了巨大的变革。本文分别简要介绍了摄影测量和计算机视觉技术,重点阐述了两者的异同点,最后做出总结。 关键字:计算机视觉;数字摄影测量;差异;影响匹配 1前言 摄影测量的发展经过了三个阶段,现已进入数字摄影测量阶段。数字摄影测量以数字影像为基础,通过计算机分析和量测来获取被摄物体的三维空间信息,正在成为国际公认的地球空间数据获取的重要手段[1]。数字摄影测量利用一台计算机,加上专业的摄影测量软件,就代替了过去传统的、所有的摄影测量的仪器。其中包括纠正仪、正射投影仪、立体坐标仪、转点仪、各种类型的模拟测量仪以及解析测量仪。数字摄影测量的发展,计算机不仅可以代替人工进行大量的计算,而且已经完全可能代替人眼来识别同名点,从而为摄影测量开辟了真正的自动化道路[2]。 计算机视觉是一个相对年轻而又发展迅速的领域。80年代以来,计算机视觉的研究已经历了从实验室走向实际应用的发展阶段,而计算机工业水平的飞速提高以及人工智能、并行处理和神经元网络等学科的发展,更促进了计算机视觉系统的实用化和涉足许多复杂视觉过程的研究[3]。其目标是使计算机具有通过二维图像认知三维环境信息的能力,这种能力将不仅使机器能感知三维环境中物体的几何信息,包括它的形状、位置、姿态、运动等,而且能对它们进行描述、存储、识别与理解[4]。数字摄影测量具有类似的目标,也面临着相同的基本问题。数字摄影测量学涉及多个学科,如图像处理、模式识别以及计算机图形学等。由于它与计算机视觉的联系十分紧密,有些专家将其看成是计算机视觉的分支。 2数字摄影测量与计算机视觉的差异 2.1出发点不同导致基本参数物理意义不同 计算机视觉是研究怎样用计算机模拟人的眼睛,实现机器人的视觉,它是以眼睛(摄影机)中心与光轴构成的坐标系为准,它定义的平移量是空间坐标系相对于摄影机坐标系的平移量。而摄影测量是测绘地形图的重要生产手段,它以空间(地面)统一坐标系为基准,如在一个地区进行航空摄影测量,所有摄影机的空间位置与影像的坐标都相对于该空间坐标系。因此,在摄影测量中的“外定向”是确定影像在空间相对于物体的位置与方位;而计算机视觉通常从另一个方向描述这个问题:搜索物体相对于影像的位置与方位。 2.2出发点不同导致基本公式的不同 由于物体与影像基本关系之间的差异,从而引起计算机视觉与摄影测量之间的基本公式的差异。计算机视觉与摄影测量都是研究物体与影像关系的,因此,描述三维物体与二维影像坐标之间的关系公式是它们的基本公式。计算机视觉最基本的公式用齐次坐标的投影方程表达为[5,6]:

视觉测量系统技术及应用

视觉测量系统技术及应用 1 引言 基于计算机的视觉检测系统是指通过计算机视觉产品将被摄取目标转换成图像信号,传送给图像处理系统,图像处理系统再根据像素分布和亮度、颜色等信息,转变成数字化信号,计算机图像系统对这些信号进行复杂运算来抽取目标的特征,进而根据判别的结果来控制设备动作。它具有非接触、速度快等优点,是一种先进的检测手段,非常适合现代制造业。可用于视觉检测的试验原理很多,如纹理梯度法、莫尔条纹法、飞行时间法等,然而诸多测试原理中,尤其基于三角法的主动和被动视觉测量原理具有抗干扰能力强、效率高、精度合适等优点,非常适合在线非接触测量。本文主要从视觉测量系统在实际中应用出发,展示视觉检测技术在制造业中的广阔应用[1-4]。 2 视觉测量系统技术的应用 2.1 汽车车身视觉检测系统 在汽车制造过程中,车身上总有很多关键的三维尺寸进行测量,采用传统的三坐标测量机只能离线抽样检测,效率低,更不能满足现代汽车制造在线检测的需要,而视觉检测系统能很好的适应该需要,典型的汽车车身视觉检测系统如图1所示[5]。 图1 车身视觉检测系统 车身检测系统主要依靠的是数个视觉传感器,其中还包括传送机构、定位机构,计算机图像采集、网络控制部分。每个传感器对应一个被测区域,然后通过传输总线传至计算机,通过计算机对每个视觉传感器进行过程控制。 汽车车身检测系统的测量效率很高,精度式中,并且可以在完全自动情况下完成,这个包含几十个测点的系统都能再几分钟内测量完成,因此可以适应汽车制造的在线检测。而且传感器的布置可以根据不同车型来布置,增加了应用要求,

因此减少了车身视觉系统的维护费用。 2.2 拔丝模孔形视觉检测系统 使用计算机视觉检测技术开发出的拔丝模孔形检测系统由光学成像系统、工业用摄像机图像采集卡、计算机及监视器组成,可以解决生产实际中的模具孔形检测问题.工作原理如下:先采用注入硅胶方法获得反映待检拔丝模尺寸及形状的硅胶凸模,然后把硅胶凸模放在光学系统的载物台上.硅胶凸模经光学成像放大,成像于CCD像面上,然后用图像采集卡采集CCD图像信息,最后由计算机视觉检测软件完成对孔形尺寸的自动计算,此时图像采集时需要配置特殊的光照系统.系统实现了自动数据采集、处理,实现采样、进样、结果一条龙,形成检测的自动化. 2.3 无缝钢管直线度和截面在线视觉检测 无缝钢管是一类重要的工业产品,在反应无缝钢管质量中,钢管直线度及截面尺寸是主要的几何参数。现代工业已经可以实现无缝钢管的大批量大规模生产,并且并无成熟的直线度、截面尺寸高效率的检测系统,主要原因为:无缝钢管空间尺寸大,需要很大的测量空间,一般的检测手段很难实现如此大尺度的检测。然而视觉检测却非常适合无缝钢管及截面尺寸的测量,其测量原理图如图2所示。 多个传感器组成了视觉检测系统,传感器的结构光所投射的光平面与被测钢管相交,从而得到钢管的部分圆周,传感器测量圆周在传感器三维空间位置,每一个传感器实现一个截面圆周测测量,然后通过拟合得到截面的圆心和其空间位置,从而实现对无缝钢管截面和直径的测量。 图2 无缝钢管在线检测 2.4 视觉测量在逆向工程中的应用 逆向工程是针对现有的工件,利用3D数字化测量仪准确快速地测量出轮廓坐标值,并建构曲面,经过编辑、修改后,将图形存档形成一般的CAD/CAM系统,再由CAM所产生刀具的NC加工路径送至CNC加工机制所需模具,或者以快速成型将物品模型制作出来。视觉测量一般使用三种激光光源:点结构光、线结构光、面结构光,图3为使用线结构光测量物体表面轮廓的结构示意图[6]。

测量技术方案经典.doc

盐田国际行政办公大楼测量技术方案 一、工程概述 盐田国际行政办公大楼位于明珠立交道路系统南侧,东临进港大道,南为盐田三期码头检查场,西面为保税区货场,本工程地下两层,地上主楼25层,副楼5层,总用地面积24050.51平方米,其中,主楼建筑面积为33292.9平方米,副楼建筑面积为12747.88平方米的矩形框筒结构建筑。 二、现场情况 经现场实地踏勘,施工现场大型深基坑开挖形成,边坡进行了喷锚支护技术处理,现场四周通视良好,为施工方便,将平面及高程控制点布置在现场附近位置,并对控制点位每月定期进行观测,以防止位移影响测量精度。 三、编制依据 1.执行技术标准 a.《盐田国际行政办公大楼》施工图纸; b.业主提供的测量原始点位报告; c.《技术条件书》; d.《工程测量规范》(GB50026-93); e.《建筑变形测量规范》(JGJ/8-9)。 2.施工测量流程

3.施工测量基本要求 施工测量的基本要求是按设计图纸的要求,把建筑物的平面和高程置放到施工场地上去,施工测量贯穿于整个施工过程,是质量控制和技术指导有效手段。 四、测量所采用的仪器设备 1.SET230R、SET2110、SET2110II型全站仪3台,标准精度为(2″); 2.DSZ2、DS05型精密水准仪2台; 3.DZJ2型激光垂准仪1台,标准精度为(2″)。 五、工程坐标及高程应用 应业主要求,本工程平面坐标系统统一采用盐田港施工坐标和行政大楼相对标高盐田理论深度基准面高程系统。 1.深圳独立坐标系与盐田港施工坐标系的换算公式为: A=X*cosa+Y*sina-116971.665 B=X*sina+Y*cosa-69332.579 其中a=50.00084079 A、B坐标系为盐田港施工坐标系 2高程系统统一采用盐田理论深度基准面,与黄海高程的换算关系为: 盐田理论深度基准面高程=黄海高程+0.58M。

计算机视觉技术

目录 1立体视觉 (1) 1.1计算机视觉技术 (1) 2立体视觉技术 (3) 2.1双目立体视觉技术 (3) 致谢 (8) 附录: (9)

立体视觉 我的毕业论文排版样文 1立体视觉 1.1计算机视觉技术 计算机视觉既是工程领域也是科学领域中的一个富有挑战性的重要研究领域。计算机视觉是一门综合性的学科,它已经吸引了来自各个学科的研究者参加到对它的研究之中,其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学、神经生理学和认知科学等[18]。 视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断和军事等领域中各种智能自主系统中不可分割的一部分。由于它的重要性,一些先进国家,例如美国把对计算机视觉的研究列为对经济和科学有广泛影响的科学和工程中的重大基本问题,即所谓的重大挑战。“计算机视觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力。机器视觉需要图像信号,纹理和颜色建模,几何处理和推理,以及物体建模。一个有能力的视觉系统应该把所有这些处理都紧密地集成在一起[19]。”作为一门学科,计算机视觉开始于60 年代初,但在计算机视觉的基本研究中的许多重要进展是在80 年代取得的。现在计算机视觉已成为一门不同于人工智能、图象处理、模式识别等相关领域的成熟学科[20]。 不少学科的研究目标与计算机视觉相近。这些学科包括图像处理、图像识别、景物分析、图像理解等。由于历史发展或领域本身的特点这些学科互有差别,但又有某种程度的相互重叠。为了清晰起见,把这些与计算机视觉有关的学科从研究目标和方法角度加以归纳[21]。 (1)图像处理 图像处理技术把输入图像转换成具有所希望特性的另一幅图像。例如,可通过处理使输出图像有较高的信噪比,或通过增强处理突出图像的细节,以便于操作员的检验。在计算机视觉研究中经常利用图像处理技术进行预处理和特征抽取。 (2)图像识别 图像识别技术根据从图像抽取的统计特性或结构信息,把图像分成预定的类别。在计算机视觉中图像识别技术经常用于对图像中的某些部分(例如分割区域)的识别和分类。 第 1 页(共9页)

机器视觉测量技术

机器视觉测量技术 杨永跃 合肥工业大学 2007.3

目录第一章绪论 1.1 概述 1.2 机器视觉的研究内容 1.3 机器视觉的应用 1.4 人类视觉简介 1.5 颜色和知觉 1.6 光度学 1.7 视觉的空间知觉 1.8 几何基础 第二章图像的采集和量化 2.1 采集装置的性能指标 2.2 电荷藕合摄像器件 2.3 CCD相机类 2.4 彩色数码相机 2.5 常用的图像文件格式 2.6 照明系统设计 第三章光学图样的测量 3.1 全息技术 3.2 散斑测量技术 3.3 莫尔条纹测量技术 3.4 微图像测量技术 第四章标定方法的研究 4.1 干涉条纹图数学形成与特征 4.2 图像预处理方法 4.3 条纹倍增法 4.4 条纹图的旋滤波算法 第五章立体视觉 5.1 立体成像

5.2 基本约束 5.3 边缘匹配 5.4 匹域相关性 5.5 从x恢复形状的方法 5.6 测距成像 第六章标定 6.1 传统标定 6.2 Tsais万能摄像机标定法 6.3 Weng’s标定法 6.4 几何映射变换 6.5 重采样算法 第七章目标图像亚像素定位技术 第八章图像测量软件 (多媒体介绍) 第九章典型测量系统设计分析9.1 光源设计 9.2 图像传感器设计 9.3 图像处理分析 9.4 图像识别分析 附:教学实验 1、视觉坐标测量标定实验 2、视觉坐标测量的标定方法。 3、视觉坐标测量应用实验 4、典型零件测量方法等。

第一章绪论 1.1 概述 人类在征服自然、改造自然和推动社会进步的过程中,面临着自身能力、能量的局限性,因而发明和创造了许多机器来辅助或代替人类完成任务。智能机器或智能机器人是这种机器最理想的模式。 智能机器能模拟人类的功能、能感知外部世界,有效解决问题。 人类感知外部世界:视觉、听觉、嗅觉、味觉、触觉 眼耳鼻舌身 所以对于智能机器,赋予人类视觉功能极其重要。 机器视觉:用计算机来模拟生物(外显或宏观)视觉功能的科学和技术。 机器视觉目标:用图像创建或恢复现实世界模型,然后认知现实世界。 1.2 机器视觉的研究内容 1 输入设备成像设备:摄像机、红外线、激光、超声波、X射线、CCD、数字扫描仪、 超声成像、CT等 数字化设备 2 低层视觉(预处理):对输入的原始图像进行处理(滤波、增强、边缘检测),提取角 点、边缘、线条色彩等特征。 3 中层视觉:恢复场景的深度、表面法线,通过立体视觉、运动估计、明暗特征、纹理 分析。系统标定 4 高层视觉:在以物体为中心的坐标系中,恢复物体的完整三维图,识别三维物体,并 确定物体的位置和方向。 5 体系结构:根据系统模型(非具体的事例)来研究系统的结构。(某时期的建筑风格— 据此风格设计的具体建筑) 1.3 机器视觉的应用 工业检测—文件处理,毫微米技术—多媒体数据库。 许多人类视觉无法感知的场合,精确定量感知,危险场景,不可见物感知等机器视觉更显其优越十足。 1 零件识别与定位

时间间隔测量技术综述

高精度时间间隔测量方法综述 孙 杰 潘继飞 (解放军电子工程学院,安徽合肥,230037) 摘要:时间间隔测量技术在众多领域已经获得了应用,如何提高其测量精度是一个迫切需要解决的问题。在分析电子计数法测量原理与误差的基础上,重点介绍了国内外高精度时间间隔测量方法,这些方法都是对电子计数法的原理误差进行测量,并且取得了非常好的效果。文章的最后给出了高精度时间间隔测量方法的发展方向及应用前景。 关键词:时间间隔;原理误差;内插;时间数字转换;时间幅度转换 Methods of High Precision Time-Interval Measurement SUN Jie , PAN Ji-fei (Electronic Engineering Institute of PLA, HeFei 230037, China ) Abstract: Technology of time-interval measurement has been applied in many fields. How to improve its precision is an emergent question. On the bases of analyzing electronic counter ’s principle and error, this paper puts emphasis upon introducing high precision time-interval measurements all over the world. All these methods aim at electronic counter ’s principle error, and obtain special effect. Lastly, the progress direction and application foreground of high precision time-interval measurement methods are predicted. Key Words: time interval; principle error; interpolating; time-to-digital conversion; time-to-amplitude conversion 0引言 时间有两种含义,一种是指时间坐标系中的某一刻;另一种是指时间间隔,即在时间坐标系中两个时刻之间的持续时间,因此,时间间隔测量属于时间测量的范畴。 时间间隔测量技术在通信、雷达、卫星及导航定位等领域都有着非常重要的作用,因此,如何高精度测量出时间间隔是测量领域一直关注的问题。本文详细分析了目前国内外所采用的高精度时间间隔测量方法,指出其发展趋势,为研究新的测量方法指明了方向。 1 电子计数法 1.1 测量原理与误差分析 在测量精度要求不高的前提下,电子计数法是一种非常好的时间间隔测量方法,已经在许多领域获得了实际应用,其测量原理如图1 量化时钟频率为 0f ,对应的周期001f T =,在待测脉冲上升沿计数器输出计数脉冲个数N M ,,1T ,2T 为待测脉 冲上升沿与下一个量化时钟脉冲上升沿之间的时间间隔,则待测脉冲时间间隔x T 为: ()210T T T M N T x -+?-= (1) 然而,电子计数法得到的是计数脉冲个数N M ,,因此其测量的脉冲时间间隔为: ()0' T M N T x ?-= (2) 比较表达式(1)(2)可得电子计数法的测量误差为21T T -=?,其最大值为一个量化时钟周期0T ,产生的原因是待 测脉冲上升沿与量化时钟上升沿的不一致,该误差称为电子计数法的原理误差。 除了原理误差之外,电子计数法还存在时标误差,分析表达式(2)得到: ()()00'..T M N T M N T x ?-+-?=? (3) 比较表达式(3)(2): ()()00 ''T T M N M N T T x x ?+--?=? (4) 根据电子计数法原理,()1±=-? M N ,0'T T M N x =-,因此: 00'0'T T T T T x x ??+±=? (5) 00'T T T x ??即为时标误差,其产生的原因是量化时钟的稳定度00T T ?,可以看出待测脉冲间隔x T 越大,量化时钟的稳 定度导致的时标误差越大。 作者简介:孙杰: (1975—),男(汉族),安徽合肥人,解放军电子工程学院讲师 潘继飞:(1978—),男(汉族),安徽凤阳人,解放军电子工程学院信号与信息处理专业博士生

人机交互中的计算机视觉技术.

人机交互中的计算机视觉技术 基于视觉的接口概念 计算机视觉是一门试图通过图像处理或视频处理而使计算机具备“ 看” 的能力的计算学科。通过理解图像形成的几何和辐射线测定, 接受器(相机的属性和物理世界的属性, 就有可能 (至少在某些情况下从图像中推断出关于事物的有用信息, 例如一块织物的颜色、一圈染了色的痕迹的宽度、火星上一个移动机器人面前的障碍物的大小、监防系统中一张人脸的身份、海底植物的类型或者是 MRI 扫描图中的肿瘤位置。计算机视觉研究的就是如何能健壮、有效地完成这类的任务。最初计算机视觉被看作是人工智能的一个子方向, 现在已成为一个活跃的研究领域并长达 40年了。 基于视觉的接口任务 至今,计算机视觉技术应用到人机交互中已取得了显著的成功,并在其它领域中也显示其前景。人脸检测和人脸识别获得了最多的关注, 也取得了最多的进展。第一批用于人脸识别的计算机程序出现在 60年代末和 70年代初,但直到 90年代初,计算机运算才足够快,以支持这些实时任务。人脸识别的问题产生了许多基于特征位置、人脸形状、人脸纹理以及它们间组合的计算模型, 包括主成分分析、线性判别式分析、 Gabor 小波网络和 .Active Appearance Model(AAM . 许多公司,例如Identix,Viisage Technology和 Cognitec System,正在为出入、安全和监防等应用开发和出售人脸识别技术。这些系统已经被部署到公共场所, 例如机场、城市广场以及私人的出入受限的环境。要想对人脸识别研究有一个全面的认识,见。 基于视觉的接口技术进展 尽管在一些个别应用中取得了成功,但纵使在几十年的研究之后,计算机视觉还没有在商业上被广泛使用。几种趋势似乎表明了这种情形即将会发生改变。硬件界的摩尔定律的发展, 相机技术的进步, 数码视频安装的快速增长以及软件工具的可获取性(例如 intel 的 OpenCV libraray使视觉系统能够变得小巧、灵

关于计算机视觉的若干思考

浅谈计算机视觉 当看到幻灯片上播放的两张看上去相同的图片,一张毫无秘密,一张却隐藏着机密的时候,我觉得很是神奇,原来还会有这种加密方式。不同于摩斯密码,我觉得这种加密方式正是计算机时代的一个代表。 机器视觉,计算机视觉,图像处理,图像分析,这些名词好像都出现在了 老师的课堂上,通过查阅资料得知,这些名词在技术和应用领域上他们都有着相当大部分的重叠,这些学科的基础理论大致是相同的,甚至让人怀疑他们是同一学科被冠以不同的名称。 但是,又好像存在着一些细小的不同。例如,机器视觉主要是指工业领域 的视觉研究,例如自主机器人的视觉,用于检测和测量的视觉。这表明在这一领域通过软件硬件,图像感知与控制理论往往与图像处理得到紧密结合来实现高效的机器人控制或各种实时操作。计算机视觉的研究对象主要是映射到单幅或多幅图像上的三维场景,例如三维场景的重建。计算机视觉的研究很大程度上针对图像的内容。图像处理与图像分析的研究对象主要是二维图像,实现图像的转化,尤其针对像素级的操作,例如提高图像对比度,边缘提取,去噪声和几何变换如图像旋转。这一特征表明无论是图像处理还是图像分析其研究内容都和图像的具体内容无关。这里,我就计算机视觉进行初步的了解与分析。 计算机视觉,顾名思义,即为利用计算机对图像进行处理的过程。不管进 行何种场景的应用,都必须进行识别,运动,场景重现,图像恢复等基本问题的算法处理。其系统主要包括:图像获取,预处理,特征提取,检测分割,高级处理等基本组成。

下面就图像加密过程进行初步分析:首先,进行图像的获取,拿到一张图片利用一个或多个图像感知器提取数字图像,根据感知器的类型会得到不同类型的数字图像;接着,进行预处理,在对图像实施具体的计算机视觉方法来提取某种特定的信息前,一种或一些预处理往往被采用来使图像满足后继方法的要求。例如:二次取样保证图像坐标的正确;平滑去噪滤除感知器引入的设备噪声等;然后,进行特征提取,提取出这幅图像的特征要素;进行检测分割,分割出所要进行隐藏图像的部分,以便于进行后续操作;再进行高级处理,及隐藏信息。 通过查阅资料得知,其中一种隐藏信息的方式为将数字图像转化为二值图像,即只有黑和白的像素,不存在灰色过度的图像,进行处理。利用二值图像的算法主要有图像分块嵌入法,流程修改嵌入法,基于图像特征嵌入法等。但是,利用二值图像嵌入信息,也有不足:在黑白图像中,若把一片全是“0”像素中间突然嵌入一个“1”像素,相当于在一片黑图片当中突然点了一个白点,这会很容易引起人眼的察觉,故而不是很好的信息嵌入策略。 通过了解,我发现有关这一方面的研究还有更深的发展空间,而且在信息化的今天,利用计算机视觉进行图像的处理以及信息的嵌入可以更好的为我们的工作生活提供便利。 且计算机视觉是一个交叉学科,需要多种学科的共同发展,符合当今时代特征。所以,在我看来,计算机视觉是一个未来前景广阔,信息集成度高,市场认可度高的研究方向。

机器视觉测量技术

机器视觉测量技术杨永跃合肥工业大学 2007.3 目录 第一章绪论 1.1 概述 1.2 机器视觉的研究内容 1.3 机器视觉的应用 1.4 人类视觉简介 1.5 颜色和知觉 1.6 光度学 1.7 视觉的空间知觉 1.8 几何基础 第二章图像的采集和量化 2.1 采集装置的性能指标 2.2 电荷藕合摄像器件 2.3 CCD 相机类 2.4 彩色数码相机 2.5 常用的图像文件格式

2.6 照明系统设计 第三章光学图样的测量 3.1 全息技术 3.2 散斑测量技术 3.3 莫尔条纹测量技术 3.4 微图像测量技术 第四章标定方法的研究 4.1 干涉条纹图数学形成与特征4.2 图像预处理方法 4.3 条纹倍增法 4.4 条纹图的旋滤波算法 第五章立体视觉 5.1 立体成像 2 5.2 基本约束 5.3 边缘匹配 5.4 匹域相关性 5.5 从 x 恢复形状的方法 5.6 测距成像

第六章标定 6.1 传统标定 6.2 Tsais 万能摄像机标定法 6.3 Weng ’ s 标定法 6.4 几何映射变换 6.5 重采样算法 第七章目标图像亚像素定位技术第八章图像测量软件 (多媒体介绍 第九章典型测量系统设计分析9.1 光源设计 9.2 图像传感器设计 9.3 图像处理分析 9.4 图像识别分析 附:教学实验 1、视觉坐标测量标定实验 2、视觉坐标测量的标定方法。 3、视觉坐标测量应用实验 4、典型零件测量方法等。

3 第一章绪论 1.1 概述 人类在征服自然、改造自然和推动社会进步的过程中,面临着自身能力、能量的局限性, 因而发明和创造了许多机器来辅助或代替人类完成任务。智能机器或智能机器人是这种机器最理想的模式。 智能机器能模拟人类的功能、能感知外部世界,有效解决问题。 人类感知外部世界:视觉、听觉、嗅觉、味觉、触觉 眼耳鼻舌身 所以对于智能机器,赋予人类视觉功能极其重要。 机器视觉:用计算机来模拟生物(外显或宏观视觉功能的科学和技术。 机器视觉目标:用图像创建或恢复现实世界模型,然后认知现实世界。 1.2 机器视觉的研究内容 1 输入设备成像设备:摄像机、红外线、激光、超声波、 X 射线、 CCD 、数字扫描仪、超声成像、 CT 等 数字化设备 2 低层视觉(预处理 :对输入的原始图像进行处理(滤波、增强、边缘检测 ,提取角点、边缘、线条色彩等特征。 3 中层视觉:恢复场景的深度、表面法线,通过立体视觉、运动估计、明暗特征、纹理分析。系统标定

计算机视觉前沿与深度学习

视觉研究中投入巨大,在IEEE 模式分析与机器智能汇刊(IEEE Transactions on Pattern Analysis and Machine Intelligence, IEEE TPAMI)、计算机视觉国际期刊(International Journal of Computer Vision, IJCV)、IEEE图像处理汇刊(IEEE Transactions on Image Processing, IEEE TIP)、IEEE国际计算机视觉大会(IEEE Inter-national Conference on Computer Vision, IEEE ICCV)和IEEE国际计算机视觉与模式识别会议(IEEE Conference on Computer Vi-sion and Pattern Recognition, IEEE CVPR)等顶级国际期刊和会议上发表了许多重要学术论文,产生了许多国际一流的研究成果。其中最受到关注的研究是深度学习,而深度学习领域发表的论文70%以上是关于视觉图像识别方面的。 为了更好地开展学术交流,推动国内计算机视觉学科发展,进一步提升我国计算机视觉研究在国际领域的影响力,中国计算机学会成立了“计算机视觉专业组”。在本期专题中,计算机视觉专业组特别邀请了多位著名的视觉专家从不同角度撰文,介绍计算机视觉前沿与深度学习研究方面的最新进展。 香港中文大学助理教授王晓刚、博士孙祎、教授汤晓鸥共同撰写的《从统一子空间分析到联合深度学习:人脸识别的十年历程》文章,回顾了人脸识别近十年的发展历程。他们的团队使用深度学习开发了DeepID2+系统,在人脸识别最受关注的LFW(labeled faces in the wild)1数据集上取得了人脸确认任务的世界第一,识别率99.47%。深度学习在人脸识别上的巨大成功,并非只是利用复杂模型拟合数据集。DeepID2+系统的神经元响应有很多重要的性质,比如它是中度稀疏的,对人物身份和人脸属性有很强的选择性,对局部遮挡具有良好的鲁棒性。这些性 计算机视觉通常是指用摄像机和计算机代替人眼对目标进行识别、跟踪/测量来实现对客观三维世界的理解。计算机视觉既是科学领域中富有挑战性的理论研究,也是工程领域中的重要应用,在图像检索、安全监控、人机交互、医疗诊断和机器人等领域具有广阔的应用前景。美国和欧洲等先进国家将计算机视觉列为对经济和科学有广泛影响的重大基本问题,计算机视觉也是“谷歌大脑”、“百度大脑”等研究计划中的核心项目。 计算机视觉作为一门学科始于20世纪60年代。随着个人计算机的普及,计算机视觉在80年代取得了重要进展。最近10年,随着计算机性能的大幅提升和互联网的快速发展,新的视觉特征、大数据、稀疏低秩、深度学习等技术的不断涌现,使计算机视觉又迎来了一次突飞猛进的发展,开辟出许多新的研究领域。国内高校与科研单位在计算机特邀编辑:王 涛1 查红彬2 1爱奇艺公司 2北京大学 计算机视觉前沿与深度学习关键词:计算机视觉 深度学习 1 标注过的户外脸部测试数据集。

超声波测距技术综述

文献综述 题目超声波测距技术综述学生姓名 专业班级 学号 院(系)电气信息工程学院指导教师 完成时间2014 年06月01日

超声波测距技术综述 摘要 我们把频率高于20000赫兹的声波称为“超声波”。超声波具有指向性强,能量消耗缓慢,在介质中传播的距离较远等特点,同时它是一种非接触式的检测方式,不受光线、被测对象颜色等影响,因此经常被用于距离的测量。超声测距技术在工业现场、车辆导航、水声工程等领域都具有广泛的应用价值,目前已应用于物位测量、机器人自动导航以及空气中与水下的目标探测、识别、定位等场合。因此,深入研究超声波测距的理论和方法具有重要的实践意义。 关键词超声波超声波测距车辆导航物位测量

1 引言 1.1 超声波简介 一般认为,关于超声的研究最初起始于1876年F1Galton的气哨实验。当时Galton 在空气中产生的频率达300K Hz,这是人类首次有效产生的高频声。而科学技术的发展往往与一些偶然的历史事件相联系。对超声的研究起到极大推动作用的是,1912年豪华客轮Titanic号在首航中碰撞冰山后的沉没,这个当时震惊世界的悲剧促使科学家们提出用声学方法来预测冰山,在随后的第一次世界大战中,对超声的研究得以进一步的促进。 近些年来,随着超声技术研究的不断深入,我们把频率高于20000赫兹的声波称为“超声波”。再加上其具有的高精度、无损、非接触等优点,超声的应用变得越来越普及。目前已经广泛的应用在机械制造、电子冶金、航海、航空、宇航、石油化工、交通等工业领域。此外在材料科学、医学、生物科学等领域中也占据重要地位。 而我国,关于超声波的大规模研究始于1956年。迄今,在超声的各个领域都开展了研究和应用,其中有少数项目已接近或达到了国际水平。 1.2 超声波测距简介 超声测距指的是利用超声波的反射特性进行距离测量,是一种非接触式的检测方式。与其它方法相比,如电磁的或光学的方法,它不受光线、被测对象颜色等影响。对于被测物处于黑暗、有灰尘、烟雾、电磁干扰、有毒等恶劣的环境下有一定的适应能力。特别是应用于空气测距,由于空气中波速较慢,其回波信号中包含的沿传播方向上的结构信息很容易检测出来,具有很高的分辨力,因而其准确度也较其它方法为高。超声波测距仪,可以应用于汽车倒车、建筑施工工地以及一些工业现场的位置监控和移动机器人的研制上,也可在潮湿高温,多尘等恶劣环境下工作。例如:液位、厚度、管道长度等场合。 超声波测距作为一种典型的非接触测量方法,在很多场合,诸如工业自动控制,建筑工程测量,机器人视觉识别,倒车防撞雷达,海洋测量,物体识别等方面得到广泛的应用。超声波具有指向性强、能量消耗缓慢且在介质中传播的距离较远的优点。与激光测距、红外线测距相比,超声波对外界光线、色彩和电磁场不敏感,更适于黑暗、

浅谈机器人视觉技术

浅谈机器人视觉技术 摘要 机器人视觉是使机器人具有视觉感知功能的系统,是机器人系统组成的重要部分之一。机器人视觉可以通过视觉传感器获取环境的二维图像,并通过视觉处理器进行分析和解释,进而转换为符号,让机器人能够辨识物体,并确定其位置。机器人视觉广义上称为机器视觉,其基本原理与计算机视觉类似。计算机视觉研究视觉感知的通用理论,研究视觉过程的分层信息表示和视觉处理各功能模块的计算方法。而机器视觉侧重于研究以应用为背景的专用视觉系统,只提供对执行某一特定任务相关的景物描述。机器人视觉硬件主要包括图像获取和视觉处理两部分,而图像获取由照明系统、视觉传感器、模拟-数字转换器和帧存储器等组成。本文介绍了机器人的发展以及视觉计算理论和视觉的关键技术。 关键词:机器人、视觉、计算、关键技术 一、机器人发展概述 科学技术的发展,诞生了机器人。社会的进步也提出要求,希望创造出一种能够代替人进行各种工作的机器,甚至从事人类不能及的事情。自从1959年诞生第一台机器人以来,机器人技术取得了很大的进步和发展,至今已成为一门集机械、电子、计算机、控制、传感器、信号处理等多学科门类为一体的综合性尖端科学。当今机器人技术的发展趋势主要有两个突出的特点:一个是在横向上,机器人的应用领域在不断扩大,机器人的种类日趋增多;另一个是在纵向上,机器人的性能不 断提高,并逐步向智能化方向发展。前者是指应用领域的横向拓宽,后者是在性能及水平上的纵向提高。机器人应用领域的拓宽和性能水平的提高,二者相辅相成、相互促进。 智能机器人是具有感知、思维和行动功能的机器,是机构学、自动控制、计算机、人工智能、微电子学、光学、通讯技术、传感技术、仿生学等多种学科和技术的综合成果阎。智能机器人可获取、处理和识别多种信息,自主地完成较为复杂的操作任务,比一般的工业机器人具有更大的灵活性、机动性和更广泛的应用领域。要使机器人拥有智能,对环境变化做出反应,首先,必须使机器人具有感知

人工智能计算机视觉发展分析

人工智能计算机视觉发展分析 计算机视觉是用电脑去识别物体的一种新技术。作为视觉来讲,必须要有眼睛与大脑两部分。计算机视觉的主要组成部分不是“眼睛”,而是“大脑”。 2011年,计算机视觉迎来了最伟大的突破。当年,谷歌人工智能实验室的杰夫·迪恩与斯坦福大学计算机系教授吴恩达合作,他们动用上万台电脑的计算资源,让计算机用深度学习算法在YouTube上观看了一千万段关于猫的视频,最后计算机终于完成了“猫脸识别”。这个项目是谷歌大脑在计算机视觉领域取得的巨大成功。 到了2014年,计算机视觉领域的ImageNet比赛第一次超越了人类肉眼识别图片的准确率——这标志着计算机视觉已经比人眼更加精准,因此具有极大地应用价值。 ImageNet国际挑战赛是计算机视觉领域最著名的比赛,被誉为国际计算机视觉领域的“奥林匹克”。它是2010年由美国斯坦福大学人工智能实验室的李飞飞教授主导推出的。早在2009年,ImageNet对1500万张图片进行了标注,涉及22000个类别的物体,李飞飞她们建立了一个规模空前的数据库。而且,她们公开了整个数据库,免费提供给全世界的人工智能研究团队。有了这个培育计算机大脑的数据库,科研工作者教会了计算机识别物体。 计算机视觉的基本原理

想要实现计算机视觉,首先需要有一个摄像头,然后把拍摄的照片成像在CCD上形成电子照片。这些电子照片是以像素为单位存储在计算机上的。每一个像素都可以看成是三个矩阵元,这些矩阵元给出了像素的RGB数值(每个数值都是整数,取值在0到255之间)。其中,R表示红色,是red的首字母; G表示绿色,是green的首字母;B表示蓝色,是blue的首字母。有了这三种基本颜色,就可以按照不同的权重叠加出千变万化的色彩。 计算机视觉所处理的主要对象就是这个RGB数值,因为每一张照片的像素很多,因此整张照片可以被看成是三个大的矩阵。 计算机视觉的本质,其实就是处理这三个矩阵,然后从这三个矩阵中提取出“特征信息”,比如对于动物的图片,可以提取的特征是“有没有尾巴?”以及“有没有毛?”等。通过对特征信息的提取与判断,可以实现“猫脸识别”或者“人脸识别”。人工智能是通过机器学习的方法,提取不同物体的特征,然后用分类器对各种事物进行分类识别。 计算机视觉的头部公司之一商汤科技与华东师范大学合作,编写了中国第一本人工智能教材《人工智能基础(高中版)》,在书中详细介绍了计算机视觉的算法实现及其基本原理。 计算机视觉有哪些相关企业与落地应用? 计算机视觉领域的应用非常广泛,其主要的落地应用有以下几个大类。

浅谈计算机视觉与数字摄影测量

浅谈计算机视觉与数字摄影测量 发表时间:2018-06-19T16:47:42.070Z 来源:《基层建设》2018年第12期作者:熊健1 汪军2 施航3 [导读] 摘要:计算机视觉是数字摄影测量的重要组成部分,研究其相关课题有着重要意义。 1江苏省地质勘查技术院江苏南京 210000;2安徽省第四测绘院安徽合肥 230000 3华东冶金地质勘查局八一一地质队安徽滁州 239000 摘要:计算机视觉是数字摄影测量的重要组成部分,研究其相关课题有着重要意义。本文首先对相关内容做了概述,分析了计算机视觉与数字摄影测量的处理流程,并结合相关实践经验,分别从多个角度与方面就计算机视觉技术在影像处理系统中的实际应用展开了研究,阐述了个人对此的几点看法与认识,望有助于相关工作的实践。 关键词:计算机;视觉;数字摄影;测量 1前言 计算机视觉与数字摄影测量是一项实践性较强的综合性工作,其具体实施方法的特殊性不言而喻。该项课题的研究,将会更好地提升对计算机视觉的分析与掌控力度,从而通过合理化的措施与途径,进一步优化该项工作的最终整体效果。 2计算机视觉技术核心问题 视觉问题复杂性的本质在于相对声音等物理信号的描述,视觉信号充满了非常丰富的信息,描述起来也更加困难。比如,很多图像中蕴含了大量简单(如颜色、形状、纹理、几何特征等)及复杂(如场景、字符、物体分布、人物而部特征、人体姿势等)信息并具有较大的动态范围和主观性,如何攻克图像信息提取过程中的各种难题一直是当今计算機图像学研究的热点问题。而且,在科学家们还未完全破译生物视觉系统的奥秘的前提下,大多数CV问题只能采用“逆向推导机制”—依据己知或假设的关联将视觉系统的输入(数字图像)和输出(语义描述)对应起来,通过图片猜测真实世界物体具有的形状,照明度以及颜色分布。因此,基于概率论和数理统计的数学模型是最适合解决这类逆推问题的工具,这也是目前CV领域普遍采用各种统计模型和机器学习算法的本质原因。由于各种学习机制和统计模型需要基于先验知识并建立在对待测图像内容的约束、简化及假设的基础上,和生物视觉几亿年的发展进化相比,其建立的数学模型也只能片而而且粗糙地描绘出视觉系统输入与输出之间的关系。因此,对某组特定图像检测时表现十分优秀的系统,往往对另一组语义相同的图片素手无策;很多看似稳定的机器学习机制,在增加样本种类和数量后,检测率反而会下降;很多设计复杂的检测算法在实际应用中的表现反而不如一些简单且基本的数学描述困。 3计算机视觉与数字摄影测量的处理流程 3.1立体视觉 立体视觉是计算机视觉中的一个重要分支,一直是计算机视觉研究的重点和热点之一,在20多年的发展过程中,逐渐形成了自己的方法和理论。立体视觉的基本原理是从两个(或多个)视点观察同一景物,以获取在不同视角下的感知图像,通过三角测量原理计算像像素间的位置偏差(即视差)来获取景物的三维信息,这一过程与人类视觉的立体感知过程是类似的。一个完整的立体视觉系统通常可分为图像获取、摄像机定标、特征提取、影像匹配、深度确定及内插等6个大部分。其中影像匹配是立体视觉中最重要也是最困难的问题,也是计算机视觉和数字摄影测量的核心问题。 3.2影像匹配 立体视觉的最终目的是为了恢复景物可视表面的完整信息。当空间三维场景被投影为二维图像时,同一景物在不同视点下的图像会有很大不同,而且场景中的诸多因素,如光照条件,景物几何形状和物理特性、噪声干扰和畸变以及摄像机特性等,都被综合成单一的图像中的灰度值。因此,要准确地对包含了如此之多不利因素的图像进行无歧义的匹配,显然是十分困难的。 在摄影测量中最基本的过程之一就是在两幅或者更多幅的重叠影像中识别并定位同名点,以产生立体影像。在模拟摄影测量和解析摄影测量中,同名点的识别是通过人工操作方式完成的;而在数字摄影测量中则利用计算机代替人工解决同名点识别的问题,即采用影像匹配的方法。 3.3多目立体视觉 根据单张相片只能确定地面某个点的方向,不能确定地面点的三维空间位置,而有了立体像对则可构成与地面相似的立体模型,解求地面点的空间位置。双目立体视觉由不同位置的两台或者一台摄像机(CCD)经过移动或旋转拍摄同一幅场景,就像人有了两只眼睛,才能看三维立体景观一样,然后通过计算空间点在两幅图像中的视差,获得该点的三维坐标值。现在的数字摄影测量中的立体像对技术通常是在一条基线上进行的,但是由于采用计算机匹配替代人眼测定影像同名像对时存在大量的误匹配,使自动匹配的结果很不可靠。其存在的问题主要是,对存在特殊结构的景物,如平坦、缺乏纹理细节、周期性的重复特征等易产生假匹配;在摄像机基线距离增大时,遮挡严重,能重建的空间点减少。为了解决这些问题,降低双目匹配的难度,自1986年以来出现了三目立体视觉系统,即采用3个摄像机同时摄取空间景物,通过利用第三目图像提供的信息来消除匹配的歧义性。采用“多目立体视觉技术”可以利用摄影测量的空中三角测量原理,对多度重叠点进行“多方向的前方交会”,既能较有效地解决随机的误匹配问题,同时又能增加交会角,提高高程测量的精度。这项技术的应用,将很大程度地解决自动匹配结果的不可靠性,提高数字摄影测量系统的准确性。 4计算机视觉技术在影像处理系统中的实际应用 4.1计算机视觉技术关于图像的预处理的應用 影像测量系统在采集图像的时候,很容易受到周围环境的影响,例如:电磁波的干扰,光的折射,温度的影响等,这将很容易导致测量系统采集到事物图像在播发过程中都会夹杂着刺耳的噪声,对测量物品的边缘描述过于模糊,使得零件的精准度的测量受到了影响。因此需要把计算机视觉技术和影响测量系统的应用结合在一起,在测量产品,处理图像过程中,需要进行原始图像的修改和清晰度的矫正并且选择性的过滤影响产品测量的噪声。由于在测量过程中结合了计算机视觉技术,所以在图像的预处理的时候,不需要对图画质量的降低,可以运用计算机视觉技术对于图像进行修改,重要的部位采用灰色直方图修改技术特别标出,其他部位选择性消除。虽然计算机技术跟影像测量系统的结合很好的处理了这些的问题,但是也要避免在测量过程中受到噪音的干扰,从而使得图像变质。因此,在测量的时候可以先对周围环境进行预处理,采用计算机视觉技术中的边缘保持滤波算法降低周围环境的噪声影响,从而保证了测量图像的精确性。 4.2计算机视觉技术关于图像边缘处理的应用

相关主题