搜档网
当前位置:搜档网 › 模式识别与智能系统研究进展.

模式识别与智能系统研究进展.

模式识别与智能系统研究进展.
模式识别与智能系统研究进展.

一.详细介绍人工情感方向内涵、相关课题及研究成果

人工情感内涵 :人工情感指用人工的方法和技术, 模仿、延伸和扩展人的情感, 使机器具有识别、理解和表达情感的能力。人工智能是指用人工的方法和技术,模仿、延伸和扩展人的智能, 实现机器的智能化。从广义的角度来看,情感是一种特殊的认知,意志又是一种特殊的情感,广义的人工智能包括狭义人工智能、人工情感与人工意志三个方面。

人工情感并不是指简单地模拟人的某些情感表达方式和情感识别方式, 而是为了使电脑或机器人具有像一样的内在情感, 真实地具有像人一样的情感表达能力、情感识别能力、情感思维能力和情感实施能力。

人工情感相关课题:

国内开展的研究项目主要有:

1. 脸部运动编码系统可应用于人脸表情的自动识别与合成;

2.MPEG-4 V2视觉标准可以组合多种表情以模拟混合表情;

3. 针对人的肢体运动而设计的运动和身体信息捕获设备;

4. 基于生物特征的身份验证系统;

5. 语调表情构造系统根据语音的时间、振幅、基频和共振峰等, 寻找不同情感信号特征的构造特点和分布规律;

6. 可穿戴式计算机可用于增强和补偿人的感知功能。

人工情感研究成果:

(1 1996年日本文部省就以国家重点基金的方式开始支持“情感信息的信息学、心理学研究”的重大研究课题,日本各大公司竞相开发、研究、生产了所谓的个人机器人(Personal Robot 产品系列。其中, 以 SONY 公司的 AIBO 机器狗 (已经生产 6

万只, 获益近 10亿美元和 QRIO 型以及 SDR -4X 型情感机器人为典型代表。日本新开发的情感机器人取名“小IF ” , 可从对方的声音中发现感情的微妙变化,然后通过自己表情的变化在对话时表达喜怒哀乐, 还能通过对话模仿对方的性格和癖好。

(2美国 MIT 展开了对“情感计算”的研究, IBM 公司开始实施“蓝眼计划”和开发“情感鼠标” ; 2008年 4月美国麻省理工学院的科学家们展示了他们最新开发出的情感机器人“ Nexi ” ,该机器人不仅能理解人的语言,还能够对不同语言做出相应的喜怒哀乐反应,还能够通过转动和睁闭眼睛、皱眉、张嘴、打手势等形式表达其丰富的情感。这款机器人完全可以根据人面部表情的变化来做出相应的反应。它的眼睛中装备有 CCD(电荷耦合器件摄像机, 这使得机器人在看到与它交流的人之后就会立即确定房间的亮度并观察与其交流者的表情变化。

(3 德国 Mehrdad Jaladi-Soli 等人在 2001年提出了基于 EMBASSI 系统的多模型购物助手。 EMBASSI 是由德国教育及研究部(BMBF 资助并由 20多个大学和公司共同参与的,以考虑消费者心理和环境需求为研究目标的网络型电子商务系统。英国科学家已研发出名为“灵犀机器人” (Heart Robot 的新型机器人,这是一种弹性塑胶玩偶,其左侧可以看到一个红色的“心” ,而它的心脏跳动频率可以变化,通过程式设计的方式,让机器人可对声音、碰触与附近的移动产生反应。

二 . 分析介绍民用航空领域模式识别与智能系统的应用研究内容和成果

(1研究内容:卫星遥感图像中机场的识别方法研究

利用卫星或飞机等所摄取的图像来获取地面目标 , 一直是空间技术获取有关地面信息的重要手段。随着计算机性能的提高和图像处理技术的发展 , 利用计算机来检测识别遥感图像中的目标已经成为研究的热点。机场识别作为模式识别领域的问题之一 , 在民航领域有着重要的应用前景。使用模糊学增强方法对遥感图像进行预处理 , 利用阈值分割方法进行图像分割 , 然后利用像素标记法提取出最大连通区域 , 最后通过 ROI 的算法 , 实现对机场区域

的定位。

研究成果:由于机场目标的复杂性 , 使机场识别成为一个非常复杂的问题。到目前为止 , 机场识别技术基本上是处在实验室阶段。随着图像处理、模式识别、计算机视觉以及神经网络等学科的进一步发展 , 通过人们坚持不懈的努力探索 , 机场识别技术必将会得到很大的发展。

(2研究内容:飞机图像导航数据库系统的设计与开发

飞机导航就是将飞机从起始点引导到目的地的技术或方法。应用较多的飞机导航系统有惯性导航系统、多普勒导航系统、卫星全球定位系统 (GPS系统、图像导航系统等。最近几年, 随着计算机图像处理能力和技术的提高, 硬件设备的快速升级, 信号处理技术和控制技术的发展,图像导航技术得到了迅速的发展。

图像导航技术是利用传感器获取航行装置下方景物的图像, 并且将获取到的图像进行识别或者与已有的地形图进行匹配,从而确定航行装置的准确位置,用作导航系统自动避障, 或将处理后的有用信息显示出来以提醒操纵人员。如图 1所示为图像导航流程图。

图 1 图像导航流程图

图像导航方法分为景物导航、特征标志匹配导航、地形图匹配导航等。景物导航就是利用自然存在的或人造特定的景物判断系统目前所处的位置。特征标志匹配导航是一种利用特征标志来判断系统是否已经飞入特定区域或接近特定位置的导航方法。地形图匹配导航是利用现场拍摄到的地面图像与预先存储的地形图的特征进行比对、判断, 确定系统当前的位置和航向等信息。

研究成果:根据图像导航原理, 很多科研机构已经设计并实现了飞机图像导航数据库系统。系统将导航所需的信息和若干地区的地面图预先存放在数据库中的特定位置。用户只需在系统的可视化界面中进行少量的操作, 该系统就能够在飞机航行的过程中实时地显示拍摄到地面图像, 并将该图像与数据库中的相关图像进行特征匹配, 从而获取并提供给用户飞机当时的位置、航速快慢及航向误差等导航信息。

由于图像导航方法不依靠外界信号, 因此该系统使用起来更加安全可靠。对于适用于图像导航的区域,该系统将会提供精确的导航参数和信息,对于图像导航失效的区域或时间, 可以利用其他辅助的导航方法,使飞机不至于失航或发生意外。该系统能够为飞机的航行提供有价值的导航信息。此外, 该系统的实时性较强且易于操作。因此,具有较高的应用价值。

(3研究内容:遥感图像三维可视化在机场建设中的应用研究

随着遥感技术、摄影测量技术及其相关技术的飞速发展, 使得我们快速获取地表信息并重建三维地表模型成为现实。目前可以通过航空摄影、航天摄影、近景摄影等多种手段获取高分辨率数字影像信息, 充分利用数字摄影测量的测绘成果, 准确、直观、生动地对实地模型进行再现。而遥感图像三维可视化恰好能满足这一要求。许多领域、许多行业都需要三维地形平台。采用遥感信息的光谱特征和信息分类提取技术, 获取所需要的工程地质信息, 结合 GIS 的空间分析将三维影像直接应用于工程方案的设计中,直观地进行工程选址、工程量

计算; 再利用虚拟现实技术,进行三维模拟飞行, 预览路线实地景观, 实现室内选址并渗入到机场工程勘测设计的各个环节进行仿真设计, 将大大减少工程地质灾害、提高设计的合理性和准确性。帮助设计人员优化方案,在工程规划、勘察、设计、施工中可广泛应用。研究成果:通过遥感图像处理得到了高精度三维可视化遥感正射影像图, 可以作为各种专题信息的载体,如将各种解译的线性构造、岩体、地层界限、物化探数据等形象地显示在三维可视化遥感正射影像图上。遥感三维可视化影像, 给分析勘察人员以感性直观认识, 同时可利用现成遥感图像处理和

GIS 分析软件,结合影像中地理要素和文字符号标注进行地形测量与地物查询、计算和分析。另一方面模拟飞行动态观测, 增加了分析勘察人员的临场感, 将其置于所虚拟的环境之中。

(4研究内容:机场停机位分配问题研究

机场停机位分配是指在考虑机型大小、停机位大小、航班时刻等因素的情况下, 在一定时限范围内, 由机场生产指挥中心为到港或离港航班指定适宜的登机口, 保证航班正点不延误,为旅客上下飞机提供登机门(故国外也叫机门指派 ,为航班分配停机位包括航班占用停机位时间和占用具体停机位两项内容。这既与航空器种类、到港和离港密集程度有关, 又与机场设备设施和机位分配方法有关。合理编制停机位分配计划是机场生产指挥中心完成作业任务的核心工作之一。建立停机位分配模型并设计相应的算法是实现计算机辅助调度编制停机位分配计划的重要内容。

针对停机位分配问题,国外学者提出了不同的分析工具 , G. D. Gosling等从专家系统的观点对此问题进行了探讨; O. Bab ic , D. Teodo rov ic and A.Bo lat等应用数学规划,以旅客在航站楼里步行距离最短为目标函数,利用 0— 1整数规划探讨分配的可行性。研究成果:中国民航飞行学院航空运输管理学院 , 文军等人通过分析机场停机位分配的特点, 根据航空器占用停机位时区集合的特性, 提出停机位分配的图论模型, 将机场停机位分配问题转化为图的 k —顶点着色问题。然后将遗传算法应用于该问题,给出了机场停机位分配问题的实用算法, 为利用计算机进行停机位自动分配并优化停机位结果提供了一种可行手段。

(5研究内容:智能视频监控系统在机场的应用

面对上述各种安防子系统,各系统间还相对独立, 缺乏一个整体的管理平台。另外,各系统主要以被动式的监控手段, 也很难做到提前预防, 实时监控, 及时处理的现代化立体安防概念。而智能视频监控系统的出现, 让图像识别侦测事件成为可能。系统能够识别不同的物体, 同时会识别目标行为是否符合这些规则以及发现监控画

面中的异常情况, 并能够以最快和最佳的方式发出警报和提供有用信息, 从而能够更加有效的协助安全人员处理危机, 并最大限度的降低误报和漏报现象。

研究成果即场景应用:

1、周界监控

机场周界长达几十公里,周围环境复杂,穿越田野,河流,山地,公路,完全用围墙或围栏隔开不现实, 花费也过大。而使用摄像机进行视频监控室比较合适的方式, 但机场周界过长, 摄像机数量庞大,仅靠人眼判断无法做到疏而不漏。因此,智能视频分析系统是取代人力, 提高效率的有效方法。

采用智能视频分析仪, 将设备直接与模拟视频连接, 在客户端视频画面进行设置。在机场周界附件画出虚拟周界, 系统支持设置不规则边界。边界可超出实际周界, 用于对可疑目标的预报警。当有不明物体接近周界时,系统即触发警报提醒保安人员迅速作出判断处理。 2、机场行李房监控

机场行李房内传输带在地下蜿蜒几公里长, 每天传输大量旅客行李进行检查, 运输。但在传输途中, 由于传输带并非直线平行运输, 在转弯上下运输中难免会跌落遗漏。为防止意外发

生,导致旅客出行延误,又降低人力成本,不必安排专职人员人工判断。因此,采用智能视频分析仪,对传输带易跌落段进行监测,一旦有包裹,行李滑落,系统立即触发报警,相关人员进行确认并处理。

3、停机坪监控 :

客机在停航时期或其他非运营时期,停于专业停机坪内,为防止可疑人员接近,盗窃设备, 破坏, 或偷航行为, 对停机坪周围进行物体移动监控。当进入停机坪客机周围的移动物体进行监控与警报,监控人员可通过灯光、语言进行阻止和警告。

由于近几年国内外机场已经发生多次有人潜入机场, 钻入飞机货舱或起落架舱, 最后影响航班的正常时刻或造成人员伤亡事件。因此,保障飞机安全也是直接对乘

客安全的有力保障。 (6研究内容:基于无线电定位网络的机场场面监控、防撞与调度系统

以 https://www.sodocs.net/doc/8a1708112.html, 为开发工具,利用地理信息系统(GIS 二次开发工具 MapObjects

组件技术对系统的数据库设计和具体实现进行了研究。以国内某机场为例,在C #环境下设计了机场场面监控系统, 为机场现场运行指挥提供了可视化、便捷化的信息管理平台, 以减少机场停机坪安全事故的发生。

研究成果:

1. 屏幕显示功能:(1提供多种图层显示操作。如:图层放大、漫游、中心放大、中

心缩小、鹰眼功能等等。 (2特种车辆详细信息显示。在地图上以点的形式实时显示出所监控车辆的位置,并能显示车辆的移动路线方向。

2. 特种车辆管理功能:(1车辆信息更新。 (2信息查询。 (3数据维护。

3. 车辆监控报警功能

4. 车辆调度功能

(7机场泊位自动引导系统

研究内容:近年来,机场管理控制系统的一体化、智能化水平越来越高, 而传统的人工引导泊位方式因其效率低、安全性差、功能单一等缺陷已经不能满足现代化机场运营的需求。飞机泊位引导系统 ( docking guidance system, DGS 是一种能自动引导滑行飞机迅速到达机坪停机位置并准确停泊的一套人机对话指挥系统, 该系统通过激光或视频传感器监测接近泊位的飞机位姿与速度信息,并通过停泊位前方的显示装置显示飞机位姿与速度等信息, 可有效引导不同机型的航空器到不同停止线上与登机桥准确对接。同时, 它与机场数据集成平台相连,可实时提供入坞飞机

的方位角引导、机型参数、航班信息、滑行速度、机位信号等内容,大大提高了机场的装备水平、劳动效率、管理水平和服务质量。

机场泊位引导系统的发展应用先后经历了“地理线圈式” 、“激光测距式”和“目视泊位引导系统” 几个阶段, 伴随着激光扫描测量技术的不断深入发展和广泛应用, 作为能够精确、快速获取地面物体轮廓三维数据的有效手段已被成功的运用到国内外机场的泊位引导系统中。 1992 年基于激光技术的机场泊位引导系统专利由瑞典的 FMT 公司申请获得, 后来研制的飞机位置及资讯显示 ( aircraft positioning and information system, APIS 等系统应用广泛 ; 1995年瑞典 Safegate 公司推出了以激光为基础的新一代 Safedock( 安全停靠引导系统,今天的产品能够以精确到 10 cm 的停止精度安全停靠飞机,产品的市场占有率达到 80%; 美国 Honeywell 公司生产的目视泊位飞机引导系统 ( visual docking guidance system 和德国西门子公司开发的视频导引系统 ( video docking system , VDOCKS 作为国际领先水平的引导设备也应用在世界很多机场。国内在此领域起步较晚, 大多处于实验研究阶段。

2008 年,首都机场 3 号航站楼采用了基于激光 3D 扫描技术的泊位引导系统,可精确显示航空器入位滑行角度及距离, 系统采用集成与本地两种控制方式, 可提供泊位状态信息显示、航班信息编辑、滑行参数设定与提取及视频监控等多项功能,对雨、雪、雾等天气环境有较强的适应性。

2010 年, 虹桥机场 2 号航站楼共设置 46 套泊位引导系统, 系统采用的是激光扫描和测距技术。在航空器停泊过程中, 跟踪航空器的横向和纵向位置, 通过显示屏为飞行员提供航空器接近停靠点的实时位置信息。

从以上各机场的运营情况来看,机场泊位引导系统提高了引导的准确度,确保了安全、高效、便捷地完成引导任务,间接地降低了人工成本。从发展趋势上看,由于激光扫描技术的独特优势 : ①数据获取速度快,实时性强 ; ②扫描数据量大,精度较高 ; ③主动式探测, 对环境适应性较强,能全天候工作 ; ④全数字特征,信息处理容易,系统逐渐向基于激光三维扫描技术并综合视频监控等技术的精确、快速、多功能性方向发展。

研究成果:基于三维激光扫描技术的泊位引导系统

三维激光扫描技术是近年来发展起来了一门新技术,可以高效、快捷、准确、方便的获得被测对象表面每个采样点空间立体坐标,这些采样点的集合,称之为“点云” ,通过对点云的处理,可以快速生成物体真实的三维数据模型。

2 基于脉冲激光测距技术的泊位引导系统

脉冲激光测距传感器是泊位系统的核心部件之一。系统主要包括激光脉冲发射模块及发

射光学器件 ; 接收模块及接收光学器件 ; 时刻鉴别单元 ; 信号处理控制模块等。

3 基于双振镜激光扫描技术的泊位引导系统

二维振镜激光扫描技术因其速度快、精度高、易于控制等特点得到了越来越广泛的应用。振镜扫描系统由扫描反射镜、位置传感器、扫描电机及伺服电路几部分组成。其整体性能指标,包括转角范围、小信号响应时间、重复性、线性度和温漂等,实际应用中对振镜的性能要求就是精度高、速度快、偏角大、体积小、可靠性好。

(8模拟机自主研发之视景系统部分的研发

研究方向:视景系统是安装在模拟机上的一套景象系统, 是用来模拟飞行员所看到的座舱外部的空中及地面景象的模拟景象, 为飞行员提供仿真训练的重要组成部分。飞行训练中心从国外引进的模拟机里有部分视景库, 但不全面。为了不断提高国航高原地区的飞行能力, 更好地服务于广大高原地区的群众, 需要自主研发视景数据库, 不仅保证数据库的安全性, 也大大节约开发成本,为后期维护提供方便。

研究成果:

四维灏景最新搭建了一套飞行模拟器, 具有国际三级飞行模拟器标准水平, 可逼真再现飞机性能、火控系统及仪表指示与被模拟对象实际情况。

主要可实现模拟发动机的启动和空中使用,特殊情况及处置方法, 包括:空中停车、起落架放不下刹车失灵空中失火等。模拟依赖座舱仪表指示进行的各种能见度下的空域飞行, 起飞和着陆阻硬特技飞行、编队飞行等。同时还能够对模拟飞行训练进行全程记忆, 也可对飞行训练过程中的各种情形实施冻结。

模拟飞行器的主要构成有三个部分,分别为座舱环境仿真、动感系统和视景系统。一、座舱环境仿真:

座舱环境仿真采用逼真的前舱设备, 包括仪表指示灯按钮照明设备等; 操纵力感仿真采用先进的电动操纵负荷系统, 为使用人员提供贴近真实的操作环境和近似真实的状态变化操纵杆力。

二、动感系统

采用强大的图像生成系统和全球数据库, 配合多通道实像显示系统, 为使用人员提供可视的实时窗外景象。

三、视景系统

将驾驶舱的物理模型嵌入具有四维自主研发并且获得国家技术专利的六自由度电动运动平台上,配合自控技术和伺服技术使您身临其境。

三.除第一、二题涉及内容外,介绍一下模式识别领域当前主要研究方向(10个及课题 (10个。

三模式识别领域当前主要研究方向

1 人脸识别

人脸识别技术是基于人的脸部特征,对输入的人脸图象或者视频流 . 首先判断其是否存在人脸 , 如果存在人脸,则进一步的给出每个脸的位置、大小和各个主要面部器官的位置信息。并依据这些信息, 进一步提取每个人脸中所蕴涵的身份特征, 并将其与已知的人脸进行对比,从而识别每个人脸的身份。

具体方向有:人脸探测

人脸探测的目的是找出一区域的所有的人脸,及其他们的位置和接近的姿势。

人脸校准

人脸校准是通过所有的人脸标准得到人脸的外形的过程, 进而进行人脸识别, 人脸建模和综合

人脸姿态估计

人脸和头部追踪

人脸姿态估计和人脸轮廓提取

人脸识别

人脸人口统计:性别,年龄,种族等

人脸检索

人口追踪

2 自主平台综合健康管理

本研究方向主要关注于自主武器平台, 特别是陆地履带式机器人和空中机器人, 即无人

机的综合健康管理、有人飞机的综合健康管理、民用的复杂机电系统健康管理的技术研究。重点关注无人战斗机的综合健康技术研究、航空电源系统和航空火箭发动机故障诊断及综合健康管理技术研究。聚焦无人战斗机、有人战斗机和自主平台综合健康管理理论架构研究和工程化实现技术。

综合健康管理是一个十分前沿的研究向,概念形成于 20世纪 90年代,国内对于CSIHM 的研究刚刚起步它是自主武器平台和现代飞行器的最新核心技术之一。自主武器平台成为无人战争之神关键与核心技术是:准确的敌我识别、精确的目标探测、识别; 高度的自主控制和自主综合健康管理。

3 基于多生物特征的个人识别和验证

生物识别特征包括人脸, 语音, 手写,指纹等。单一生物特征的匹配算法只能计算一个特定的特征,某些情况下,这是不足的。该项目将尝试整合不同的特点和多分类的结果,建立一个个人识别系统,以提高识别率,使结果更可靠。

4 基于笔迹识别的个人识别

在线笔迹具有有静态和动态的高度准确的个人识别功能, 难以伪造。在线手写识别被广泛应用于金融, 取证, 移动设备和掌上电脑等笔迹识别可根据人书写时的压力, 速度, 方位, 角度等运用算法进行判断。

5 信息隐藏

隐写 (即信息隐藏旨在检测信息中是否隐藏有秘密消息的隐秘的反技术。目的是阻止非法信息的隐蔽通信。这是网络安全的迫切需要。

6 自然环境下的文本认知与理解

自然环境下的文本认知是指在对二维文本或三维文本的背景或所依存的环境无限制或尽量少限制的认知条件下,对文本的识别与理解。

相对于自然环境下的文本认知技术, 传统的文本认知技术是指在相对简单和理想的认知条件下,对文本的识别与理解, 且一般限于二维文本。经过几十年的发展, 传统的文本认知技术已获得了较成功的应用, 如在低噪声、简单背景、简单版面结构下的高性能的文档分析系统。但在自然环境下, 文本的认知任务将面临诸多挑战。首先, 自然环境中的文本背景或所依存的环境非常复杂或恶劣。如待识别的文本背景有强烈的噪声和干扰, 如支票中的底纹或低质量的身份证图像; 在视频的字幕文本识别中, 要识别的文本与各种复杂的自然景物融汇在一起, 或是与其他非文本信息纹理上的相似性, 使其与背景信息的分离非常困难; 其次, 自然环境中的文本本身情况复杂或变化巨大。如待分析的文档的版面结构非常复杂; 在视频流中的运动的字幕文本; 在真实场景下的文本,如街道商店的名字,警告或信息符号, 广告牌上的广告,车牌牌号,衣服上的商标等,由于其处在三维空间中,并受到自然条件、光照和摄像角度等各种因素的影响, 文本会产生各种意想不到的扭曲、变形、残缺、模糊断裂等现象,这些都给文本的获取、切分与认知造成了极大的困难;

自然环境中的文本认知技术是一项综合技术, 其研究与开发涉及到多个学科和领域, 成为计算机视觉、模式识别、机器学习等共同关注和研究的课题, 因此在国

内外有很重要的地位和影响。随着计算技术和计算机网络等信息技术的发展,在日新月异的现代信息社会中, 为文本认知提供了新的解决途径,也带来新的应用领域和问题。自然环境中的文本认知技术必将日益显示出她的重要性, 必将为智能人机交互领域作出重要贡献。因此, 研究自然环境下的文本认知技术有重要的意义。

7 人体运动信息分析技术

利用人工智能和机器视觉技术分析理解人类的运动和行为, 通过复杂背景中运动目标提

取、运动动作的跟踪与分析、智能行为的识别与理解来指导运动的智能化, 如运动员的科学训练,人体运动机能的康复等。结合奥运重点攻关项目“短道速滑项目滑行数据测量技术研究”, 基于模式识别、图象处理及人工智能理论, 研究在无标记测量点情况下测量运动员运动轨迹及相关参数的技术;并建立运动员技术特征数据库,仿真运动员训练、比赛过程。 8 多模态人体生物特征鉴别技术

对各项生物特征鉴别技术研究的基础上, 研究一种能够综合利用多种生物特征对人身份进行鉴别的技术, 建立一个具有更高可靠性, 更强的适应能力, 又简便易行的实用身份鉴别系统。同时系统是由多个身份鉴别技术综合而成的, 系统的构成具有相当的灵活性, 能够根据各种不同的应用背景进行选择和综合,适应不同环境对系统可靠性和适用生物特征的要求。

9 医学图像处理技术

研究将模式识别和图像处理中的知识和理论应用到医学影像处理中。并且根据医学影像处理中的一些实际特点, 结合模糊集理论、小波分析理论和神经网络理论等方面的知识, 提出区别于传统数字图像处理的方法,并应用到医学影像的处理上。通过乳腺癌早期检测的研究会对模式识别理论和方法,特别是对图像处理技术和方法的提高具有很大的促进作用。乳腺癌早期检测是对图像处理、分类器设计和分类器训练等技术的综合及深化, 复杂性更高, 灵活性更大,智能性要求也更强,特

人工智能地研究方向和应用领域

人工智能的研究方向和应用领域 人工智能(Artificial Intelligence) ,英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。广义的人工智能包括人工智能、人工情感与人工意志三个方面。 一、研究方向 1.问题求解 人工智能的第一个大成就是发展了能够求解难题的下棋(如国际象棋)程序。在下棋程序中应用的某些技术,如向前看几步,并把困难的问题分成一些比较容易的子问题,发展成为搜索和问题归约这样的人工智能基本技术。今天的计算机程序能够下锦标赛水平的各种方盘棋、十五子棋和国际象棋。另一种问题求解程序把各种数学公式符号汇编在一起,其性能达到很高的水平,并正在为许多科学家和工程师所应用。有些程序甚至还能够用经验来改善其性能。 2.逻辑推理与定理证明 逻辑推理是人工智能研究中最持久的子领域之一。其中特别重要的是要找到一些方法,只把注意力集中在一个大型数据库中的有关事实上,留意可信的证明,并在出现新信息时适时修正这些证明。对数学中臆测的定理寻找一个证明或反证,确实称得上是一项智能任务。为此不仅需要有根据假设进行演绎的能力,而且需要某些直觉技巧。 1976年7月,美国的阿佩尔(K.Appel)等人合作解决了长达124年之久的难题--四色定理。他们用三台大型计算机,花去1200小时CPU时间,并对中间结果进行人为反复修改500多处。四色定理的成功证明曾轰动计算机界。 3.自然语言理解 NLP(Natural Language Processing)自然语言处理也是人工智能的早期研究领域之一,已经编写出能够从内部数据库回答用英语提出的问题的程序,这些程序通过阅读文本材料和建立内部数据库,能够把句子从一种语言翻译为另一种语言,执行用英语给出的指令和获取知识等。有些程序甚至能够在一定程度上翻译从话筒输入的口头指令(而不是从键盘打入计算机的指令)。目前语言处理研究的主要课题是:在翻译句子时,以主题和对话情况为基础,注意大量的一般常识--世界知识和期望作用的重要性。

模式识别的研究现状与发展趋势

模式识别的研究现状与发展趋势 摘要:随着现今社会信息技术的飞速发展, 人工智能的应用越来越广泛, 其中模式识别是人工智能应用的一个方面。而且现今的模式识别的应用也越来越得到大家的重视与支持,在各方面也有重大的进步。模式识别也成为人们身边不可或缺的一部分。关键词:人工智能,技术,模式识别,前景 Abstract:In the modern society with the rapid development of information technology, the application of a rtificial intelligence is more and more extensive, among them pattern recognition is one of the ap ply of artificial intelligence. And now the application of pattern recognition is also more and more to get everyone's attention and support, in various aspects have significant progress. Pattern rec ognition has become an integral part of people around. Keywords: Artificial Intelligence, Technology,Pattern Recognition, prospects 一,引言 如今计算机硬件的高速发展, 以及计算机应用领域的不断开拓, 人们开始要求计算机能够更有效地感知诸如声音、文字、图像、温度、震动等人类赖以发展自身、改造环境所运用的信息资料。但就一般意义来说, 目前一般计算机却无法直接感知它们, 我们常用的键盘、鼠标等外部设备, 对于这些外部世界显得无能为力。虽然摄像机、图文扫描仪、话筒等设备业已解决了上述非电信号的转换, 并与计算机联机, 但由于识别技术不高, 而未能使计算机真正知道采录后的究竟是什么信息。计算机对外部世界感知能力的低下, 成为开拓计算机应用的瓶颈, 也与其高超的运算能力形成强烈的对比。于是, 着眼于拓宽计算机的应用领域, 提高其感知外部信息能力的学科———模式识别, 便得到迅速发展。 人工智能所研究的模式识别是指用计算机代替人类或帮助人类感知模式, 是对人类感知外界功能的模拟, 研究的是计算机模式识别系统, 也就是使一个计算机系统具有模拟人类通过感官接受外界信息、识别和理解周围环境的感知能力。现将人工智能在模式识别方面的一些具体和最新的应用范围遍及遥感、生物医学图象和信号的分析、工业产品的自动无损检验、指纹鉴定、文字和语音识别、机器视觉地圈模式识别等方面。 二,现状 以地图模式识别为例,地图模式识别是由计算机来对地图进行识别与理解, 并借助一定的技术手段, 让计算机研究和分析地图上的各种模式信息, 获取地图要素的质量意义。其计算处理的过程类似于人对地图的阅读。 地图模式识别是近年来在地图制图领域中新兴的一门高新技术, 是信息时代人工智能、模式识别技术在地图制图中的具体应用。由于它是传统地图制图迈向数字地图制图的一座桥梁, 因此,地图模式识别遥感技术、地理信息系统一起, 被称为现代地图制图的三大技术。 目前, 地图模式识别由于具有广泛的应用价值和发展潜力,因而受到了人们的普遍重视。尤其是随着现今的计算机及其外部硬件环境的不断提高, 科技不过发展的情况下,

DX3004模式识别与人工智能--教学大纲

《模式识别与人工智能》课程教学大纲 一、课程基本信息 课程代码:DX3004 课程名称:模式识别与人工智能 课程性质:选修课 课程类别:专业与专业方向课程 适用专业:电气信息类专业 总学时: 64 学时 总学分: 4 学分 先修课程:MATLAB程序设计;数据结构;数字信号处理;概率论与数理统计 后续课程:语音处理技术;数字图像处理 课程简介: 模式识别与人工智能是60年代迅速发展起来的一门学科,属于信息,控制和系统科学的范畴。模式识别就是利用计算机对某些物理现象进行分类,在错误概率最小的条件下,使识别的结果尽量与事物相符。模式识别技术主要分为两大类:基于决策理论的统计模式识别和基于形式语言理论的句法模式识别。模式识别的原理和方法在医学、军事等众多领域应用十分广泛。本课程着重讲述模式识别的基本概念,基本方法和算法原理,注重理论与实践紧密结合,通过大量实例讲述如何将所学知识运用到实际应用之中去,避免引用过多的、繁琐的数学推导。这门课的教学目的是让学生掌握统计模式识别基本原理和方法,使学生具有初步综合利用数学知识深入研究有关信息领域问题的能力。 选用教材: 《模式识别》第二版,边肇祺,张学工等编著[M],北京:清华大学出版社,1999; 参考书目: [1] 《模式识别导论》,齐敏,李大健,郝重阳编著[M]. 北京:清华大学出版社,2009; [2] 《人工智能基础》,蔡自兴,蒙祖强[M]. 北京:高等教育出版社,2005; [3] 《模式识别》,汪增福编著[M]. 安徽:中国科学技术大学出版社,2010; 二、课程总目标 本课程为计算机应用技术专业本科生的专业选修课。通过本课程的学习,要求重点掌握统计模式识别的基本理论和应用。掌握统计模式识别方法中的特征提取和分类决策。掌握特征提取和选择的准则和算法,掌握监督学习的原理以及分类器的设计方法。基本掌握非监督模式识别方法。了解应用人工神经网络和模糊理论的模式识别方法。了解模式识别的应用和系统设计。要求学生掌握本课程的基本理论和方法并能在解决实际问题时得到有效地运用,同时为开发研究新的模式识别的理论和方法打下基础。 三、课程教学内容与基本要求 1、教学内容: (1)模式识别与人工智能基本知识; (2)贝叶斯决策理论; (3)概率密度函数的估计; (4)线性判别函数; (5)非线性胖别函数;

模式识别与智能系统

模式识别与智能系统 (081104) 一、培养目标 培养热爱祖国,拥护中国共产党的领导,拥护社会主义制度,遵纪守法,品德良好,具有服务国家、服务人民的社会责任感,掌握本学科坚实的基础理论和系统的专业知识,具有创新精神、创新能力和从事科学研究、教学、管理等工作能力的高层次学术型专门人才。 模式识别与智能系统是20世纪60年代以来在信号处理、人工智能、控制论、计算机技术等学科基础上发展起来的新型学科。该学科以各种传感器为信息源,以信息处理与模式识别的理论技术为核心,以数学方法与计算机为主要工具,探索对各种媒体信息进行处理、分类、理解并在此基础上构造具有某些智能特性的系统或装置的方法、途径与实现,以提高系统性能。模式识别与智能系统是一门理论与实际紧密结合,具有广泛应用价值的控制科学与工程的重要学科分支。 本学科培养德智体全面发展,具有坚实和系统的模式识别与智能系统理论知识和实践技能,了解模式识别与智能系统学科发展的前沿和动态,能够适应我国经济、科技、教育发展需要,面向二十一世纪的科学研究、工程技术和高等教育的高层次人才。学位获得者业务上应具有具备从事在本学科及相关学科领域独立开发研究工作的能力,注意理论联系实际,能够分析和解决现代经济建设和交叉学科中涌现出的新课题;能够熟练利用计算机解决本学科的有关问题;较为熟练地掌握一门外国语;具有健康的体格。 二、研究方向 (一)智能机器人系统 主要进行智能机器人控制与决策系统的研究与开发,包括自主移动机器人、特种机器人、服务机器人、工业机器人等内容。机器人的自主定位、导航、避障与多机器人协调控制为主要研究方向。 (二)系统仿真技术与应用 主要研究方向为控制系统仿真与计算机辅助设计、半实物仿真与实时控制、分数阶与网络控制系统仿真、系统建模校验与验证及仿真算法和高层体系结构理论与应用技术、工业过程建模仿真和提高控制效果与系统性能的方法研究。 (三)图像处理与计算机视觉 研究图像信息获取、处理、分析、理解与识别分类等理论与技术,研究图像处理技术在医学影像处理、动态目标识别与跟踪、智能交通系统、军事等领域的工程应用问题。 (四)建筑智能化技术 本方向以建筑智能化技术为背景,主要研究智能建筑系统集成理论与技术、

模式识别研究进展-刘成林and谭铁牛

模式识别研究进展 刘成林,谭铁牛 中国科学院自动化研究所 模式识别国家重点实验室 北京中关村东路95号 摘要 自20世纪60年代以来,模式识别的理论与方法研究及在工程中的实际应用取得了很大的进展。本文先简要回顾模式识别领域的发展历史和主要方法的演变,然后围绕模式分类这个模式识别的核心问题,就概率密度估计、特征选择和变换、分类器设计几个方面介绍近年来理论和方法研究的主要进展,最后简要分析将来的发展趋势。 1. 前言 模式识别(Pattern Recognition)是对感知信号(图像、视频、声音等)进行分析,对其中的物体对象或行为进行判别和解释的过程。模式识别能力普遍存在于人和动物的认知系统,是人和动物获取外部环境知识,并与环境进行交互的重要基础。我们现在所说的模式识别一般是指用机器实现模式识别过程,是人工智能领域的一个重要分支。早期的模式识别研究是与人工智能和机器学习密不可分的,如Rosenblatt的感知机[1]和Nilsson的学习机[2]就与这三个领域密切相关。后来,由于人工智能更关心符号信息和知识的推理,而模式识别更关心感知信息的处理,二者逐渐分离形成了不同的研究领域。介于模式识别和人工智能之间的机器学习在20世纪80年代以前也偏重于符号学习,后来人工神经网络重新受到重视,统计学习逐渐成为主流,与模式识别中的学习问题渐趋重合,重新拉近了模式识别与人工智能的距离。模式识别与机器学习的方法也被广泛用于感知信号以外的数据分析问题(如文本分析、商业数据分析、基因表达数据分析等),形成了数据挖掘领域。 模式分类是模式识别的主要任务和核心研究内容。分类器设计是在训练样本集合上进行优化(如使每一类样本的表达误差最小或使不同类别样本的分类误差最小)的过程,也就是一个机器学习过程。由于模式识别的对象是存在于感知信号中的物体和现象,它研究的内容还包括信号/图像/视频的处理、分割、形状和运动分析等,以及面向应用(如文字识别、语音识别、生物认证、医学图像分析、遥感图像分析等)的方法和系统研究。 本文简要回顾模式识别领域的发展历史和主要方法的演变,介绍模式识别理论方法研究的最新进展并分析未来的发展趋势。由于Jain等人的综述[3]已经全面介绍了2000年以前模式分类方面的进展,本文侧重于2000年以后的研究进展。

人工智能与模式识别

人工智能与模式识别 摘要:信息技术的飞速发展使得人工智能的应用围变得越来越广,而模式识别作为其中的一个重要方面,一直是人工智能研究的重要方向。在介绍人工智能和模式识别的相关知识的同时,对人工智能在模式识别中的应用进行了一定的论述。模式识别是人类的一项基本智能,着20世纪40年代计算机的出现以及50年代人工智能的兴起,模式识别技术有了长足的发展。模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。它与人工智能、图像处理的研究有交叉关系。模式识别的发展潜力巨大。 关键词:模式识别;数字识别;人脸识别中图分类号; Abstract: The rapid development of information technology makes the application of artificial intelligence become more and more widely. Pattern recognition, as one of the important aspects, has always been an important direction of artificial intelligence research. In the introduction of artificial intelligence and pattern recognition related knowledge at the same time, artificial intelligence in pattern recognition applications were discussed.Pattern recognition is a basic human intelligence, the emergence of the 20th century, 40 years of computer and the rise of artificial intelligence in the 1950s, pattern recognition technology has made great progress. Pattern recognition and statistics, psychology,

模式识别与智能系统硕士点_研究生入学复试大纲pris_test

模式识别与智能系统硕士点 研究生入学复试大纲 复试笔试满分为150分,包括基本能力测试(45分)和专业基础知识测试(105分)两部分。采取闭卷考试,考试时间一般为2至3小时。 有关专业基础知识测试的说明 专业基础知识测试(105分)由21道题目组成,参加笔试同学可从中任意选择7道完成,每题15分。专业知识点包括以下七个方面: 一.图象处理(共3题) 考试知识点:数字图象直方图、基于直方图均衡化的图象增强、边缘检测算子、梯度大小/方向计算、频域滤波基础、频域滤波操作的基本步骤。 辅导材料:冈萨雷斯等,《数字图象处理》,第二版,电子工业出版社, 2003.3, ISBN 7-5053-8236-5。认真阅读该书的3.3, 4.2, 10.1。 二.信息安全(共2题) 考试知识点:信息熵的计算、信源编码。 辅导材料:《信息与编码理论基础》,万旺根,上海大学出版社。 三.人工智能(共2题) 考试知识点:人工智能的基本概念。 辅导材料:廉师友,人工智能技术导论(第二版)廉师友西安电子科技大学出版社, 2002.7, ISBN 7-5606-0811-6。认真阅读该书的第一章。 四.微型计算机原理(共5题) 考试知识点:80x86指令寻址模式及汇编指令的书写格式;不同进制数之间的转换;汇编程序的阅读;计数器模块8253及其编程;可编程中断控制器8259模块及其编程。 注:相关硬件模块控制字格式不需记忆。(提供)

辅导材料:微型计算机技术及应用(第3版),戴梅萼等,清华大学出版社,2003 五.多媒体信息处理(共4题) 考试知识点:1.多媒体基本概念 多媒体技术,多媒体系统的层次结构,多媒体系统的组成 2.多媒体数据压缩: 数据压缩算法概念及分类,统计编码,预测编码,变换编码,分形编码 静态图像压缩标准JPEG,运动图像压缩标准MPEG,音频压缩标准 3.音频信息处理 声音数字化,音频文件格式,声卡的组成与设计(含声卡的工作原理、硬件设计、软件结构、编程接口等) 4.视频信息处理 视频信号数字化,视频的文件格式,视频压缩卡的设计 辅导材料:多媒体技术基础及应用,钟玉琢等,北京:清华大学出版社,2006.2 六.生物特征识别(共2题) 考试知识点:生物信息学序列联配(双序列比对,多序列比对)。 辅导材料:David W. Mount,《生物信息学:序列与基因组分析(影印)》,Bioinformatics: Sequence and Genome Analysis, Cold Spring Harbor Lab(CSHL) Press。认真阅读sequence alignment 的相关内容。 七.射频识别(共3题) 考试知识点:电子标签的基本概念。 辅导材料:纪震,李慧慧等,《电子标签原理与应用》,西安电子科技大学出版社, 2005.12, ISBN 705606-1599-6。认真阅读该书的第一章。

模式识别研究进展

模式识别研究进展 摘要:自20 世纪60年代以来,模式识别的理论与方法研究及在工程中的实际应用取得了很大的进展。本文先简要回顾模式识别领域的发展历史和主要方法的演变,然后围绕模式分类这个模式识别的核心问题,就概率密度估计、特征选择和变换、分类器设计几个方面介绍近年来理论和方法研究的主要进展,最后简要分析将来的发展趋势。 1. 前言 模式识别(Pattern Recognition)是对感知信号(图像、视频、声音等)进行分析,对其中的物体对象或行为进行判别和解释的过程。模式识别能力普遍存在于人和动物的认知系统,人和动物获取外部环境知识,并与环境进行交互的重要基础。我们现在所说的模式识别一般是指用机器实现模式识别过程,是人工智能领域的一个重要分支。早期的模式识别研究是与人工智能和机器学习密不可分的,如Rosenblatt 的感知机和Nilsson 的学习机就与这三个领域密切相关。后来,由于人工智能更关心符号信息和知识的推理,而模式识别更关心感知信息的处理,二者逐渐分离形成了不同的研究领域。介于模式识别和人工智能之间的机器学习在20 世纪80 年代以前也偏重于符号学习,后来人工神经网络重新受到重视,统计学习逐渐成为主流,与模式识别中的学习问题渐趋重合,重新拉近了模式识别与人工智能的距离。模式识别与机器学习的方法也被广泛用于感知信号以外的数据分析问题(如文本分析、商业数据分析、基因表达数据分析等),形成了数据挖掘领域。模式分类是模式识别的主要任务和核心研究内容。分类器设计是在训练样本集合上进行优化(如使每一类样本的表达误差最小或使不同类别样本的分类误差最小)的过程,也就是一个机器学习过程。由于模式识 别的对象是存在于感知信号中的物体和现象,它研究的内容还包括信号/图像/ 视频的处理、 分割、形状和运动分析等,以及面向应用(如文字识别、语音识别、生物认证、医学图像分析、遥感图像分析等)的方法和系统研究。 本文简要回顾模式识别领域的发展历史和主要方法的演变,介绍模式识别理论方法研究的最新进展并分析未来的发展趋势。由于Jain 等人的综述[3] 已经全面介绍了2000 年以前模式分类方面的进展,本文侧重于2000 年以后的研究进展。 2. 历史回顾 现代模式识别是在20 世纪40 年代电子计算机发明以后逐渐发展起来的。在更早的

浅析人工智能中的图像识别技术

浅析人工智能中的图像识别技术 本文从网络收集而来,上传到平台为了帮到更多的人,如果您需要使用本文档,请点击下载按钮下载本文档(有偿下载),另外祝您生活愉快,工作顺利,万事如意! 图像识别技术是信息时代的一门重要的技术,其产生目的是为了让计算机代替人类去处理大量的物理信息。随着计算机技术的发展,人类对图像识别技术的认识越来越深刻。图像识别技术的过程分为信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。文章简单分析了图像识别技术的引入、其技术原理以及模式识别等,之后介绍了神经网络的图像识别技术和非线性降维的图像识别技术及图像识别技术的应用。从中可以总结出图像处理技术的应用广泛,人类的生活将无法离开图像识别技术,研究图像识别技术具有重大意义。 1 图像识别技术的引入 图像识别是人工智能科技的一个重要领域。图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。图像识别,顾名思义,就是对图像做出各种处理、分析,最终识别我们所要研究的

目标。今天所指的图像识别并不仅仅是用人类的肉眼,而是借助计算机技术进行识别。虽然人类的识别能力很强大,但是对于高速发展的社会,人类自身识别能力已经满足不了我们的需求,于是就产生了基于计算机的图像识别技术。这就像人类研究生物细胞,完全靠肉眼观察细胞是不现实的,这样自然就产生了显微镜等用于精确观测的仪器。通常一个领域有固有技术无法解决的需求时,就会产生相应的新技术。图像识别技术也是如此,此技术的产生就是为了让计算机代替人类去处理大量的物理信息,解决人类无法识别或者识别率特别低的信息。 图像识别技术原理 其实,图像识别技术背后的原理并不是很难,只是其要处理的信息比较繁琐。计算机的任何处理技术都不是凭空产生的,它都是学者们从生活实践中得到启发而利用程序将其模拟实现的。计算机的图像识别技术和人类的图像识别在原理上并没有本质的区别,只是机器缺少人类在感觉与视觉差上的影响罢了。人类的图像识别也不单单是凭借整个图像存储在脑海中的记忆来识别的,我们识别图像都是依靠图像所具有

模式识别与智能系统

模式识别与智能系统 Pattern Recognition & Intelligent System (专业代码:081104) 一、学科概况 本校模式识别与智能系统学科为国务院1993年批准的博士学位授予权学科,2001年经国务院学位委员会批准为国家级重点学科(二级学科);本学科所在的控制科学与工程学科具有一级学科博士学位授予权,同时拥有一级学科博士后流动站。本学科主要从事模式识别与智能系统的理论与应用研究,为本校“211工程”重点建设学科。经过多年的建设,现有博士生导师七名,百余名的博士生研究队伍,和先进的教学与科研硬设备环境。多年来,一批科研成果达到国际与国内先进水平。 二、培养目标 本学科培养的模式识别与智能系统的硕士研究生应具有较宽广的基础理论及较深入的专业知识,能解决国家经济建设与国防中在本领域内的工程技术的应用课题,具有较好的理论联系实际的能力。 三、学制和学分 全日制硕士研究生实行以两年半制为主的弹性学制,原则上不超过5年。 总学分33学分,其中必修课程不少于14学分。

四、硕士课程设置 五、科研能力与水平 1. 掌握本学科的基础理论和专业知识,对所研究的课题有新的见解,取得新的成果。对于学术型学位的硕士研究生,还应熟悉国内外相关的学术研究动态。 2. 工作认真踏实,能独立进行科研工作并圆满完成科研任务。 3. 对于应用型、复合型学位的硕士研究生,能发现实践中与本学科相关的需求,能提出工程解决方案;对于学术型学位的硕士研究生,能提出和界定科学问题。

4. 硕士研究生在校期间应积极发表学术论文,参与学术交流。 六、开题报告 为确保学位论文的质量,指导教师应针对每个硕士研究生的类型和层次,确定选题范围。硕士研究生在导师的指导下,通过阅读文献、收集资料和调查研究后确定研究课题,提交开题报告。开题报告的主要内容包括: (1)课题来源及研究的目的和意义; (2)国内外在该方向的研究现状及分析; (3)主要研究内容; (4)研究方案及进度安排,预期达到的目标; (5)预计研究过程中可能遇到的困难和问题以及解决的措施; (6)主要参考文献。 提交开题报告的时间一般为第四小学期,开题报告字数应在5000字以上。开题报告的评议结果为通过或不通过。硕士研究生学位论文选题、开题的要求详见《南京理工大学硕士学位论文选题、开题及撰写的有关规定 七、学位论文 学位论文工作是研究生培养的重要组成部分,是对研究生进行科学研究或承担专业技术工作的全面训练,是培养研究生创新能力、综合运用所学知识发现问题、分析问题和解决问题能力的重要环节。 硕士学位论文要求概念清楚、立论正确、分析严谨、计算正确、数据可靠、文句简练、图表清晰、层次分明,能体现硕士研究生具有宽广的理论基础,较强的独立工作能力和优良的学风。在阐明论文的目的、意义和成果时,应有实事求是的科学态度。 硕士研究生的论文工作必须在导师指导下,由研究生独立完成。完成后应按照《中华人民共和国学位条理暂行实施办法》和《南京理工大学博士、硕士学位授予细则》的规定,组织论文评审和答辩。获准参加答辩的前提条件是:必须修满规定的学分,外语通过学位英语考试或通过国家英语六级考试,其余学科基础课程成绩不得低于70分并完成教学实践、科研实习。

人工智能中的模式识别

人工智能与模式识别 摘要:模式识别(Pattern Recognition)是人类的一项基本智能,着20世纪40年代计算机的出现以及50年代人工智能的兴起,模式识别技术有了长足的发展。模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。它与人工智能、图像处理的研究有交叉关系。模式识别的发展潜力巨大。 关键词:人工智能模式识别模式识别的方法模式识别的应用模式识别的发展潜力 正文: 模式识别的定义是借助计算机,就人类对外部世界某一特定环境中的客体、过程和现象的识别功能(包括视觉、听觉、触觉、判断等)进行自动模拟的科学技术。随着20世纪40年代计算机的出现以及50年代人工智能的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。(计算机)模式识别在20世纪60年代初迅速发展并成为一门新学科。 模式识别(Pattern Recognition)是指对表征事物或现象的各种形式的(数 值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。模式识别又常称作模式分类,从处理问题的性质和解决问题的方法等角度,模式识别分为有监督的分类(Supervised Classification)和无监督的分类(Unsupervised Classification)两种。二者的主要差别在于,各实验样本所属的类别是否预先已知。一般说来,有监督的分类往往需要提供大量已知类别的样本,但在实际问题中,这是存在一定困难的,因此研究无监督的分类就变得十分有必要了。 此外,模式还可分成抽象的和具体的两种形式。前者如意识、思想、议论等,属于概念识别研究的范畴,是人工智能的另一研究分支。我们所指的模式识别主要是对语音波形、地震波、心电图、脑电图、图片、照片、文字、符号、生物传感器等对象的具体模式进行辨识和分类。 模式识别研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,属于认识科学的范畴,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。 模式识别与很多学科都有联系,它与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。它与人工智能、图像处理的研究有交叉关系。例如自适应或自组织的模式识别系统包含了人工智能的学习机制;人工智能研究的景物理解、自然语言理解也包含模式识别问题。又如模式识别中的预处理和特征抽取环节应用图像处理的技术;图像处理中的图像分析也应用模式识别的技术。 模式识别的方法主要有决策理论方法和句法方法,模式识别方法的选择取决于问题的性质。如果被识别的对象极为复杂,而且包含丰富的结构信息,一般采用句法方法;被识别对象不很复杂或不含明显的结构信息,一般采用决策理论方法。这两种方法不能截然分开,在句法方法中,基元本身就是用决策理论方法抽取的。在应用中,将这两种方法结合起来分别施加于不同的层次,常能收到较好的效果。 模式识别的应用非常广泛,比较典型的有:1 文字识别:在信息技术及计算机技术日益普及的今天,如何将文字方便、快速地输入到计算机中已成为影响人机接口效率的一个重要瓶颈,也关系到计算机能否真正在我过得到普及的应用。

人工智能的模式识别与机器视觉

人工智能的模式识别与机器视觉 模式识别 “模式”(Panern)一词的本意是括完整天缺的供模仿的标本或标识。模式识别就是识别出给定物体所模仿的标本或标识。计算机模式识别系统使一个计算机系统具有模拟人类通过感官接受外界信息、识别和理解周围环境的感知能力。 模式识别是一个不断发展的学科分支,它的理论基础和研究范围也在不断发展。在二维的文字、图形和图像的识别方而,已取得许多成果。三维景物和活动目标的识别和分析是目前研究的热点。语音的识别和合成技术也有很大的发展。基于人工神经网络的模式识别技术在手写字符的识别、汽车牌照的识别、指纹识别、语音识别等方面已经有许多成功的应用。模式识别技术是智能计算机和智能机器人研究的十分重要的基础 机器视觉 实验表明,人类接受外界信息的80%以上来自视觉,10%左右来自听觉,其余来自嗅觉、味觉及触觉。在机器视觉方面,只要给计算机系统装上电视摄像输入装置就可以“看见”周围的东西。但是,视觉是一种感知,机器视觉的感知过程包含一系列的处理过程,例如,一个可见的景物由传感器编码输入,表示成一个灰度数值矩阵;图像的灰度数值由图像检测器进行处理,检测器检测出图像的主要成分,如组成景物的线段、简单曲线和角度等;这些成分又校处理,以便根据景物的表面特征和形状特征来推断有关景物的特征信息;最终目标是利用某个适当的模型来表示该景物。 视觉感知问题的要点是形成一个精练的表示来取代极其庞大的未经加工的输入情息,把庞大的视觉输人信息转化为一种易于处理和有感知意义的描述。 机器视觉可分为低层视觉和高后视觉两个层次,低层视觉主要是对视觉团像执行预处理,例如,边缘检测、运动目标检测、纹理分析等,另外还有立体造型、曲面色彩等,其目的是使对象凸现出来,这时还谈不上对它的理解。高层视觉主要是理解对象,显然,实现高层视觉需要掌捏与对象相关的知识。 机器视觉的前沿研究课题包括:实时图像的并行处理,实时图像的压缩、传输与复原,三绍景物的建模识别,动态和时变视觉等。 人娄的钉能活动过程主要是一个获得知识并运用知识的过程,知识是智能的基础。为了使计算机具有钉能,能模拟人类的智能行为,就必须使它具有知识。把人类拥有的知识采用适当的模式表示出来以便存储到计算机中,这就是知识表示要解决的问题。知识表示是对知识的一种描述,或者说是一组约定,是一种计算机可以接受的用于描述知识的数据结构,对知识进行表木就是把知识表示咸便于计算机存储和利用的菜种数据结构。知识表示方法给出的知识表示形式称为知识表示程式,知识表示模式分为外部表示模式和内部表示模式两个层次。知识外部表示模式是与软件开发的工具、运行的软件平台无关的知识表示的形式化描述。知

模式识别发展及现状综述

模式识别发展及现状综述 xxx (xxxxxxxxxxxxxxxxxxx) 摘要 [摘要]:通过对模式识别的发展及现状进行调查研究,了解到模式识别的理论和方法在很多科学和技术领域中得到了广泛的应用,极大的推动了人工智能系统的发展,同时扩大了计算机应用的可能性。模式识别 的研究主要集中在研究生物体(包括人)是如何感知对象的,以及在给定的任务下,如何用计算机实现模式 识别的理论和方法。本文详细的阐述了模式识别系统的组成结构以及模式识别的现状并展望了未来的模式 识别的发展趋势。 [关键词]:模式识别;模式识别的应用 Abstract [Abstract]:through the investigation and Study on the present situation and development of pattern recognition, knowing that the theory and method of pattern recognition has been widely used in many fields of science and technology and greatly promoting the development of artificial intelligence systems as well as expanding the fields of computer applied to.The research of pattern recognition mainly concentrated on the research of the theory and method of pattern recognition which how the organisms(including humans)to perceive objects as well as,in a given task,how to realize the pattern recognition with computer.This paper expounds the present situation and system structure of the pattern recognition as well as prospects the development trend in the future of pattern recognition. [keyword]:pattern recognition;pattern recognition applications 1前言 模式识别诞生于20世纪20年代,随着40年代计算机的出现,50年代人工智能的兴起,模式识别在60年代初迅速发展成一门学科。什么是模式和模式识别呢?广义地说,存在于时间和空间中可观察的事物,如果可以区别它们是否相同或相似,都可以称之为模式;狭义地说,模式是通过对具体的个别事物进行观测所得到的具有时间和空间分布的信息;把模式所属的类别或同一类中模式的总体称为模式类(或简称为类)[1]。而“模式识别”则是在某些一定量度或观测基础上把待识模式划分到各自的模式类中去。 经过多年的研究和发展,模式识别技术已广泛被应用于人工智能、计算机工程、机器人学、神经生物学、医学、侦探学以及高能物理、考古学、地质勘探、宇航科学和武器技术等许多重要领域,如语音识别、语音翻译、人脸识别、指纹识别、生物认证技术等。模式识别的技术对国民经济建设和国防科技发展的重要性已得到了人们的认可和广泛重视。本文将就模式识别所涉及的基本问题、研究的领域及其当前进展现状进行详细的介绍,并对模式识别的发展趋势进行展望。 2模式识别 2.1模式识别系统 一个计算机模式识别系统基本上是由三个相互关联而又有明显区别的过程组成的,即数据生成、模式分析和模式分类。有两种基本的模式识别方法,即统计模式识别方法和结构

模式识别文献综述

模式识别基础概念文献综述 一.前言 模式识别诞生于20世纪20年代。随着20世纪40年代计算机的出现,20世纪50年代人工智能的兴起,模式识别在20世纪60年代迅速发展成为一门学科。在20世纪60年代以前,模式识别主要限于统计学领域的理论研究,计算机的出现增加了对模式识别实际应用的需求,也推动了模式识别理论的发展。经过几十年的研究,取得了丰硕的成果,已经形成了一个比较完善的理论体系,主要包括统计模式识别、结构模式识别、模糊模式识别、神经网络模式识别和多分类器融合等研究内容。 模式识别就是研究用计算机实现人类的模式识别能力的一门学科,目的是利用计算机将对象进行分类。这些对象与应用领域有关,它们可以是图像、信号,或者任何可测量且需要分类的对象,对象的专业术语就是模式(pattern)。按照广义的定义,存在于时间和空间中可观察的事物,如果可以区别它们是否相同或相似,都可以成为模式。 二.模式识别基本概念 <一>.模式识别系统 模式识别的本质是根据模式的特征表达和模式类的划分方法,利用计算机将模式判属特定的类。因此,模式识别需要解决五个问题:模式的数字化表达、模式特性的选择、特征表达方法的确定、模式类的表达和判决方法的确定。一般地,模式识别

系统由信息获取、预处理、特征提取和选择、分类判决等4部 分组成,如图1-1所示。 观察对象→→→→→→→→→类→类别号信息获取预处理特征提取和选择分类判决 图1-1模式识别系统的组成框图 <二>.线性分类器 对一个判别函数来说,应该被确定的是两个内容:其一为方程 的形式;其二为方程所带的系数。对于线性判别函数来说方程 的形式是线性的,方程的维数为特征向量的维数,方程组的数 量则决定于待判别对象的类数。对M类问题就应该有M个线 性判别函数;对两类问题如果采用“+”“-”判别,则判别函数 可以只有一个。既然方程组的数量、维数和形式已定,则对判 别函数的设计就是确定函数的各系数,也就是线性方程的各权 值。在计算机上确定各权值时采用的是“训练”或“学习”的 方法,这就是待识别的模式集中挑选一批有代表的样本,它们 经过人工判读成为已知类别的样本,把这批样本逐个输入到计 算机的“训练”程序(或算法)中去,通过一次一次的迭代最 后得到正确的线性判别函数,这样一个迭代的运算的过程成为 训练过程。由于样本的分类首先经过人工判读,因而这样的构 成分类器也称为有人监督或有教师的分类器。 <三>.特征选择和提取 <1>、特征选择 特征的获取是依赖于具体的问题和相关专业的知识的,无法进

图像校正与分割处理软件设计与实现模式识别与智能系统方案

图像校正及分割处理软件设计与实现《图像分析与模式识别》课程期末大作业报告 课程名称:图像分析与模式识别

目录 图像校正及分割处理软件设计与实现 (1) 1 软件需求 (1) 1.1 操作界面需求分析 (1) 1.2 图像几何校正需求分析 (1) 1.2 ISODATA聚类算法的图像分割需求分析 (2) 2 算法原理及流程图 (2) 2.1 Hough变换 (2) 2.1.1 Hough变换原理 (2) 2.1.2 图像几何校正流程 (3) 2.2 ISODATA算法原理 (3) 2.2.1 ISODATA算法原理步骤 (3) 2.2.1 ISODATA算法流程图 (5) 3 程序设计框图 (6) 4 实验结果及分析 (7) 4.1 图像几何 (7) 4.1.1 支票图像几何校正结果 (7) 4.1.1 支票图像几何校正结果分析 (8) 4.2 图像分割 (8) 4.2.1图像分割结果 (8) 4.2.1图像分割结果分析 (10) 附录: (11) 附录一:图像几何校正代码 (11) 附录一:ISODATA聚类算法图像分割代码 (11) 附录一:MATLAB的GUI操作界面代码 (17)

图像校正及分割处理软件设计与实现 摘要:设计一种图像几何校正及图像分割处理软件,实现对倾斜支票图像校正为水平,及对已给的图像进行分割。图像几何校正主要通过边缘检测、Hough 变换、求倾斜角、图像旋转等算法实现;图像分割采用ISODATA聚类算法实现。实验结果表明,实现了对倾斜支票图像几何校正和对图像的分割功能。 关键词:边沿检测;Hough变换、图像旋转、ISODATA算法;图像分割; 1 软件需求 需求分析是指对要解决的问题进行详细的分析,弄清楚问题的要求,包括整个系统所要实现的功能。 根据题目,设计需要编写带有操作界面的图像处理软件,功能包含图像几何校和基于ISODATA聚类算法的图像分割。开发工具使用MATLAB。根据MATLAB的特点及需要实现的软件功能,软件需求分析如下: 1.1 操作界面需求分析 软件实现的功能是图像处理,因此操作界面中需要一个按钮,用于选择待处理的图像,称为“图像选择”按钮;选择的原始图像需要在操作界面中显示,因此需要一个用于显示原始图像的坐标控件;由于软件需要实现多功能,需要一个下拉框实现功能的选择;一个开始功能处理的按钮,称为“开始处理”按钮;一个用于显示图像处理结果的坐标控件。最后需要一个退出操作界面的按钮,称为“退出”按钮。 1.2 图像几何校正需求分析 原始图像在拍照时出现了倾斜,需要将图像校正,消除倾斜。通过对图像的观察,图像是一支票,支票上存在表格。因此想法是通过检测支票表格边框线的倾斜角,就是整图像的倾斜程度,然后根据这个倾斜角旋转,便可得到校正的水平图像。要检测支票图像表格边框直线。需要对图像的边缘进行检测,图像的边缘检测方法很多,如:sobel算子边缘检测,prewitt算子边缘检测,roberts 算子边缘检测,log算子边缘检测,canny算子边缘检测等,由于原图的噪声并不是很严重,因此上面这些边缘检测办法都能胜任,这里使用log算子进行边缘检测,为了适应其它边缘检测方法,本设计需要尽量在改变边缘检测方法时尽可能少地修改代码。边缘检测后,采用Hough变换提取直线,然后在提取的直线上找两个点,计算出直线的倾斜角度。最后根据这个倾斜角度对图像进行旋转。

模式识别研究进展

模式识别研究进展 摘要:自20世纪60年代以来,模式识别的理论与方法研究及在工程中的实际应用取得了很大的进展。本文先简要回顾模式识别领域的发展历史和主要方法的演变,然后围绕模式分类这个模式识别的核心问题,就概率密度估计、特征选择和变换、分类器设计几个方面介绍近年来理论和方法研究的主要进展,最后简要分析将来的发展趋势。 1. 前言 模式识别(Pattern Recognition)是对感知信号(图像、视频、声音等)进行分析,对其中的物体对象或行为进行判别和解释的过程。模式识别能力普遍存在于人和动物的认知系统,人和动物获取外部环境知识,并与环境进行交互的重要基础。我们现在所说的模式识别一般是指用机器实现模式识别过程,是人工智能领域的一个重要分支。早期的模式识别研究是与人工智能和机器学习密不可分的,如Rosenblatt 的感知机和Nilsson的学习机就与这三个领域密切相关。后来,由于人工智能更关心符号信息和知识的推理,而模式识别更关心感知信息的处理,二者逐渐分离形成了不同的研究领域。介于模式识别和人工智能之间的机器学习在20 世纪80 年代以前也偏重于符号学习,后来人工神经网络重新受到重视,统计学习逐渐成为主流,与模式识别中的学习问题渐趋重合,重新拉近了模式识别与人工智能的距离。模式识别与机器学习的方法也被广泛用于感知信号以外的数据分析问题(如文本分析、商业数据分析、基因表达数据分析等),形成了数据挖掘领域。模式分类是模式识别的主要任务和核心研究内容。分类器设计是在训练样本集合上进行优化(如使每一类样本的表达误差最小或使不同类别样本的分类误差最小)的过程,也就是一个机器学习过程。由于模式识别的对象是存在于感知信号中的物体和现象,它研究的内容还包括信号/图像/ 视频的处理、分割、形状和运动分析等,以及面向应用(如文字识别、语音识别、生物认证、医学图像分析、遥感图像分析等)的方法和系统研究。 本文简要回顾模式识别领域的发展历史和主要方法的演变,介绍模式识别理论方法研究的最新进展并分析未来的发展趋势。由于Jain 等人的综述[3]已经全面介绍了2000 年以前模式分类方面的进展,本文侧重于2000 年以后的研究进展。 2. 历史回顾

相关主题