搜档网
当前位置:搜档网 › 基于MATLAB的图像区域特征检测

基于MATLAB的图像区域特征检测

基于MATLAB的图像区域特征检测
基于MATLAB的图像区域特征检测

图像中区域特征检测与提取技术研究

摘要:数字图像处理是利用计算机对图像信息进行各种变换处理的技术和方法。本文主要介绍了数字图像处理和图像中区域特征检测的原理,以及MATLAB在数字图像处理中的应用。本次设计主要研究了数字图像处理中图像分割中的阈值分割法和区域生长法,此次研究主要是以MATLAB软件为平台,采用了区域生长法编写设计代码程序,实现了数字图像的区域特征检测,包括提取了周长、面积和重心坐标,整个设计以区域生长基本算法编写。

关键词:图像分割;区域生长法;MATLAB;区域特征检测

Research on regional feature detection and extraction of

image

Abstract:Digital image processing is to use the computer for image information for a variety of transformation processing techniques and methods. This article mainly introduced the digital image processing and the principle of regional characteristics in image detection, And MATLAB application in digital image processing. The design of the main research of the digital image processing, image segmentation threshold segmentation and region growing method, This research mainly based on MATLAB software platform, The region growing method is used to write program design code, Realize the regional features of digital image detection, Including extracted the perimeter, area and coordinates of the center of gravity, The whole project is compiled with region growing algorithm basic method.

Key words:Image segmentation;Region growing method;MATLAB;regional feature detection.

目录

第一章绪论 (1)

1.1研究的目的和意义 (1)

1.2国内外研究现状和发展趋势 (1)

1.3主要研究内容 (3)

1.4采用的研究思路 (3)

1.5本章节安排 (4)

第二章 MATLAB与数字图像处理 (5)

2.1数字图像处理概述 (5)

2.1.1数字图像处理的目的 (5)

2,1,2 图像处理的研究内容 (5)

2.2MATLAB概述 (6)

第三章图像分割 (7)

3.1阈值分割原理 (8)

3.1.1直方图阈值分割 (9)

3.1.2 类间方差阈值分割 (10)

3.1.3 最大熵阈值分割 (10)

3.1.4 模糊阈值分割 (11)

3.2基于区域的分割 (12)

3.2.1 区域增长 (12)

3.3邻域平均法 (17)

3.4中值滤波法 (17)

第四章图像分析与描述 (19)

4.1图像目标的特征提取 (19)

4.1.1 幅度特征 (19)

4.1.2 统计特征 (19)

4.2基于区域的特征提取 (21)

4.2.1 区域面积 (21)

4.2.2 区域质心 (22)

4.2.3 区域方向 (23)

4.2.4 区域周长 (24)

第五章运用MATLAB实现图像中区域特征检测 (25)

5.1灰度处理 (25)

5.1.1 程序分析 (25)

5.1.2结果分析 (26)

5.2用区域生长法分割图像 (26)

5.2.1 程序分析 (26)

5.2.2 结果分析 (27)

5.3图像区域基本特征计算 (29)

5.3.1 程序分析 (29)

5.3.2 结果分析 (30)

第六章总结 (32)

附录 (33)

参考文献 (36)

致谢.................................................... 错误!未定义书签。

第一章绪论

1.1 研究的目的和意义

通过对图像中区域特征的检测与提取技术的研究,为匹配与识别打下了基础,从而可以研究各种图像,可以让人们更加准确的理解这个世界,尽管人眼鉴别事物的能力高,可以识别多种颜色,但是在很多情形下,图像对于人眼来说是不可见的,通过研究,可以使这些不可见的图像变得清晰明亮。

其次,通过研究,我们可以扩宽人们提取信息的范围,扩宽人们的眼界。人的眼睛目前只能看到电磁波谱中可见光的部分,人的眼睛对其余的各种波谱都是看不见的。但是我们通过数字图像处理技术就可以利用各种波段的信息进行数字成像,将看不见的信息变为看得见的信息图像[1]。

例如在生物学中:DNA显示分析;红血球和白血球分析技术、组织和虫卵切片的分析技术;染色体分析技术;内脏大小形状及异常检测技术;心血管数字减影以及其他减影技术;癌细胞识别技术;心脏活动的动态分析技术;微循环的分析判断技术等。在航天应用中:军事侦察、定位、导航、指挥;多光谱卫星图像分析;矿藏勘探;森林资源探查、分类、防火;水力资源探查,洪水泛滥监测;病虫害调查;天文、太空星体的探测及分析;交通、空中管理、铁路选线等。在工业上:CAD和CAM技术用于模具、零件制造、服装、印染业;零件、产品无损检测,焊缝及内部缺陷检查;印制电路板质量、缺陷的检出;生产过程的监控;邮件自动分检。在军事领域中:罪犯脸型合成;手迹、人像的识别等。研究可以为人类带来巨大的社会经济效益,可以预见,将会对自然科学甚至人类社会的发展具有深远的意义。

1.2 国内外研究现状和发展趋势

目前国内外主要有以下6个方面的应用:航天与航空技术方面、生物医学工程方面、通信工程方面、工业和工程方面、军事和公安方面、文化艺术方面及其他。

以后其将向着多媒体化、立体化、高分辨率、高速、标准化和智能化方向发

展;图像和图形的结合将从一维成像逐渐向多维成像的方向发展;在硬件芯片上的应用将更加广阔[2]。

图像中区域特征检测与图像分割息息相关,紧密联系,要研究区域,就首先要知道分割方法。分割是将图像分成许多统一、区域的过程。每个均匀区域都是整个场景的要素部分或对象。换句话说,图像的分割是定义相连且不相互重叠区域的集合,以便在图像段的每个像素获取表明区域的一个独特的、属于哪个区域的标记。在自动化图像分析中,分割是最重要的元素之一,主要是因为在这一步将从图像中提取感兴趣的对象或其他实体,用于随后的处理,如描述和识别。例如,航空图像包含海洋和陆地,最初,分割的问题是将图像分为两部分——路地段和水体(或海洋段)。其后,需要适当的分割图像中陆地部分对象,并进行相应的分类。

在提取每段之后,接下来的任务是提取重要的特征集,如文理、颜色和形状。这些是重要的可测量的和实体,给测量图像段提供了各种各样的特征,在场景中的各个区域都可以通过一系列的特征来描述。

因此研究区域就需要用到图像分割法,图像分割是图像处理中一类重要的研究,其基本操作是把图像分成一些有意义的、互不重叠的区域,分割结果的优劣直接影响到对图像后续处理的方法和质量,作为图像分析、理解的基础,图像分割在诸多领域具有广泛的应用,例如基于内容的图像检索、机器视觉、文字识别、指纹识别以及生物医学图像处理方面的病变检测和识别,军事图像处理方面的地形匹配与目标制导,工业图像处理方面的无损探伤和非接触式检测等。图像分割方法可以分为基于区域特征的方法、基于边界特征的方法和基于相关匹配的方法三大类。而本次研究是基于区域特征的方法。区域分割法目前是公认的图像处理难题,其困难在于图像内容的多样性以及噪声等的干扰,以后将慢慢克服这些弱点,向有效性、整体性、精确性,稳定性的方向发展;区域生长法目前主要的问题是表示区域的初始化种子的选择,在区域生长过程中,这些不同区域点合适属性的选择在相似性和区域面积上也遇到问题,因此都要经过后处理,未来区域生长法将减少分割图像中无法与任何邻接区域合并的小区域的数量。阈值法是一种传统的图像分割方法,因其实现简单、计算量小、性能较稳定而成为图像分割中最基本和应用最广泛的分割技术。在过去的40年里,图像阈值化这个看似简单

实际却不那么简单的问题,受到了世界各地学者的强烈关注,因此也产生了很多的方法来确定阈值,但是很遗憾,如同其他图像分割法一样,目前还没有一个现成的方法对缤纷复杂的图像处理得当。

1.3 主要研究内容

在图像中检测出不同的特征区域后需要使用一种更适合于计算机进一步处理的形式,对得到的区域像素集进行表示和描述。基本上,表示一个区域包括两种选择:用其外部特性来表示区域;用其内部特性来表示区域(如组成区域的像素)。显然,一般局部特征区域的外部特性不具有区分性,只能通过其内部特性来表示。

因此可采用区域生长法,选取一幅合适的图画,将具有相似性质的像素结合起来构成区域。从种子点开始,将每个种子点有相似性的相邻像素合并到这个区域。在这里每个种子像素点都以迭代方式生长,直到处理过图像中的每一个像素,这就形成了不同区域,整个过程为一个迭代的过程[3]。具体方法如下:

(1)首先确定一个像素点作为种子,然后按照相似性准则增长区域,逐步生成具有某种均匀性的空间区域

(2)确定在生长过程中能将相邻像素包括进来的准则

(3)制定让增长停止的条件或规则

阈值分割的实质是利用图像的灰度直方图信息获得用于分割的阈值。它是用一个或几个阈值将图像的灰度级分为几个部分,认为属于同一部分的像素是同一个物体。阈值分割算法主要有以下两个步骤:一是确定需要的分割阈值,二是将分割阈值与像素值进行比较以划分像素。在这两步中,确定阈值是分割的关键。因此查阅了很多资料,了解了阈值化算法及应用,区域生长法的概念及应用。

1.4 采用的研究思路

我采用的方法有阈值分割法、区域增长法。

(1)用阈值分割时,一般假设图像由具有单峰灰度分布的目标和背景组成,处于目标或背景内部相邻像素间的灰度值是高度相关的,但处于目标和背景交界处两边的灰度值上有很大的差别。此时图像的灰度直方图基本可以看做是由分别

对应目标和背景的两个单峰直方图混合构成的。进一步,如果这两个分布大小接近且均值相聚足够远,而且两部分的均方差也足够小,则直方图应为较明显的双峰。类似的,如果图像中有多个单峰灰度分布的目标,则直方图有可能表现为较明显的多峰,对这类图像用阈值分割可以取得较好效果[4]。

但是阈值分割法由于没有或很少考虑到空间关系,使得多阈值选择受到限制,基于区域的分割方法可以弥补这点不足,传统的区域分割方法有区域增长法。该类方法在没有先验知识可以利用时,对含有复杂场景或自然场景等先验知识不足的图像进行分割,也可以取得较好的性能。

(2)区域生长是把图像分割成特征相近的若干小区域,通过比较区域间的相似性,将足够相似并且相邻的区域作为同一区域合并;以此方式将特征相似的小区与不断合并,直到不能合并为止,最后形成不同的各区域。具体做法是:先在每一个感兴趣的区域找出1个像素作为种子,分别以这些种子作为区域生长的起始点,然后以事先规定好的生长准则,将其周围邻域中和种子像素具有相似性质的像素与种子像素合并在一起。然后以这些区域中的这些像素点作为又一个新的种子点继续重复进行上面的过程,直到找不到满足的条件为止。至此,区域生长完成。具体的是用MATLAB软件实现。

1.5 本章节安排

本文以MATLAB程序为基础,介绍数字图像中区域特征检测的原理,方法,结果,等内容。

本文第一章主要介绍数字图像处理技术的发展及本次课题研究的目的;

第二章主要介绍数字图像处理相关概念以及MATLAB概述;

第三章主要介绍图像分割原理及分类,和区域生长原理;

第四章主要介绍图像中目标检测的原理;

第五章主要分析区域生长法程序及结果;

第六章总结本次设计的结果。

第二章 MATLAB与数字图像处理

2.1 数字图像处理概述

2.1.1数字图像处理的目的

当图像被显示和采集时,通常需要改善,以便观察者更容易理解。特别是要突出感兴趣的目标,另外为了使一些日常繁琐的工作自动化,减少工作量,节省人力、物力和财力的开销,也需要进行图像处理。我们常常需要将所需图像从一个地方传送到另外的地方,但是图像处理不只在显示、传输等领域范围起作用,它还可以运用到另外的地方[5]。总的说来,图像处理的目的可以包括以下:

(1)显示和打印

有时为了合理,完整的显示一幅图像,我们需要调整图像的大小、色调等,这时可能用到图像缩放、旋转、调节亮度和改变颜色等。

(2)存储和传输

为了节省存储容量和快速传输图像,很多情况下需要将图像进行压缩处理,这时就需要用到图像编码的相关算法。例如图像存储到数码相机,将太空图像传送到地球等。

(3)增强与恢复

为了突出感兴趣目标的信息,我们需要在图像上进行增强与恢复等处理,例如从老的发黄的照片中去除痕迹,在X照片中提高肿瘤的可视性等,这时就需要对相关图像进行增强和恢复等基本处理。

2,1,2 图像处理的研究内容

数字图像处理的研究内容主要有以下:

(1)压缩编码

图像压缩编码技术是为了减少计算机需要占用的存储器的容量和节省图像处理、传输的时间长度。压缩可以在不失真的前提下获得,也可以在允许的失真条件下进行。

(2)图像变换

由于图像阵列很大,如果直接在空间与中进行处理,涉及到的计算量很大,因此,采用各种方法,如傅里叶变换、离散余弦变换、K-L变换和小波变换等间接处理技术,将空间域的图像处理转换成变换域图像处理,这样不仅可以降低我们的计算量值,而且可以处理的更快更好更有效。

(3)图像分割

数字图像处理中的最核心技术之一是图像分割技术。它提取出图像中有意义感兴趣的的特征,例如图像中的区域、边缘等等,为进行图像分析、识别和理解提供进一步的研究条件。

(4)图像分析和理解

图像分析和理解是图像处理技术的发展和深入,也是人工智能和模式识别的一个分支。在图像分析和理解中主要有图像的描述和图像的分类识别。图像分类识别属于模式识别的范畴,其主要内容是图像经过某些预处理后,进行图像分割和特征提取,从而进行分类判决[6]。

2.2 MATLAB概述

MATLAB语言是一款很好用的计算机软件,由Math Work公司开发,是一种应用于数学计算及计算结果可视化处理的软件。它把数值计算、矩阵计算、函数图形形成与处理、控制系统仿真等诸多强大的功能集成在一个便于用户使用的交互式环境之中,为公式推导、科研设计提供了易学、易用、高效的工具。经过逐步发展和完善,现在已经被国际公认了它是优秀的数学应用软件之一,MATLAB 既是一种直观、高效的计算机语言,同时又是一个科学计算平台。而且MATLAB 语法结构简单, 并且有极强的数值计算、图形文处理、数据分析、图形绘制及图像处理等功能,。MATLAB软件含有丰富的函数库,对于JPG格式的图像,MATLAB 软件都可以用一个函数来显示,为研究提供了很大的方便[7]。

第三章 图像分割

图像分割是图像中一类重要研究内容,其基本操作是把图像分割成一些有意义的、互不重叠的区域,分割结果的优劣直接影响到对图像后续处理的方法和质量。

广义上讲,图像分割是把图像分成互不重叠重叠而又各具特性的子区域。设集合I 代表图像的整个区域,子集k R I ∈就是决定图像分割的问题,把所有的子

集并集后就是全部图像。k R 是组成一幅图像分割的子集,它需要满足下面几个

条件:

(1)1K

k k I R ==?; (2)k j R R ?=?,对k j ≠;

(3)在某种标准下,每个子集k R 的内部像素相似,而不同子集间的像素差

异明显;

(4)每一个k R 必须是连续贯通的。

狭义上讲,图像分割是为了得到感兴趣区域和它的边界,而不是组成整幅图像的所有区域。我们在观察任何一幅图像的时候,先找出感兴趣区域再找出图像中所有区域是不可行的,是违反常理的;一般来说,我们都是先大概确定自己感兴趣的区域,然后找出该区域的边界,这才符合人类的标准[8]。

一般来说,图像分割法经常利用所选图像的背景与目标区域之间的差异以及目标区域内部的相似性来实现。因此,找出一定的特征是分割的关键,在找出的这个特征条件下,目标区域内部是相似的,或者在这个特征下,背景和目标有相当大的不同。依据所选的这个特征,图像分割方法可以分为以下三大类:基于相关匹配的方法、基于区域特征的方法以及基于边界特征的方法。其中基于区域特征的方法所靠的是颜色、纹理、灰度等一些局部的图像特征,在这些特征下背景和目标区域的内部则有一定程度的相似,本设计则就是采用的此类方法,以下将介绍这类方法包括的具体方法。

3.1 阈值分割原理

阈值法是图像分割方法的一种,是一种传统的方法,由于图像中背景与要提取的目标在灰度上有一定的差异,因此,该方法则是将图像看作是不同灰度级的两类区域的组合,我们需要选择并确定一个合适的阈值,来确定每一个像素点应该是在背景区域还是在目标区域[9]。

假设原始图像f(x,y),根据一定的相似性准则在图像f(x,y)中确定一个合适的灰度值,让其作为阈值t,按上述方法分割后的图像g(x,y)可以由下面的式子表示

1(,)(,){0(,)f x y t g x y f x y t ≥=< (3-1)

或者

1(,)(,){0(,)f x y t g x y f x y t ≤=> (3-2)

也能为阈值设定一个灰度变化范围[1t ,2t ],只要在这个灰度变化范围内的

像素都设置成1,不在这个范围内的像素都设置成0,即

121(,) (,){0t f x y t g x y ≤≤=其他

(3-3) 有时也有这种情况,首先设置阈值t ,只要是在灰度高于t 的像素都保持在原来的灰度,而其他像素灰度都成为0,通常叫这种方法为半阈值法,经分割后的E 图像可表示为

(,)

(,) (,){0f x y f x y t g x y ≥=其他 (3-4)

阈值分割图像的原理,可用下式作一般表达式

(,) (,){E

B Z f x y Z g x y Z ∈=其他 (3-5)

其中Z 为阈值,是图像f(x,y)灰度值范围内的任何一个灰度级集合,Z E 和Z B 为任意选定的背景和目标灰度级。

由此可见,要从复杂背景中识别出目标并且将它的形状完美的抽取出来,阈

值分割技术的关键是确定阈值。如果阈值确定的阈值太小,许多目标点将被误认为是目标;相反,如果阈值确定的阈值太大,那么许多目标点将会被误认为是背景[10]。

图像阈值化这个看似简单的问题,在过去的40年里受到国内外学者的广泛关注,产生了数以百计的阈值选取方法,但是遗憾的是,如同其他图像分割算法一样,没有一个现有方法对各种各样的图像都能得到令人满意的结果,甚至也没有一个理论指导我们选择特定方法处理特定图像。

3.1.1直方图阈值分割

(1)直方图的分割

图像灰度范围为0,1,…,l -1,假设灰度i 像素为n i ,那么一副图像的总的像素N 为

1

0 l i i N n -==∑ (3-6)

灰度级i 出现的概率定义为

i i n p N

= (3-7) 在1960年,Prewitt 提出的直方图双峰的方法,即如果灰度级直方图是明显的双峰形态,阈值则在灰度级与相应的阈值的底部的两个峰之间进行选择。

理论上,底部的直方图是理想的分割阈值,然而在实践中,图像受噪声等的影响使直方图上两个峰之间的底部被填充,或者两峰相距非常近,这时要检测谷底就非常难了。因此有人提出阈值选取可以用变化直方图来进行,在前面所描述的直方图阈值分割方法中由于原来的直方图是离散的,而且含噪声,没有考虑利用像素邻域性质。而变化直方图,就是将原来的直方图变换其局部性质变成新的直方图。原始直方图与新的直方图相比较,可能两峰之间有更深的谷底,可能峰和谷互相转变,这就更容易检测。最简单的变化直方图就是根据梯度值加权,梯度值小的像素权加大,梯度值大的像素权减小。这样,就可以使用直方图的双峰更加突起,谷底更加凹陷[11]。

(2)最佳阈值

最佳阈值法是图像中目标对象和背景的分割误差最小的阈值选取方法。这种

方法是从模式识别的贝叶斯最小误差分类方法得出。

假设一幅图像只由目标对象和背景组成,P 1(Z )和P 2(Z )分别称为灰度级分布概率密度,并且已知目标对象的像素占整体图像像素数的比为θ,所以整体图像总的灰度级概率密度分布P(Z)可使用下面的式子来表示

P(Z)= θP 1(Z)+(1-θ)P 2(Z) (3-8)

假定选用Z t 作为灰度级阈值,认为这里图像是暗物体在亮背景下组成,所以每一个像素的灰度值只要小于Z t 则认为是目标物体,反之,则被认为是背景

[12]。

3.1.2 类间方差阈值分割

在判决分析最小二乘法原理的基础上,推导得出Otsu 与20世纪70年代提出的最大类间方差法,是的,该算法以其计算简单、稳定有效,一直广为使用。

设原来的灰度图像的灰度值为L ,灰度级i 的像素点数为n i ,那么整体图像的像素数为

N=n 0+n 1+…+n 1-L (3-9)

直方图归一化,则

10

,1L i i i i n p p N -===∑ (3-10) 用阈值t 可以划分为两类:0C =(0,1,2,…,t ),1C =(t+1,t+2,…,L-1)

3.1.3 最大熵阈值分割

1980年以来,许多学者将香农信息熵的概念应用到图像的阈值,其基本思想是基于图像的灰度分布密度函数定义的图像的信息熵,根据不同的观点提出了熵的假设标准,最后通过优化得到阈值[13]。

(1)一维最大熵阈值分割

信息论科目中,将熵定义为

()lg ()H p x p x dx +∞-∞=-?

(3-11)

其中p(x)是随机变量x 的概率密度函数。对于数字图像,该随机变量x 可以是灰度值、梯度、区域灰度等。所谓灰度的一维熵要最大,就是选取一个阈值,使图像用这个阈值分割出的两部分的一阶灰度统计的信息量达到最大。

(2) 二维最大熵阈值分割

由图像原来的直方图得到的灰度一维最大熵,只用了点灰度信息而没有将图像的空间信息充分利用,分割效果会随着信噪比的降低而导致分割效果不理想。在图像的特征中,最基本的特征是点灰度,它敏感噪声,区域灰度特征与点灰度相比,对噪声不那么敏感。要想图像的信息被较好地表征,那么就要综合利用点灰度特征,因此可采用利用区域灰度均值和图像点灰度的二维的最大熵阈值法

[14],具体实施方法如下:

首先用原来的灰度图(L 个灰度级)中各像素和4邻域的4个像素作为一个区域,那么区域灰度均值图像被算出,原来的图像里的每一个像素都与一个区域灰度数据对相对应,这些数据对取值有L ×L 种可能。假设i 为图像中点灰度,j 为区域灰度均值,n j i ,为像素点数,点灰度-区域灰度均值对(i,j )发生的概率为p j i ,,则有

,,i j

i j n p N N =? (3-12)

其中N ×N 为图像大小。则该图关于点灰度-区域灰度均值的二维直方图为{ p j i ,,i,j=1,2,…,L}。

3.1.4 模糊阈值分割

近年来,一些学者将模糊数字的方法引入到图像处理中,在一些场合取得了比传统方法更好的效果。

描述人类视觉的随机性和模糊性较好的是模糊集理论,因此在图像阈值化领域倍受关注。其基本思想是,选取一种S 状的隶属度函数(其中阈值是一个未知的参数)定义模糊集,然后定义某种准则函数在这个模糊集上,确定最佳阈值需要通过优化准则函数。换句话说,首先将一幅图像看成是一个模糊阵列,然后确定阈值,通过计算图像的模糊熵或模糊率。

3.2 基于区域的分割

3.2.1 区域增长

区域增长有时也称区域生长。该算法的基本思想是将具有相似性质的像素集合起来构成区域。具体先对每个需要分割的区域找1个种子像素作为生长的起点,然后将种子像素周围邻域中与种子像素有相同或相似性质的像素(根据某种事先确定的生长或相似准则来判定)合并到种子像素所在的区域中。将这些新像素当做新的种子像素继续进行上面的过程,直到所有满足条件的像素都被包括进来,这样区域生长就完成了[15]。

图1是区域增长法的一个事例,图1(a )给出种子生长点,假设图像中有两个种子像素(通过不同颜色标记),需要对其进行生长。生长准则是如果所考虑的像素灰度值与像素种子之差的绝对值不大于某个阈值T ,那么种子像素所在的区域就包括该像素。图1(b )给出的区域增长结果是T=3时的,整幅图像能被较好的分割成2个区域;图1(c )给出的区域增长结果是T=1时的,其中无法判定某些像素,图1(d )给出的区域增长的结果是T=8时,整幅图像都被分在1个区域中。从这些例子中可以发现,阈值的选取是很重要的。

(c) (d)

图1 区域增长示例

从上的实例可以看出,在实际应用中区域增长法需要解决三个基本问题:

(1)选择或确定1个组能正确代表所需区域的种子像素;

(2)包括进来的相邻像素准则在生长过程中必须被确定;

(3)让区域增长终止的规则或条件必须被制定。

通常我们可以借助具体的问题的特点来选取种子像素,例如在检测红外图像时,因为在正常情况下目标的辐射很大,因此对种子点的选取可以选用图中最亮的像素。如果不知道具体问题,那么经常可以通过区域生长准则计算每个像素。如果计算结果聚类,则可将种子像素设置在接近聚类重心的位置。

具体问题本身不是绝对的决定生长准则的选取,也与所用图像数据的种类密切相关。例如只用单色的准则来生长彩色的图像,那么就会影响到效果。除此之外,还需要考虑到像素之间的邻近性和连通性,否则分割结果则会无意义。区域增长的一个关键是选择适合的生长或相似准则,使用图像的局部性质是大部分区域增长的准则。可以根据不同的原则制定生长准则,区域生长的过程将依赖于不同的生长准则[16]。下面主要介绍三种常用的生长准则方法。

1、区域灰度差

区域增长方法操作图像是以像素为基本单位,主要步骤如下:

(1)对所研究的图像进行逐行检查,找出还没有找到位置的像素;

(2)以这个像素为中心,将邻域中的像素挨个和它作对比,如果预先确定的阈值大于灰度差,则将它们合并在一起;

(3)以合并的像素为中心点,返回到上述步骤,直到区域不能扩张;

(4)返回到步骤(1),继续检查直到所有像素都有归属,即整个生长过程结束。

采用上面的方法得到的结果,很大程度的依赖于起始点的选择,为了解决这个问题,可以采用改进的方法:

(1)将灰度差的阈值设为0,用上述方法扩张区域,合并灰度相同的像素;

(2)合并具有最小灰度的邻域区域并求出所有邻域区域之间的平均灰度差;

(3)确定终止准则,重复复进行上述中的操作不停的依次合并区域,直到满足终止准则为止。

上面的方法是针对单连续区域增长。这种方法简单,但由于仅考虑了从一个像素到另一像素的特征是否相相似,因此对于有噪声的或复杂的图像,使用这种

方法会引起不希望的区域出现。另外,如果区域间边缘的灰度变化有平缓,或者对比度弱的两个相交区域,采用这种方法,区域将会合并起来,从而产生错误。

为了克服这个问题,可不用新像素的灰度值去和邻域像素的灰度值比较,从而新像素所在区域的平均灰度值去和各邻域像素的灰度值进行比较。

对于一个含N 个像素的图像区域R ,其均值为

(,)1

(,)x y R m f x y N ∈=∑ (3-13)

对像素的比较测试可表示为

(,)max |(,)|x y R f x y m T ∈-< (3-14)

其中T 为给定阈值。有以下两种情况:

(1)设区域R 为均匀的,各像素灰度值为均值m 与一个零均值高斯噪声的叠加,当用上式测试某个像素时,条件不成立的概率为

22()exp()2T z p T dz σ

=- (3-15) 这就是误差函数,当T 取3倍方差时,对某一像素的误判概率为0.3%,正确判定概率为99.7%。如果该区域共有N 个像素,则总体的正确判定概率为(99.7%)N ,误判概率为1-(99.7%)N ,这表明,当考虑灰度均值时,区域内的灰度变化应尽量小。

(2)设区域为非均匀的,且由两部分像素构成。这两部分像素在R 中所占的比例分别为q 1和q 2,灰度值分别为m 1和m 2,则区域均值为q 1m 1+ q 2m 2。对灰度值为m 1的像素,它与区域均值的差为

S m = m 1-(q 1m 1+ q 2m 2) (3-16)

根据式可知,正确判决的概率为

P (T )=2

1[P (|T- S m |)+P (|T+ S m =|)] (3-17) 这表明,当考虑灰度均值时,不同部分像素间的灰度差应尽量大。

如图2(a)中只有一个像素点灰度值为9 ,因此此点为起点开始区域增长,该点称为种子点和种子点集。第一次区域增长得到3个灰度值为8的邻点,灰度级差值为1,如图2(b)所示。此时这4个已接受点的平均灰度为(8+8+8+9)/4=8.25。由于阈值T取2,第二次区域增长灰度值为7的邻点被接受,如图2(c)所示,此时这5个已接受点的平均灰度级为(8+8+8+9+7)/5=8。在该区域的周围以无灰度值大于6的邻点,即均匀测度为假,停止区域增长。图2(d)和图2(c)是以灰度值7为起点的区域增长结果。

(a) (b) (c)

(d) (e)

图2 区域增长示例

2.区域内灰度统计特性

正如前面所说,如果把式的均匀性准则用在将一个区域当作为非均匀区域方面可能会导致错误,如常常会出现有大量的小区域似乎的图像中并没有任何真实的对应物。利用区域的相似统计特性来寻找具有均匀性的区域可避免出现这种问题,这种方法是通过将一个区域上的统计特征与该区域的各部分上所计算出的统计特性进行比较来判定区域的均匀性。如果它们相互很接近,则这个区域可能是均匀的。这种方法对于纹理分割而言很有用[17]。具体有以下几种步骤:(1)把图像分为互相分离的小区域;

(2)将相邻区域的累积灰度直方图进行比较,按照灰度分布的相似性合并

区域;

(3) 确定合并区域终止的准则,然后不停的重复(2)步骤的操作,直到

满足终止准则为止。

常有两种方法对灰度分布的相似性进行检测(设h 1(z )、h 2(z )分别为相邻区域的累计灰度直方图):

Kolmogorov-Smirnov 检测(K-S 检测)

12max |()()|z

h z h z - (3-18) Smoothed-Difference 检测(S-D 检测)

12

|()()|z

h z h z -∑ (3-19) 如果检测结果小于某个给定的阈值,则将两区域合并。因为小区域的尺寸大小可能对结果产生较大的影响,如果尺寸太小,那么就降低了检测的可靠性,如果尺寸太大,那得到的区域形状就不是理想结果,小的目标也有可能漏掉。

因为比较全面的考虑了所有灰度值,所以K-S 检测和S-D 检测方法很适用于在检测直方图相似性方面。

3.区域形状

在合并区域时,也可以利用对目标形状的检测结果,惯用的方式有以下两种。

(1)把图像按照固定灰度分割成区域,设P 1和P 2为两个相邻区域的周长,L 为两区域共同的边界线两侧灰度差小于给定阈值的那部分长度,如果(T 1为阈值)

112min{,}

L T P P > (3-20) 则将两区域合并。

(2)把图像按照固定灰度分割成区域,设B 为两相邻区域的公同边界长度,L 为两区域共同边界线两侧灰度差小于给定阈值的那部分长度,如果(T 2为阈值)

2L T B

> (3-21) 则将两区域合并。

基于matlab的图像识别与匹配

基于matlab的图像识别与匹配 摘要 图像的识别与匹配是立体视觉的一个重要分支,该项技术被广泛应用在航空测绘,星球探测机器人导航以及三维重建等领域。 本文意在熟练运用图像的识别与匹配的方法,为此本文使用一个包装袋并对上面的数字进行识别与匹配。首先在包装袋上提取出来要用的数字,然后提取出该数字与包装袋上的特征点,用SIFT方法对两幅图进行识别与匹配,最终得到对应匹配数字的匹配点。仿真结果表明,该方法能够把给定数字与包装袋上的相同数字进行识别与匹配,得到了良好的实验结果,基本完成了识别与匹配的任务。

1 研究内容 图像识别中的模式识别是一种从大量信息和数据出发,利用计算机和数学推理的方法对形状、模式、曲线、数字、字符格式和图形自动完成识别、评价的过程。 图形辨别是图像识别技术的一个重要分支,图形辨别指通过对图形的图像采用特定算法,从而辨别图形或者数字,通过特征点检测,精确定位特征点,通过将模板与图形或数字匹配,根据匹配结果进行辨别。 2 研究意义 数字图像处理在各个领域都有着非常重要的应用,随着数字时代的到来,视频领域的数字化也必将到来,视频图像处理技术也将会发生日新月异的变化。在多媒体技术的各个领域中,视频处理技术占有非常重要的地位,被广泛的使用于农业,智能交通,汽车电子,网络多媒体通信,实时监控系统等诸多方面。因此,现今对技术领域的研究已日趋活跃和繁荣。而图像识别也同样有着更重要的作用。 3 设计原理 3.1 算法选择 Harris 角点检测器对于图像尺度变化非常敏感,这在很大程度上限制了它的应用范围。对于仅存在平移、旋转以及很小尺度变换的图像,基于Harris 特征点的方法都可以得到准确的配准结果,但是对于存在大尺度变换的图像,这一类方法将无法保证正确的配准和拼接。后来,研究人员相继提出了具有尺度不变性的特征点检测方法,具有仿射不变性的特征点检测方法,局部不变性的特征检测方法等大量的基于不变量技术的特征检测方法。 David.Lowe 于2004年在上述算法的基础上,总结了现有的基于不变量技术的特征检测方法,正式提出了一种基于尺度空间的,对图像平移、旋转、缩放、甚至仿射变换保持不变性的图像局部特征,以及基于该特征的描述符。并将这种方法命名为尺度不变特征变换(Scale Invariant Feature Transform),以下简称SIFT 算法。SIFT 算法首先在尺度空间进行特征检测,并确定特征点的位置和特征点所处的尺度,然后使用特征点邻域梯度的主方向作为该特征点的方向特征,以实现算子对尺度和方向的无关性。利用SIFT 算法从图像中提取出的特征可用于同一个物体或场景的可靠匹配,对图像尺度和旋转具有不变性,对光照变化、

基于MATLAB的图像处理字母识别

数字图像处理 报告名称:字母识别 学院:信息工程与自动化学院专业:物联网工程 学号:201310410149 学生姓名:廖成武 指导教师:王剑 日期:2015年12月28日 教务处制

目录 字母识别 1.---------------------测试图像预处理及连通区域提取 2.---------------------样本库的建立采集feature 3.---------------------选择算法输入测试图像进行测试 4.---------------------总结

字母识别 1.imgPreProcess(联通区域提取)目录下 conn.m:连通区域提取分割(在原图的基础上进行了膨胀、腐蚀、膨胀的操作使截取的图像更加接近字母) %%提取数字的边界,生成新的图 clear; clc; f=imread('5.jpg'); f=imadjust(f,[0 1],[1 0]); SE=strel('square',5); %%膨胀、腐蚀、膨胀 A2=imdilate(f,SE); SE=strel('disk',3) f=imerode(A2,SE) SE=strel('square',3); f=imdilate(f,SE); gray_level=graythresh(f); f=im2bw(f,gray_level); [l,n]=bwlabel(f,8) %%8连接的连接分量标注 imshow(f) hold on for k=1:n %%分割字符子句 [r,c]=find(l==k); rbar=mean(r); cbar=mean(c); plot(cbar,rbar,'Marker','o','MarkerEdgeColor','g','MarkerFaceColor',' y','MarkerSize',10); % plot(cbar,rbar,'Marker','*','MarkerEdgecolor','w'); row=max(r)-min(r) col=max(c)-min(c) for i=1:row for j=1:col seg(i,j)=1; end

基于matlab的人脸识别算法(PCA)

3.基于matlab的人脸识别算法 3.1 问题描述 对于一幅图像可以看作一个由像素值组成的矩阵,也可以扩展开,看成一个矢量,如一幅 N*N 象素的图像可以视为长度为N2 的矢量,这样就认为这幅图像是位于N2 维空间中的一个点,这种图像的矢量表示就是原始的图像空间,但是这个空间仅是可以表示或者检测图像的许多个空间中的一个。不管子空间的具体形式如何,这种方法用于图像识别的基本思想都是一样的,首先选择一个合适的子空间,图像将被投影到这个子空间上,然后利用对图像的这种投影间的某种度量来确定图像间的相似度,最常见的就是各种距离度量。因此,本次试题采用PCA算法并利用GUI实现。 对同一个体进行多项观察时,必定涉及多个随机变量X1,X2,…,Xp,它们都是的相关性, 一时难以综合。这时就需要借助主成分分析来概括诸多信息的主要方面。我们希望有一个或几个较好的综合指标来概括信息,而且希望综合指标互相独立地各代表某一方面的性质。 任何一个度量指标的好坏除了可靠、真实之外,还必须能充分反映个体间的变异。如果有一项指标,不同个体的取值都大同小异,那么该指标不能用来区分不同的个体。由这一点来看,一项指标在个体间的变异越大越好。因此我们把“变异大”作为“好”的标准来寻求综合指标。3.1.1 主成分的一般定义 设有随机变量X1,X2,…,Xp,其样本均数记为,,…,,样本标准差记为S1,S2,…,Sp。首先作标准化变换,我们有如下的定义: (1) 若C1=a11x1+a12x2+ … +a1pxp,…,且使 Var(C1)最大,则称C1为第一主成分; (2) 若C2=a21x1+a22x2+…+a2pxp,…,(a21,a22,…,a2p)垂直于(a11,a12,…,a1p),且使Var(C2)最大,则称C2为第二主成分; (3) 类似地,可有第三、四、五…主成分,至多有p个。 3.1.2 主成分的性质 主成分C1,C2,…,Cp具有如下几个性质: (1) 主成分间互不相关,即对任意i和j,Ci 和Cj的相关系数 Corr(Ci,Cj)=0 i j (2) 组合系数(ai1,ai2,…,aip)构成的向量为单位向量, (3) 各主成分的方差是依次递减的,即 Var(C1)≥Var(C2)≥…≥Var(Cp)

基于MATLAB的人脸识别

基于MATLAB的人脸识别

————————————————————————————————作者: ————————————————————————————————日期:

图像识别 题目:基于MATLAB的人脸识别 院系:计算机科学与应用系 班级: 姓名: 学号: 日期:

设计题目基于MATLAB的人脸识别设 计技术参数 测试数据库图片10张训练数据库图片20张图片大小1024×768 特征向量提取阈值 1 设计要求综合运用本课程的理论知识,并利用MATLAB作为工具实现对人脸图片的预处理,运用PCA算法进行人脸特征提取,进而进行人脸匹配识别。 工作量 两周的课程设计时间,完成一份课程设计报告书,包括设计的任务书、基本原理、设计思路与设计的基本思想、设计体会以及相关的程序代码; 熟练掌握Matlab的使用。 工作计划第1-2天按要求查阅相关资料文献,确定人脸识别的总体设计思路; 第3-4天分析设计题目,理解人脸识别的原理同时寻求相关的实现算法;第5-8天编写程序代码,创建图片数据库,运用PCA算法进行特征提取并编写特征脸,上机进行调试; 第9-12天编写人脸识别程序,实现总体功能; 第13-14天整理思路,书写课程设计报告书。 参考资料1 黄文梅,熊佳林,杨勇编著.信号分析与处理——MATALB语言及应用.国防科技大学出版社,2000 2 钱同惠编著.数字信号处理.北京:机械工业出版社,2004 3 姚天任,江太辉编著.数字信号处理.第2版.武汉:武汉理工大学出版社,2000 4 谢平,林洪彬,王娜.信号处理原理及应用.机械工业出版社,2004 5刘敏,魏玲.Matlab.通信仿真与应用.国防工业出版社,2005 6 楼顺天.基于Matlab7.x 的系统分析与设计.西安电子科技大学,2002 7孙洪.数字信号处理.电子工业出版社,2001 目录 引言?错误!未定义书签。 1 人脸识别技术?错误!未定义书签。 1.1人脸识别的研究内容?错误!未定义书签。 1.1.1人脸检测(Face Detection)........... 错误!未定义书签。

基于matlab数字图像处理与识别系统含程序

目录 第一章绪论 (2) 1.1 研究背景 (2) 1.2 人脸图像识别的应用前景 (3) 1.3 本文研究的问题 (4) 1.4 识别系统构成 (4) 1.5 论文的内容及组织 (5) 第二章图像处理的Matlab实现 (6) 2.1 Matlab简介 (6) 2.2 数字图像处理及过程 (6) 2.2.1图像处理的基本操作 (6) 2.2.2图像类型的转换 (7) 2.2.3图像增强 (7) 2.2.4边缘检测 (8) 2.3图像处理功能的Matlab实现实例 (8) 2.4 本章小结 (11) 第三章人脸图像识别计算机系统 (11) 3.1 引言 (11) 3.2系统基本机构 (12) 3.3 人脸检测定位算法 (13) 3.4 人脸图像的预处理 (18) 3.4.1 仿真系统中实现的人脸图像预处理方法 (19) 第四章基于直方图的人脸识别实现 (21) 4.1识别理论 (21) 4.2 人脸识别的matlab实现 (21) 4.3 本章小结 (22) 第五章总结 (22) 致谢 (23) 参考文献 (24) 附录 (25)

第一章绪论 本章提出了本文的研究背景及应用前景。首先阐述了人脸图像识别意义;然后介绍了人脸图像识别研究中存在的问题;接着介绍了自动人脸识别系统的一般框架构成;最后简要地介绍了本文的主要工作和章节结构。 1.1 研究背景 自70年代以来.随着人工智能技术的兴起.以及人类视觉研究的进展.人们逐渐对人脸图像的机器识别投入很大的热情,并形成了一个人脸图像识别研究领域,.这一领域除了它的重大理论价值外,也极具实用价值。 在进行人工智能的研究中,人们一直想做的事情就是让机器具有像人类一样的思考能力,以及识别事物、处理事物的能力,因此从解剖学、心理学、行为感知学等各个角度来探求人类的思维机制、以及感知事物、处理事物的机制,并努力将这些机制用于实践,如各种智能机器人的研制。人脸图像的机器识别研究就是在这种背景下兴起的,因为人们发现许多对于人类而言可以轻易做到的事情,而让机器来实现却很难,如人脸图像的识别,语音识别,自然语言理解等。如果能够开发出具有像人类一样的机器识别机制,就能够逐步地了解人类是如何存储信息,并进行处理的,从而最终了解人类的思维机制。 同时,进行人脸图像识别研究也具有很大的使用价依。如同人的指纹一样,人脸也具有唯一性,也可用来鉴别一个人的身份。现在己有实用的计算机自动指纹识别系统面世,并在安检等部门得到应用,但还没有通用成熟的人脸自动识别系统出现。人脸图像的自动识别系统较之指纹识别系统、DNA鉴定等更具方便性,因为它取样方便,可以不接触目标就进行识别,从而开发研究的实际意义更大。并且与指纹图像不同的是,人脸图像受很多因素的干扰:人脸表情的多样性;以及外在的成像过程中的光照,图像尺寸,旋转,姿势变化等。使得同一个人,

基于MATLAB数字图像处理杂草识别

基于MATLAB数字图像处理杂草识别

基于数字图像处理的杂草识别 班级:信息5班 组员:李辉李少杰李港深胡欣阳 学号:04141394 04141395 04141393 0414139 指导教师:蔡利梅 组员分工: 李辉:部分程序,查找资料 李少杰:实验报告,PPT,演讲 李港深:部分程序,实验报告 胡欣阳:部分程序,实验报告

摘要 杂草同农田作物争夺阳光和养分,严重影响了农作物的生长。为了达到除草的目的,人们开始喷洒大量的除草剂来进行除草。可是却忽略了除草剂的不当使用给人、畜以及环境造成的危害。本文从实际应用出发,设计了一个基于数字图像处理的杂草图像特征提取及识别设计方案。运行在参考了前人研究成果的基础上,不断将算法改进,找出适合于MATLAB杂草识别的可行性方法。本文对杂草图像的处理和识别方法进行研究。采集来的图像经常会有模糊现象的发生,对模糊图像的恢复处理做了大量的研究试验,得出维纳滤波具有较好的恢复效果;绿色植物和土壤背景的分割试验中,提出了一种基于彩色图像的二值化方法,可以不经过彩色图像灰度化就能够直接把绿色植物与土壤背景分割开,和以往的分割方法相比处理速度快,分割效果好,更加满足实时性;杂草和作物的分割主要研究了行间杂草和作物的分割,参考国内外资料,并进行研究试验,表明运用位置特征识别法有很好的分割效果,寻找作物中心行采用了简单快速的像素位置直方图法,采用了区域生长,和其他方法相比减少了重复操作,节省了时间,满足实时处理的要求;分割后的图像为只含有杂草的二值图像,通常会有一些残余的叶片和颗粒的噪声,通过形态学滤波或中值滤波去除噪声。 1、研究目的及意义 杂草是生态系统中的一员,农田杂草是农业生态系统中的

基于matlab的形状识别

1、设计目的 基于Maltab或者C语言对图像进行识别。编写摄像头采集图像程序,对采集的图像进行预处理,如图像增强、图像分割等处理,对于处理的图像进行特征提取,根据特征进行模式识别,如对三角形、正方形与圆形的识别。 2、设计正文 2.1设计分析 1)编写摄像头采集图像程序 2)对采集的图像进行预处理 3)对于处理的图像进行特征提取 4)进行模式识别,区分各种形状 2.2设计原理 2.2.1图像预处理 彩色图像包含着大量的颜色信息,不但在存储上开销很大,而且在处理上也会降低系统的执行速度,因此在对图像进行识别等处理中经常将彩色图像转变为灰度图像,以加快处理速度。由彩色转换为灰度的过程叫做灰度化处理。选择的标准是经过灰度变换彩色图像包含着大量的颜色信息,不但在存储上开销很大,而且在处理上也会降低系统的执行速度,因此在对图像进行识别

等处理中经常将彩色图像转变为灰度图像,以加快处理速度。由彩色转换为灰度的过程叫做灰度化处理。选择的标准是经过灰度变换。 2.2.2对于处理的图像进行特征值提取 二值图像是指整幅图像画面内仅黑、白二值的图像。在实际的车牌处理系统中,进行图像二值变换的关键是要确定合适的阀值,使得字符与背景能够分割开来,二值变换的结果图像必须要具备良好的保形性,不丢掉有用的形状信息,不会产生额外的空缺等等。车牌识别系统要求处理的速度高、成本低、信息量大,采用二值图像进行处理,能大大地提高处理效率。阈值处理的操作过程是先由用户指定或通过算法生成一个阈值,如果图像中某中像素的灰度值小于该阈值,则将该像素的灰度值设置为0或255,否则灰度值设置为255或0。 两个具有不同灰度值的相邻区域之间总存在边缘,边缘就是灰度值不连续的结果,是图像分割、纹理特征提取和形状特征提取等图像分析的基础。为了对有意义的边缘点进行分类,与这个点相联系的灰度级必须比在这一点的背景上变换更有效,我们通过门限方法来决定一个值是否有效。所以,如果一个点的二维一阶导数比指定的门限大,我们就定义图像中的次点是一个边缘点,一组这样的依据事先定好的连接准则相连的边缘点就定义为一条边缘。经过一阶的导数的边缘检测,所求的一阶导数高于某个阈

基于Matlab的车牌识别(完整版)

基于Matlab的车牌识别 摘要:车牌识别技术是智能交通系统的重要组成部分,在近年来得到了很大的发展。本文从预处理、边缘检测、车牌定位、字符分割、字符识别五个方面,具体介绍了车牌自动识别的原理。并用MATLAB软件编程来实现每一个部分,最后识别出汽车车牌。 一、设计原理 车辆车牌识别系统的基本工作原理为:将摄像头拍摄到的包含车辆车牌的图像通过视频卡输入到计算机中进行预处理,再由检索模块对车牌进行搜索、检测、定位,并分割出包含车牌字符的矩形区域,然后对车牌字符进行二值化并将其分割为单个字符,然后输入JPEG或BMP格式的数字,输出则为车牌号码的数字。车牌自动识别是一项利用车辆的动态视频或静态图像进行车牌号码、车牌颜色自动识别的模式识别技术。其硬件基础一般包括触发设备、摄像设备、照明设备、图像采集设备、识别车牌号码的处理机等,其软件核心包括车牌定位算法、车牌字符分割算法和光学字符识别算法等。某些车牌识别系统还具有通过视频图像判断车辆驶入视野的功能称之为视频车辆检测。一个完整的车牌识别系统应包括车辆检测、图像采集、车牌识别等几部分。当车辆检测部分检测到车辆到达时触发图像采集单元,采集当前的视频图像。车牌识别单元对图像进行处理,定位出车牌位置,再将车牌中的字符分割出来进行识别,然后组成车牌号码输出。 二、设计步骤 总体步骤为: 车辆→图像采集→图像预处理→车牌定位

→字符分割→字符定位→输出结果 基本的步骤: a.车牌定位,定位图片中的车牌位置; b.车牌字符分割,把车牌中的字符分割出来; c.车牌字符识别,把分割好的字符进行识别,最终组成车牌号码。 车牌识别过程中,车牌颜色的识别依据算法不同,可能在上述不同步骤实现,通常与车牌识别互相配合、互相验证。 (1)车牌定位: 自然环境下,汽车图像背景复杂、光照不均匀,如何在自然背景中准确地确定车牌区域是整个识别过程的关键。首先对采集到的视频图像进行大范围相关搜索,找到符合汽车车牌特征的若干区域作为候选区,然后对这些侯选区域做进一步分析、评判,最后选定一个最佳的区域作为车牌区域,并将其从图象中分割出来。 流程图: (2)车牌字符分割 : 完成车牌区域的定位后,再将车牌区域分割成单个字符,然后进行识别。字符分割一般采用垂直投影法。由于字符在垂直方向上的投影必然在字符间或字符内的间隙处取得局部最小值的附近,并且这个位置应满足车牌的字符书写格式、字符、尺寸限制和一些其他条件。利用垂直投影法对复杂环境下的汽车图像中的字符分割有较好的效果。 导入原始图像 图像预处理增强效果图像 边缘提取 车牌定位 对图像开闭运算

基于MATLAB的图片中文字的提取及识别

基于MATLAB的图片中文字的提取及识别 邹浩,余龙,邹勇博,刘宇童,和振乔,李少梅 (西安电子科技大学电子工程学院,西安,710126) 摘要 随着现代社会的发展,信息的形式和数量正在迅猛增长。其中很大一部分是图像,图像可以把事物生动地呈现在我们面前,让我们更直观地接受信息。同时,计算机已经作为一种人们普遍使用的工具为人们的生产生活服务。从图像中提取文字属于信息智能化处理的前沿课题,是当前人工智能与模式识别领域中的研究热点。由于文字具有高级语义特征,对图片内容的理解、索引、检索具有重要作用,因此,研究图片文字提取具有重要的实际意义。又由于静态图像文字提取是动态图像文字提取的基础,故着重介绍了静态图像文字提取技术。 关键词:MATLAB 图像处理文字提取文字识别 Text Extraction and Recognition in Images Based on MATLAB ZOU Hao, YU long, ZOU Yongbo, LIU Yutong, HE Zhenqiao, LI Shaomei (Xidian University Electronic Engineering College,Xi'an,710126) Abstract With the development of society,the form and quantity of imformation are increasing quickly.A large part of them are images,which can make things vividly presented in front of us,let us more intuitive to accept information.At the same time, the computer has been as a widely used tool for people's production and living services.Extracting text from image belongs to the frontier of intelligent information processing, and it is the current hot research topic in the field of artificial intelligence and pattern recognition.As the text with high-level semantic feature and plays an important role on understanding,indexing and retrieval image content.Therefore,the study on extracting texts from images have important actual meanings. And because extracting texts from still images is the basis for extracting texts from dynamic images, the article emphatically introduces the technology of extracting texts from still images. Key Words: MATLAB image processing word extraction word recognition

基于Matlab的图像边缘检测算法的实现及应用汇总

目录 摘要 (1) 引言 (2) 第一章绪论 (3) 1.1 课程设计选题的背景及意义 (3) 1.2 图像边缘检测的发展现状 (4) 第二章边缘检测的基本原理 (5) 2.1 基于一阶导数的边缘检测 (8) 2.2 基于二阶导的边缘检测 (9) 第三章边缘检测算子 (10) 3.1 Canny算子 (10) 3.2 Roberts梯度算子 (11) 3.3 Prewitt算子 (12) 3.4 Sobel算子 (13) 3.5 Log算子 (14) 第四章MATLAB简介 (15) 4.1 基本功能 (15) 4.2 应用领域 (16) 第五章编程和调试 (17) 5.1 edge函数 (17) 5.2 边缘检测的编程实现 (17) 第六章总结与体会 (20) 参考文献 (21)

摘要 边缘是图像最基本的特征,包含图像中用于识别的有用信息,边缘检测是数字图像处理中基础而又重要的内容。该课程设计具体考察了5种经典常用的边缘检测算子,并运用Matlab进行图像处理结果比较。梯度算子简单有效,LOG 算法和Canny 边缘检测器能产生较细的边缘。 边缘检测的目的是标识数字图像中灰度变化明显的点,而导函数正好能反映图像灰度变化的显著程度,因而许多方法利用导数来检测边缘。在分析其算法思想和流程的基础上,利用MATLAB对这5种算法进行了仿真实验,分析了各自的性能和算法特点,比较边缘检测效果并给出了各自的适用范围。 关键词:边缘检测;图像处理;MATLAB仿真

引言 边缘检测在图像处理系统中占有重要的作用,其效果直接影响着后续图像处理效果的好坏。许多数字图像处理直接或间接地依靠边缘检测算法的性能,并且在模式识别、机器人视觉、图像分割、特征提取、图像压缩等方面都把边缘检测作为最基本的工具。但实际图像中的边缘往往是各种类型的边缘以及它们模糊化后结果的组合,并且在实际图像中存在着不同程度的噪声,各种类型的图像边缘检测算法不断涌现。早在1965 年就有人提出边缘检测算子,边缘检测的传统方法包括Kirsch,Prewitt,Sobel,Roberts,Robins,Mar-Hildreth 边缘检测方法以及Laplacian-Gaussian(LOG)算子方法和Canny 最优算子方法等。 本设计主要讨论其中5种边缘检测算法。在图像处理的过程需要大量的计算工作,我们利用MATLAB各种丰富的工具箱以及其强大的计算功能可以更加方便有效的完成图像边缘的检测。并对这些方法进行比较

基于matlab的车牌识别系统的设计

基于matlab的车牌识别系统的设计1.摘要: 汽车牌照自动识别系统是制约道路交通智能化的重要因素,包括车牌定位、字符分割和字符识别三个主要部分。本文首先确定车辆牌照在原始图像中的水平位置和垂直位置,从而定位车辆牌照,然后采用局部投影进行字符分割。在字符识别部分,提出了在无特征提取情况下基于支持向量机的车牌字符识别方法。实验结果表明,本文提出的方法具有良好的识别性能。随着公路逐渐普及,我国的公路交通事业发展迅速,所以人工管理方式已经不能满着实际的需要,微电子、通信和计算机技术在交通领域的应用极大地提高了交通管理效率。汽车牌照的自动识别技术已经得到了广泛应用。 2.设计目的: 1、使学生在巩固理论课上知识的同时,加强实践能力的提高,理论联系实践。 2、激发学生的研究潜能,提高学生的协作精神,锻炼学生的动手能力。 3.设计原理 由于车辆牌照是机动车唯一的管理标识符号,在交通管理中具有不可替代的作用,因此车辆牌照识别系统应具有很高的识别正确率,对环境光照条件、拍摄位置和车辆行驶速度等因素的影响应有较大的容阈,并且要求满足实时性要求。 图1 牌照识别系统原理图

该系统是计算机图像处理与字符识别技术在智能化交通管理系统中的应用,它主要由图像的采集和预处理、牌照区域的定位和提取、牌照字符的分割和识别等几个部分组成,如图1 所示。其基本工作过程如下: (1)当行驶的车辆经过时,触发埋设在固定位置的传感器,系统被唤醒处于工作状态; 一旦连接摄像头光快门的光电传感器被触发,设置在车辆前方、后方和侧面的相机同时拍摄下车辆图像; (2)由摄像机或CCD 摄像头拍摄的含有车辆牌照的图像通视频卡输入计算机进行预处理,图像预处理包括图像转换、图像增强、滤波和水平较正等; (3)由检索模块进行牌照搜索与检测,定位并分割出包含牌照字符号码的矩形区域; (4)对牌照字符进行二值化并分割出单个字符,经归一化后输入字符识别系统进行识别。4.详细设计步骤 4.1 提出总体设计方案。 车辆牌照识别整个系统主要是由车牌定位和字符识别两部分组成,其中车牌定位又可以分为图像预处理及边缘提取模块和牌照的定位及分割模块;字符识别可以分为字符分割与特征提取和单个字符识别两个模块。 为了用于牌照的分割和牌照字符的识别,原始图象应具有适当的亮度,较大的对比度和清晰可辩的牌照图象。但由于该系统的摄像部分工作于开放的户外环境,加之车辆牌照的整洁度、自然光照条件、拍摄时摄像机与牌照的矩离和角度以及车辆行驶速度等因素的影响,牌照图象可能出现模糊、歪斜和缺损等严重缺陷,因此需要对原始图象进行识别前的预处理。 牌照的定位和分割是牌照识别系统的关键技术之一,其主要目的是在经图象预处理后的原始灰度图象中确定牌照的具体位置,并将包含牌照字符的一块子图象从整个图象中分割出来,供字符识别子系统识别之用,分割的准确与否直接关系到整个牌照字符识别系统

基于Matlab的图像特征识别及匹配

基于Matlab的图像匹配定位 知识点: 最小距离分类法是分类器里面最基本的一种分类方法,它是通过求出未知类别向量X 到事先已知的各类别(如A,B,C等等)中心向量的距离D,然后将待分类的向量X归结为这些距离中最小的那一类的分类方法。 匹配之前,需要先将图像转换为灰度图,函数为rgb2gray,由于matlab对浮点型支持较为完善,我们还需将图像数据类型更改为double,函数为im2double。之后再将原始图像补0,这样才能遍历图像的每一点,函数padarray。 1 测试1;(代码见matlab code(1)) 数据库图像不变,改变图像A: Figure 1数据库图像YB Figure 2图像A 每对匹配计算时间:5s左右 病人图像大小:767kb 数据库图像大小:896字节

每次运算时间:5到8s不等计算机运行内存:32GB (1)成功定位结果

(2)差的定位结果 (3)错误定位

matlab code %(1) clear;close all template_rgb = imread('C:\Users\yhjyf\Desktop\图像pipei\test01\模版图 B/1.jpg'); src_rgb = imread('C:\Users\yhjyf\Desktop\图像pipei\test01\匹配图A/1.bmp'); %转换为灰度图 template=rgb2gray(template_rgb); template = im2double(template); src=rgb2gray(src_rgb); src = im2double(src); figure('name','模板匹配结果'), subplot(1,2,1),imshow(template_rgb),title('模板'), %球的模板与原始图像的大小 tempSize=size(template); tempHeight=tempSize(1); tempWidth=tempSize(2); srcSize=size(src); srcHeight=srcSize(1); srcWidth=srcSize(2); %在图片的右侧与下侧补0 %By default, paddarray adds padding before the first element and after the last element along the specified dimension. srcExpand=padarray(src,[tempHeight-1 tempWidth-1],'post'); %初始化一个距离数组 tmp:mj template:x %参见《数字图像处理》 Page561 distance=zeros(srcSize); for height=1:srcHeight for width= 1:srcWidth tmp=srcExpand(height:(height+tempHeight-1),width:(width+tempWidth-1)); %diff= template-tmp;

基于MATLAB的BP神经网络的数字图像识别

基于MATLAB的BP神经网络的数字图像识别

基于MATLAB BP神经网络的数字图像识别

基于MATLAB BP神经网络的数字图像识别 【摘要】随着现代社会的发展,信息的形式和数量正在迅猛增长。其中很大一部分是图像,图像可以把事物生动的呈现在我们面前,让我们更直观地接受信息。同时,计算机已经作为一种人们普遍使用的工具为人们的生产生活服务。如今我们也可以把这些技术应用在交通领域。作为智能交通系统(InteUigent Traffic System,简称ITS)中的一个重要组成部分的车牌识别技术,当然就是其中的重点研究对象。车辆牌照识别(License P1ate Recognition,简称LPR),是一种关于计算机的包括图像处理、数学技术、数据库、信息技术以及智能技术于一体的综合技术。用MATLAB 做车牌识别比用其他工具有许多优势,因为MATLAB在图像的灰度化、二值化、滤波等方面都有很大优势,所以,本次实验我们利用MATLAB的这些优点来对车牌进行识别。 【关键词】BP神经网络;图像识别;字符识别;特征提取;车牌;Matlab 一课题研究背景 (一)图像识别的提出及应用 随着信息化时代的不断发展,人们越来越多地使用信息化的手段来解决各种问题——办公自动化、先进制造业、电子商务等利用计算机技术而产生的新兴行业正不断靠近我们的生活。在信息社会中,我们每天都接触大量的数据——工

作数据、个人数据、无意间获得的数据等——在这些数据中,有些数据需要我们人工处理,而有些则可以利用计算机快速准确的完成——字符识别就是其中的一个范畴。 字符识别是一种图像识别技术,他的输入是一张带有某种字符的图片,而输出则是计算机中对于图片中字符的反应结果。所以,可以广泛的应用于各种领域:如,车牌检测、手写识别、自动阅读器、机器视觉……在生活生产的各个方面都起到了非常重要的作用。 (二)图像识别技术的发展趋势 虽然图像识别技术还不是非常成熟,但现其已经有了很多可喜的成果,比如图像模式识别,图像文字识别。并且其还在飞速的发展着,图像识别的应用正朝着不同的领域渗透着,像计算机图像生成,图像传输与图像通信,高清晰度电视,机器人视觉及图像测量,办公室自动化,像跟踪及光学制导,医用图像处理与材料分析中的图像分析系统,遥感图像处理和空间探测,图像变形技术等等。从所列举的图像技术的多方面应用及其理论基础可以看出,它们无一不涉及高科技的前沿课题,充分说明了图像技术是前沿性与基

基于MATLAB的图像处理的课程设计(车牌识别系统)

目录 一、课程设计目的 (3) 二、课程设计要求 (3) 三、课程设计的内容 (3) 四、题目分析 (3) 五、总体设计 (4) 六、具体设计 (5) 1、文件 (5) 1.1、打开 (5) 1.2、保存 (5) 1.3、退出 (5) 2、编辑 (5) 6.2.1、灰度 (5) 6.2.2、亮度 (6) 6.2.3、截图 (7) 6.2.4、缩放 (7) 3、旋转 (9) 6.3.1、上下翻转 (9) 6.3.2、左右翻转 (9) 6.3.3任意角度翻转 (9) 6.4、噪声 (10) 6.5、滤波 (10) 6.6、直方图统计 (11) 6.7、频谱分析 (12) 6.7.1、频谱图 (12) 6.7.2、通过高通滤波器........................... .. (12) 6.7.3、通过低通滤波器...................................... . (13) 6.8、灰度图像处理................................................ . . (14) 6.8.1、二值图像……………………………………………….. .14 6.8.2、创建索引图像............................................. (14) 6.9、颜色模型转换...................................... .. (14) 6.10、操作界面设计 (15) 七、程序调试及结果分析 (15) 八、心得体会 (16) 九、参考文献 (17) 十、附录 (18)

基于matlab的数字识别系统设计

数字识别系统 1.绪论 1.1研究背景 1.1.1索书号的简介 索书号是图书馆赋予每一种馆藏图书的号码,这种号码具有一定结构并带有特定的意义。在馆藏系中,每种书的索书号是唯一的,可准确地确定馆藏图书在书架上的排列位置,它是读者查找图书必要的代码信息。 索书号通常是根据中国图书资料分类法编排的【1】——简称《中图法》。《中图法》采拉丁字母 和阿拉伯数字相结合的混合标记符号。根据图书的学科主题,以拉丁字母标记并顺序展列出22个基本大类,其中没有L、M和Y开头的——参考附录1中图法简表。由于“T工业技术”的大类范围广泛、内容繁多,故又在该类基础上采用双位拉丁字母标记出16个二级类目,如TK、TL、TM和TN等。字母之后再用阿拉伯数字对大类进行细分。如B表示哲学、宗教一大类;B020则表示宗教理论。有的图书馆如清华大学还在图书分类号码后添加按照图书作者姓名所编排的著者号码,或者是按照图书进馆时间的先后所取用的顺序号码。 不同索书号确定排列先后顺序的步骤是,先比较分类号码:如分类号码相同再比较著者号码或顺序号码。最后按照字母表和数字大小的顺序排列。 1.1.2书库中图书查找存在的问题

随着电子计算机和网络技术的发展,现代图书馆都已经广泛建立电子数据库图书管理系统,方便用户查找、阅览书籍。读者借图书的流程如图2所示,一般利用书目查询系统,根据图书的 书名,出版社,作者以及书的内容等在电子数据库中检索自己需要的图书,记录图书相关信息。 最后,根据图书的索书号,快速方便地在书库中找到相应的图书。但是,经常会遇到下列问题:电子数据库系统显示图书状态为“归还”,利用检索到号,却无法在书库找到此书。出现这种情况主要有两个原因:(1)图书错位放置,即图书在书库中摆放的位置与索书号不一致。(2)图书已经丢失,即虽然电子数据库中显示图书状态为“归还”,但实质图书已经丢失,并不在书库中。随着图书馆藏书数目的不断增加,每天借阅的人数增多,而且有的图书馆发展成拥有几个分馆,上述问题越来越严重。这一方面严重降低了图书馆的资源的利用率;另一方面,浪费了读者的时间,造成了很大麻烦。 目前,图书馆主要通过定期的人工检查发现书库中错位和丢失的图书。但是,由丁馆藏图书多达上万,甚至几十万,而且每天又都有大量图书的借出和还入,人工检查工作量很大,单调、 重复的工作容易使工作员疲劳,检查速度比较慢,无法满足实际的需要。因此,迫切希望开发索书号自动识别系统,实现对书库中图书放置位置的自动检查,并通过索书号识别结果与电子数据库中图书信息的比较,找出已经丢失的图书。确保电子数据库中的图书状态与书库中的一致,以及书库中的图书准确排放,从而有效解决上述“用索书号找不到图书”的问题。 1.2.索书号自动识别系统 近年来,随着电子计算机技术、图像处理技术和摄像技术的迅速发展,图像中的文字信息提 取系统已经成功地应用于各个领域。因此,借助其经验,本文研究采用图像处理和识别技术 实现索书号的自动识别。 1.2.1索书号自动识别系统概述 系统的硬件由彩色CCD摄像头,8位图像采集卡和计算机组成,拍摄的图像为8位RGB彩色

相关主题