搜档网
当前位置:搜档网 › 数字识别论文

数字识别论文

保密类别编号

毕业论文

数字识别实现

学院计算机学院

专业软件工程

班级2班

姓名王茜

指导教师黄祥林

中国传媒大学

年月日

数字识别实现

王茜

摘要

在信息化飞速发展的时代,光学字符识别是一种重要的信息录入与信息转化的手段。数字识别作为光学字符识别中的一个分支,在车牌识别、邮政编码识别、统计报中等领域有着非常广泛的应用,用数字识别系统代替手工录入,可节约大量的人力和财力。因此,数字识别的研究有着重大的现实意义。

本文主要研究的即数字识别问题。首先,对数字图像的预处理工作进行了详细的介绍,其中包括:二值化、字符切分、归一化等。接着介绍了当前数字识别的几种常用方法。然后重点描述了用于印刷体数字识别的模板匹配法和基于整体特征的快速手写体数字识别法的原理,并给出了算法实现的过程。

实验结果证明,上述算法能取得较好的识别效果。

关键词:数字识别,图像预处理,模板匹配,整体特征

Xi. Wang

ABSTRACT

OCR (Optical Character Recognition) has become one of the important methods in gathering information and information transformation. Digit recognition has a promising business feature in many fields in society, for example the car license plate recognition、postcode recognition, the statistics of report forms, financial report forms. So the researching on the Digit recognition is one of the important things.

The paper describes the basic process and methods of numeral recognition system. First,

Keywords: Numeral recognition \

一、绪论

(一)问题的提出

光学字符识别(Optical Character Recognition),是属于图型识别的范畴。一个OCR识别系统,其目的是把图像中的内容转化为文本格式,便于计算机进行后续处理,使图像资料的储存量减少,同时也可节省因键盘输入的人力与时间。数字识别技术作为光学字符识别中的一个分支,也是现在非常受人们关注的问题。目前,数字识别技术主要分为印刷体数字识别技术和手写体数字识别技术。

印刷体数字识别在许多领域都有广泛的应用价值。如印刷字体的邮政编码识别系统,通过印刷体识别技术识别邮件上的邮政编码,帮助邮局做快速区域分信的作业;另外,身份证号码的识别、汽车牌照的识别、电话号码识别等[1]也是印刷体数字识别技术的应用领域,通过此技术的应用,可以节约大量的人力录入时间和财力。

手写体数字识别,是使计算机能够识别手写的数字,包括联机手写体数字识别和脱机手写体数字识别。联机手写数字的识别目前在实际生活中已经有了很多的应用,如在带有写字板的手机中,电话号码的写入,及各种商务伴侣中手写字符的录入等。脱机手写体数字识别是整个数字识别领域中最为困难的部分,但经过多年的研究,研究者们已经开始把各种理论方法实用化,为手写数据的高速自动录入提供了一种解决方案。近些年来,我国开始大力推广的“三金”工程在很大程度上要依赖数据信息的输入,如果能通过手写数字识别技术实现信息的自动录入,无疑会促使这一事业的进展。因此,手写数字的识别研究有着重大的实现意义,一旦研究成功并投入使用,将产生巨大的社会和经济效益。[2]

在各种应用领域,由于相关软硬件技术性能的不断提升,新的方法理论不断涌现并应用,同时原有方法也不断被重新组合利用以达到更好的性能。因此,该问题的提出有很大的现实意义。

(二)论文的内容

本文主要研究的是数字识别技术。数字识别技术通过提取代表数字的特征,再根据提取的特征设计相应的分类器进行分类识别,得到正确的识别结果。根据印刷体和手写体的特点,本文分别提出了相应地特征提取技术和分类方法,主要内容包括一下几个方面:

1、介绍了数字识别技术的主要流程,对流程中的各个功能模块进行了系统的阐述,并对目前常用的方法进行了概括。

2、详细介绍了基于模板匹配的印刷体数字识别方法,对原理和算法实现都进行了细致的描述。

3、分析了手写数字的特点,提出一种基于整体特征的手写体数字快速识别方法,并详细阐述了其算法思想和实现方法。

(三)论文结构

根据论文的主要内容,安排论文的结构如下:

第一章绪论,介绍了数字识别问题的研究意义,论文的主要内容与结构安排。

第二章数字识别技术的概述,对各个功能模块进行详细的介绍。

第三章介绍基于模板匹配的印刷体数字识别技术的实现过程及实验结果。

第四章介绍基于整体特征的快速手写识别的原理和算法实现过程及实验结果。

第五章对整个研究工作做出总结回顾,并做出一些后续工作的难点和展望,以作为论文的结束语。

二、数字识别概述

数字识别,其目的是实现数字识别,首先要对数字图像进行预处理,然后提取数字的特征,最后进行分类识别,输出识别结果,基本流程图如图2.1所示:

字符图像输入图像预处

特征提取分类识别字符输出

2.1 计算机数字识别流程图

下面对数字识别中的每个功能模块进行详细的阐述:

(一)图像的输入

图像的输入就是图像数字化的过程。BMP文件格式是微软公司定义的一种广泛使用的图像文件格式,本文所讨论的数字识别的识别对象—字符点阵图像就是BMP文件格式。

(二)图像预处理

预处理作为后续工作的基础,是一个相当重要的部分,图像预处理工作的好坏直接影响到识别的效率。预处理一般包括二值化,行字切分、归一化和细化等。不同的识别方法,对预处理的项目和要求有所差别。

1.二值化

字符图像的二值化即把字符灰度图像处理成二值图像的过程。二值化的关键是要找到合适的阈值来区分对象和背景。灰度图像二值化能显著减小数据存储的容量,并能够降低后续处理的复杂度。根据阈值选取方法的不同,二值化方法主要分为三类:全局阈值法、局部阈值法和动态阈值法。

(1)全局阈值二值化

全局阈值二值化方法是根据图像的直方图或灰度空间分布确定一个阈值,并根据此阈值实现灰度图像到二值化图像的转化。典型的全局阈值法包括Ostu[13]方法、最大熵方法[14]等。全局阈值方法的优点在于算法简单,对目标和背景明显分离、直方图分布是双峰的图像效果良好,但对输入图像量化噪声或不均匀光照等情况抵抗力差,应用受到限制。

(2)局部阈值二值化

由像素()j i,的灰度值()j i f,和像素周围点的局部灰度特性确定阈值的方法称为局部阈值选择法。非均匀光照条件等情况虽然影响整体图像的灰度分布却不影响局部的图像性质。邻域的规定及邻域计算模板的选取都是决定算法效果的关键因素。局部阈值法也存在缺点和问题,如实现速度慢,不能保证字符笔画连通性,以及容易出现伪影现象等。

(3)动态阈值二值化

当阈值选择不仅取决于该像素阈值以及其周围像素的灰度值,而且还和该像素坐标位置有关时,称之为动态阈值选择法。由于充分考虑了每个像素邻域的特征,能更好的突出背景和目标的边界,使相距很近的两条线不会产生粘连现象,可以处理低质量甚至单峰值直方图图像。但是,这种方法的计算量很大,运算速度一般比较慢。

2.字符的切分

灰度图像经过二值化处理后,文字图像就变成了一些二值数字信号,它是一个整体,要想识别单个文字,就需要把每个文字从文字图像中分离出来,这就是所谓的切分。目前,已提出的字符切分方法有很多种,下面对几种比较常用的方法作简单的介绍:

(1)垂直投影法

垂直投影法是最常用的一种切分方法,利用字符间的空隙在直方图上呈现波谷状进行字符的切分,该方法速度快,实现简单。但简单的投影图法存在很大的缺陷,由于字符中经常存在的空洞或者字符的粘连,导致字符的垂直投影有多处波谷,因此在进行分割时难以依据波谷来确定字符的分割点。

(2)基于多行的垂直投影法

这种切分方法实际上是垂直投影法的变形形式。它通过多行文字在垂直扫描中进行多行信息点个数的统计,然后根据统计特征进行字符切分。这种方法可以有效的解决由于个别字符断裂产生的错误切分问题。但是这种方法主要用于字符排列很规整的文本图像,因而该种方法的局限性也很大。

(3)连通域法

连通域法是一种应用比较普遍的字符切分方法。字符的根本特征在于其连通性,无论字符如何倾斜或变形,其连通特征不会改变。如果把书写的笔画看成连通域,那么数字和英文字母都是由一个连通域构成。依据字符的这一特点,连通域方法可以实现字符的分割。

总体来说,上述的切分方法各有利弊,但没有一种通用的切分方法能够实现字符的精确切分。因此,我们可以考虑将几种方法结合起来,以提高切分的速度和准确度。

3.字符的归一化

字符图像的归一化包括位置,大小,旋转和倾斜归一化。下面主要介绍位置归一化和大小归一化。

(1)位置归一化

位置归一化就是把数字图像都放到某一固定的位置,能够消除数字点阵位置上的偏差,并能方便数字特征描述、提取。位置归一化后的数字图像图2.3所示(图中以数字图像外围框的左上角作为归一化基准位置):

2.3 数字位置归一化前后图像

(2)大小归一化[12]

大小归一化是指对不同大小的数字图像作变换,使之成为同一尺寸大小的文字,图像大小归一化方法分为两大类:线性归一化和非线性归一化。

1)线性归一化

线性归一化是将数字图像的笔画按比例线性放缩或缩小到规定尺寸的图像,仅与原始数字图像和归一化后图像的大小有关系。

设()y x ,为原图像像素点坐标,()n m ,为归一化后的像素点坐标,则其变换关系如式2-1所示: ⎪⎪⎭⎫ ⎝⎛n m =

⎝⎛21a a ⎪⎪⎭⎫21b b ⎪⎪⎭⎫ ⎝⎛y x + ⎪⎪⎭

⎫ ⎝⎛21c c (2-1) 其中系数矩阵 ⎝⎛21a a ⎪⎪⎭⎫21b b 决定了图像的比例和旋转变换尺度,⎪⎪⎭

⎫ ⎝⎛21c c 体现了图像的平移变换。如果数字图像已经经过位置归一化,且没有旋转,则上述公式可简化为式2-2: ⎪⎪⎭⎫ ⎝⎛n m = ⎝

⎛0x f ⎪⎪⎭⎫y f 0⎪⎪⎭⎫

⎝⎛y x (2-2) 其结果如图2.4:

2.4 大小归一化前后图像

2)非线性归一化。

线性归一化的变换函数为线性函数,不能解决图像的变形问题,故提出了非线性归一化方法。非线性归一化是通过密度均衡的方法实现大小归一化,以消除输入模式的各种变形,这些方法大致分以下三种:点密度均衡法、线密度均衡法和笔画穿透数均衡法。

4.字符的细化

细化是指在保持原图像拓扑结构的情况下,尽可能快地抽取出单像素宽的骨架的过程。细化的必要性不仅仅只是压缩冗余信息的需要,同时还是对模式进行结构分析的需要。同时,细化能消除笔画边缘上的噪声点,更有利于字符特征的提取。

近年来,许多学者相继提出了许多细化算法,依据考虑问题的角度不同,图像细化的方法主要有基于边缘点删除法[67][68]和基于内点保留法[70]两种。传统的基于边缘点删除的细化算法在细化过程中,只对边缘点的可删除性进行判断并作相应处理,由于受跟踪顺序及所考察邻域的影响,易产生骨架的非对称性;基于内点保留的细化算法易使所获得的骨架大于一个像素。

(三)特征提取

图像特征是指图像场中可用作标志的属性,其中有些是视觉直接感受到的自然特征,如区域的亮度、彩色、纹理、或轮廓等,有些是需要通过变换或测量才能得到的人为特征,如各种变换频谱、直方图、矩等。图像特征提取就是从图像中提取出某些可能涉及到的高层语义信息的图像特征,以进行后续分析。

特征提取是识别系统中一个非常重要的步骤,因为它提取的特征是识别的依据。同一字符可以有不同的表现形式,表示这些形式的特征必须相同或非常相似,此即为特征的不变性,它主要体现在大小、旋转角度、倾斜度和拉伸程度等方面。良好的特征应具有以下五个特点:1、区分力强:对于属于不同类别的对象来说,它们的特征值应具有明显的差异;2、可靠性:同类的对象特征应比较接近;3、独立性:所用的各种特征之间应彼此不相关;4、易于提取:所用的特征要易于计算机的提取;5、数量少:识别系统的复杂度随着特征维数的增加迅速增长,所以特征不能太繁琐。

数字识别特征提取的方法大致可以分为基于结构的特征提取和基于统计的特征提取。

字符图形含有丰富的结构信息,可以设法提取含有这种信息的结构特征及其组字规律,作为识别字符的依据,这就是基于结构的特征提取。统计特征是提取待识别模

式的一组统计特征,作为识别的依据。

结构法比较直观,能较好反映事物的结构特性,但是结构基元的提取很不容易,各基元的关系也比较复杂,抗干扰性能也较差;统计法利用计算机来抽取特征,比较方便,抗干扰性能好;缺点是没有充分利用模式的结构特性。近多年来把这两种特征提取方法结合起来,提取出各种行之有效的字符特征,取得了很好的效果。

目前较常用的特征提取方法如下几种,一般来说,对于印刷体数字识别,只要用到其中一种方法即可,而手写体数字识别常常把这些方法组合起来使用。

1.关键背景点法

如图2.5所示,在数字字符的背景区域指定两个特殊点,称为关键背景点。从这两个关键背景点出发,分别向上、下、左、右四个方向引出一条射线,根据各射线穿越的字符笔画次数,求出字符四方向上的三值编码。从而,对10个数字,每个关键背景点周围的笔画分布情况可用表2.6所示编码表示出来[3][4]。

2.5 印刷体数字字符的关键背景点

2.6 背景特征点编码

因此,印刷体数字字符的识别变得非常容易,只要对输入的待识别字符经规范化处理后,然后根据关键背景点的数目以及其与笔划的相交次数编码情况,就可以判断出输入的字符。

2.13点特征提取法[5]

13点特征提取法,即提取能够代表数字的13个点作为数字的识别特征。具体提取方法为:

首先,把字符平均分成8份,统计每一份内黑色像素点的个数作为8个特征,如图2.7(a)所示;然后统计水平方向中间两列和竖直方向中间两列的黑色像素点的个数作为4个特征,如图2.7(a)、(b)所示;最后统计所有黑色像素点的个数作为第

13个特征。

(a) (b) (c)

2.7 13特征提取法

13特征提取法有着极好的适应性,但由于特征点的数目太少所以在样本训练时比较难收敛。

3.横线竖线特征法[1]

横线竖线特征法提取代表每个符号的形状特征,通过对数字的分析,抽取了数字的4种特征:横线特征,竖线特征,水平方向的过交点数,垂直方向的过交点数。具体提取方法如下:

(1)横线特征

首先定义比例hs,代表水平方向上黑点连续出现的像素个数与图像的宽度之比。当hs介于[]1,8.0时,认为这些连续黑点构成一条横线。根据横线在数字中的不同位置,我们又可将其分为上横线如5,7;下横线如1,2;其中4有一条横线比较特殊,可以将其区分出来。横线特征示例如图2.8所示:

2.8 横线特征示意图

(2)竖线特征

与横线特征的原理相同,定义比例hh,代表垂直方向上黑点连续出现的像素个数与图像的宽度之比。如果0.4≤hh≤1,则认为该数字中这些连续出现的黑点构成一条竖线。同理,由于数字中的竖线是有一定宽度的,因此在垂直扫描线顺序扫描时,相邻的几条竖线,将其视为同一条竖线。竖线特征示例如图2.9所示:

2.9 竖线特征示意图

(3)水平方向和垂直方向的过交点数

通常求单个水平方向或垂直方向上的过线交点数,我们很难区分开数字。因为在不同类型的印刷体数字中交点数有可能相等,因此我们需要将其两个特征结合起来使用。

用五条水平线和五条垂直线将其分别穿过数字图像来求得交点数进行比较判断,示意图如图2.10所示:

2.10 交点特征示意图

将数字的横线特征、竖线特征及交点特征结合起来,可以较好的识别数字。(四)分类识别

字符分类是基于提取到的特征的,提取了特定的特征就有相对应的分类方法。分类算法是识别的关键,分类算法的优劣也决定了识别系统的优劣。一般来说,在印刷体数字识别当中,有些特征值可以直接作为分类标准,而在手写数字的识别中,由于其字形的多变性,在提取完特征值后,还要用到比较复杂的分类器,将字符识别出来。其中几种常用的分类器设计方法如下:

1.基于支持向量机的分类器 [7]

利用支持向量机进行手写体数字识别的分类函数形式上类似于一个神经网络,其输出是若干中间结点的线性组合,而每一个中间层节点对应于输入样本与一个支持向量的内积,因此也称支持向量网络,如图2.11所示,对于m类模式分类问题,可以设计m个两类SVM分类器,每个分类器只区分一类模式与其它类模式,输入层是特征向量,中间层全部由支持向量机构成,具体数目由训练过程得到,样本输入后与中间层的每个支持向量进行内积运算,运算结果加权后输出到输出层,支持向量机的输出层只有一个节点,用来确定识别结果的类别属性。

2.11 支持向量机示意图

2.基于最小距离的分类器 [13]

根据模式识别的理论,如果一个模式近似于正态分布并且各个类别的先验概率和

协方差矩阵都相等的条件时,贝叶斯判别函数简化为式2-3:

()∑∑==-=-=m i n

j l j i j i l L k x K X X d 11

,,2 (2-3)

其中:X = ⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧mm m m n n x x x x x x x x x ...........................212222111211, K l = ⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧l mn l m l m l n l l n l l k k k k k k k k k ............................2122212111211,2l K X -为X 到i ω类

的均值向量l K 的欧氏距离。分类方法如式(2-4)所示:

若 ()(){}X di X d r min =,则()r X ωω= (2-4)

这种分类器称最小距离分类器。最小距离分类器构造简单,标准样本值作为各类

均值和各类别的代表,距离作为判别函数。这时的决策规则变为:如果X 到期望向量r

K 的欧氏距离最小,则将X 分到r ω类中。在应用时,先形成特征矢量,再计算出最小距

离的模板作为分类结果。

3.树分类器

所谓树分类器,就是根据树型分层理论,将未知数据归属于某一类的分类方法。

树分类器由一个根节点、若干非终节点和终结点构成。终结点又称叶子节点,每个叶

子节点代表一种模式类别。除了叶子节点外,每一节点都有多于一个的下级节点与之

相连。从根节点开始经过所有非终节点,直到所有的叶子节点,构成整个树分类器。

2.12 树分类器结构图

如图2.12即为一个n类问题的树分类器。首先,把集合{}

,1用特征f1

C,...,

2

C

Cn

将其分组成{}

2

Cr

+,然后,用特征f2进一步将

Cn

,1+

Cr,...

Cr

C

C,...,

2

,1和{}

{}

Cr,...

2

Cr

,1+

+分组,如此不断地进行分组处理,C,...,

Cr

C

2

Cn

,1分组,用特征f3将{}

直至集合中只有最后一个元素为止。

三、基于模板匹配的印刷体数字识别

印刷体数字结构简单,字符集小,所以对印刷体而言,只要切分正确,能有效地

克服断裂及粘连的影响,无论是使用统计模式的方法还是使用结构分析的方法,都能

获得满意的效果。

在机器识别事物的过程中,常需要把不同传感器或同一传感器在不同时间、不同

成像条件下对同一景物获取的两幅或多幅图像在空间上对准,或根据已知模式到另一

幅图中寻找相应的模式,这叫做匹配。本文所用的印刷体数字识别方法即为模板匹配

法。

模板匹配法是把待识字符与字典中每一个模板进行比较,找出相同像素最多的模

板代表字符作为识别结果。模板的设计是模板匹配的关键。最简单的模板设计是预先

扫描同一字符的若干二值图像,将这些图像的前景集合的交集作为模板。

(一)模板匹配的原理

设模板T 叠放在搜索图S 上平移,模板覆盖下的那块搜索图叫子图S i,j , i,j 为这

块子图的左上角点在S 图中的坐标,称为参考点,不难从图 3.1 中看出,i 和j 的取

值范围为

1< i , j < N-M+1

子图S i

模板T 与被搜索图A

现在可以比较T 和j i S ,的内容。若两者一致,则T 和S 之差为零。所以可以用下

列两种测度之一来衡量T 和j i S ,的相似程度:

D (i ,j )= []∑∑==-M m M n j i n m T n m S

112,),(),( (1)

或者:

D ( i ,j ) = ∑∑==-M m M n j i n m T n m S

11,),(),( (2)

对于二值图像,模板匹配法还可以简化,这时模板与对应子图中的对象点的差值为:

),(),(,n m T n m S j i - =

j i j i S T T S ,,- = ),(),(,n m T n m S j i ⊕ (3)

其中⊕表示异或处理(模2加),由此得: D ( i ,j ) = ∑∑==-M m M n j i n m T n m S 11

,),(),( = ∑∑==⊕M m M

n j i n m T n m S 11,),(),( (4)

这常被称为二进制Hamming 距离,D 越小,则子图同模板越相似。

(二)算法实现

通常来说,印刷体数字总是具有规范的形状,因此,使用模板匹配法对特定字形

印刷体数字进行识别,会得到较好的效果。

在模板匹配前,还需对字符图像进行预处理工作,其主要流程图如下:

3.2 模板匹配法识别数字流程图

1.图像的二值化

设计中是使用人工设置全局域值的方法实现图像的二值化,因为输入的字符图像的灰度直方图在背景点的灰度级和字符灰度级上会出现二个峰值,所以用全局阈值法能得到较好的效果。用GetByteatH函数可得到相应图像上的点的灰度值,若bmpfile.GetByteatH (i)[j]>164,就置bmpfile.GetByteatH (i)[j]=255(白色),反之,置bmpfile.GetByteatH (i)[j]=0 (黑色)。

2.图像的切分

设计中是使用基于单行的垂直投影法对二值图像进行切分。其主要步骤如下:(1)扫描二值图像,将图像每列的黑像素点数记录在数组gray[n]中,每行的黑像素点数记录在数组grayh[n]中。

(2)当gary[i]==0,说明该列没有黑点,从第0列开始,若当前列gray[i]=0,gray[i+1]!=0,说明i+1为字符最左边的像素位置,若当前列gray[i]!=0,gray[i+1]=0,说明i为字符最右边的像素位置,记录每个字符的左右位置,存放在结构体w[k].left和w[k].right中。

(3)同理,对grayh[n]操作,记录下单行字符的上下位置。

这样,把切分出的单个字符存放于单个的字符图像中,就完成了切分工作。

3.图像的归一化

设计中对切分出来的单个图像进行了位置归一化和大小归一化,其中大小归一化用到的是线性归一化方法。

在实验中,将每个字符的高都归一化为30像素,将字符的最左上点归一到坐标(0,0)。

4.模板匹配

(1)模板的生成

对于印刷体数字来说,模板的制作比较简单。基于印刷体数字形状固定的特点,只需将0~9的二值化图像对应点的值存放在二维数组m0[n][n]~m9[n][n]中,以0为例,其字符图像中黑像素点对应的m0[i][j]=1,白像素点对应的m0[i][j]=0,这样,就完成了模板的制作。在实验中,统一选规定模板的高度为30像素点。

(2)匹配

在实验中,我们对待匹配的字符图像已经进行了位置和大小的归一化,并采用人工设置整体阈值的方法二值化图像。因此,对已经分割出的待识字符,将其信息存放在二维数组t[n][n],同样的字符图像中的黑像素点其对应得t[i][j]=1,白像素点对应的t[i][j]=0。

设置数组S[10],计算存放待识字符图像信息的二维数组t[n][n]与存放0~9模板图像信息的m0[n][n]~m9[n][n]的相似度,相似度D(0,0)用上述公式(3)算出,相似度存放数组S[10]中,然后比较S[10]中每个元素的大小,数值最小的元素相似度最大,即为待识字符的值。如果,S[10]中最小的元素也大于一个给定的阈值,则我们认为在模板中没有与之相匹配的数字,输出匹配失败。

识别完成后,将识别结果保存在result.txt文件中。

(3)算法的复杂度

算法实现了对单行数字的识别,且每个数字字符的信息都存放于二维数组中,因此,算法的时间复杂度为()3n O。在空间上,需要10个二维数组存放0~9字符的模板信息,和一个二维数组存放待识别字符信息,因此,空间复杂度级数为()2n O。

(三)实验结果

在Windows XP 的平台下,用Visual C++ 6.0实现了基于模板匹配的印刷体数字识别。在毕业设计中所选用的数字字模为华文细黑体,对于不同大小的华文细黑体印刷数字,都要较好的识别结果,实验结果如下:

3.5待识别字符图像

3.7 识别结果

实验中任意选取了100个字符,其识别正确率为99.9%。

四、基于整体特征的快速手写体数字识别

手写数字识别在学科上属于模式识别和人工智能的范畴。在过去四十年中,人们想出了很多办法获取手写字符识别的关键特征,提出了许多识别方法和识别技巧。这些手段分两大类:全局分析和结构分析。对前者,我们可以用模板匹配,像素密度,矩,特征点,数学变换等技术。这类的特征常常和统计分类方法一起使用。对后者,多半需要从字符的轮廓或骨架上提取字符形状的基本特征,包括:圈,端点,节点,弧,突起,凹陷,笔画等等。这些结构特征往往与句法分类方法配合使用。

现有的数字字符识别方法都是提取字符的点特征,因此必须对字符细化,在细化的骨架上提取特征点;而本方法是提取字符的整体特征——凹凸特征,因此不需要细化过程。字符的凹凸特征是指字符含有圈和凹陷区的数目和位置信息。这些信息的提取过程如下所述。

(一)基于整体特征的快速手写体数字识别的原理[8][9]

1.寻找字符的圈

现有的数字字符识别系统中利用到的圈识别都是在细化骨架的基础上采用像素跟踪技术完成的,即深度优先搜索字符细化骨架中某像素所在的连通域,如果又能回到该像素,则找到圈。而在这里,圈的识别变得非常简单,如果字符有8背景场就说明字符含有圈,8背景场周围值为9的像素集合就构成圈,字符有多少个八背景场,就说明有多少个圈,其中数目小于一定阈值的8背景场为字符的无效圈。如图4.1

4.1 字符的背景场图

2.寻找字符的凹陷区

如果连接一个图像上任意两点的直线都属于该图像,那么该图像为凸图像;如果连接图像上两点的直线有部分不属于图像,那么称该图像为凹图像,其中直线中不属

基于FPGA的卷积神经网络手写数字识别系统的实现共3篇

基于FPGA的卷积神经网络手写数字识别系统的实现共3篇 基于FPGA的卷积神经网络手写数字识别系统的实现1 随着科技的发展,人工智能已经成为人们生活中不可分割的一部分。其中,深度学习是人工智能领域的一个热门话题。而卷积神经网络作为深度学习的重要算法之一,其应用也愈加广泛。本文将重点介绍基于FPGA的卷积神经网络手写数字识别系统 的实现。 一、卷积神经网络简介 卷积神经网络(Convolutional Neural Network, CNN)是一 种前向反馈人工神经网络,是深度学习中常见的算法之一。该网络主要用于图像识别、语音识别等领域。卷积神经网络主要由输入层、隐藏层和输出层构成。其中,隐藏层包括多个卷积层、池化层和全连接层。 卷积层是卷积神经网络中的核心层,它利用一组可学习的滤波器对输入的图像进行卷积操作,从而获得图像中的特征。这些特征在后面的池化层和全连接层中都会用到。 池化层则对卷积层中获得的特征图进行降维处理,从而减少计算量。常见的池化操作有最大池化和平均池化两种。 全连接层则将池化层中的特征图作为输入,进行分类判断。全

连接层的输出通常会经过一个激活函数。 二、FPGA简介 FPGA(Field-Programmable Gate Array)是一种可编程逻辑器件,其具有高度灵活性和可重构性。FPGA可以通过编程实现不同的电路功能,因此在高速、低功耗、高可靠等方面有着很强的优势。在深度学习中,利用FPGA进行计算的方式可以大大提高计算速度和效率。 三、基于FPGA的卷积神经网络手写数字识别系统 本文的识别系统采用了FPGA作为处理器,并使用卷积神经网络对手写数字进行识别,部分个人感想如下。 1. FPGA的搭建 本次实验搭建使用的是Altera的CYCLONE II FPGA,需要先进行硬件电路的设计和代码实现。硬件电路的设计可以使用VHDL或Verilog等HDL语言进行实现,代码实现则可以使用Quartus II或其他类似的软件进行集成。 2. 卷积神经网络的搭建 本次实验采用了LeNet-5网络结构,该网络结构具有5个卷积层和2个全连接层。其中,第一个卷积层采用6个5×5的卷积核,后面的卷积层采用不同的卷积核,以实现特征提取。全

数字图像处理相关论文

数字图像处理相关论文 “数字图像处理”是一门利用计算机解决图像处理的学科。并且,现代多媒体计算机中又广泛采用了数字图像处理技术。下面是店铺给大家推荐的数字图像处理相关论文,希望大家喜欢! 数字图像处理相关论文篇一 浅谈“数字图像处理”课程教学改革实践 摘要:数字图像处理技术是一种发展迅速且应用广泛的新兴技术,就“数字图像处理”课程的特点,从教学内容、教学手段和方法、教学理论和实践等方面进行改革与实践,增强了学生的实践创新能力,提高了教学质量,收到良好的教学效果。 关键词:数字图像处理;教学手段;实践 作者简介:刘忠艳(1975-),女,黑龙江依安人,黑龙江科技学院计算机与信息工程学院,副教授;周波(1963-),男,黑龙江绥化人,黑龙江科技学院计算机与信息工程学院,教授。(黑龙江哈尔滨 150027) 一、“数字图像处理”概述 数字图像处理技术是集微电子学、光学、应用数学和计算机科学等学科的一门综合性边缘技术。[1,2]是当今信息社会中发展迅速且应用广泛的新兴科学技术。数字图像处理技术广泛应用到通信、计算机、交通运输、军事、医学和经济等各个领域,在各个领域发挥着越来越重要的作用。 随着计算机技术的迅速发展,图像处理的技术和理论不断完善和丰富,新的理论、技术也不断涌现,并逐渐进行应用。面对这样一门理论与实际紧密结合的课程,在学习过程中,学生常常会遇到很多问题,既为数字图像处理技术应用的广泛前景所吸引,也时常对课程的抽象理论感到苦恼,渐渐失去学习兴趣。为了激发学生的学习兴趣,提高教学质量,对该课程进行教学改革,势在必行。经过两年半的教学改革与实践,取得了一定的教学效果。 二、教学改革措施 为了提高“数字图像处理”课程的教学质量,激发学生学习本课

手写数字识别的实现

燕山大学 课程设计说明书 题目:手写数字识别的实现 学院(系):电气工程学院 年级专业: 08-自动化仪表 学号: 080103020179 学生姓名:付成超 指导教师:林洪彬程淑红 教师职称:讲师讲师 2010年 12 月 24 日

燕山大学课程设计(论文)任务书 院(系):电气工程学院基层教学单位:自动化仪表系 学号080103020179 学生姓名付成超专业(班级)自动化仪表设计题目手写数字识别实现 设 计技术参数 通过由数字构成的图像,自动实现几个不同数字的识别,设计识别方法,有较高的识别率 设计要求 设计图像中不同数字的识别方法,可以先从两个数字的识别开始,尽量实现多个不同数字的识别。设计中应该有自己的思想、设计体会 工作量1.分析图像特征,查阅相关资料,根据图像的特征提出解决问题的思路。2.查阅相关资料,学会MATLAB的编程方法 3.根据解决思路,编辑程序,根据调试结果,修改相应思路,找出最佳解决方案 工作计划周一分析图像,查阅各种资料,提出可行的解决方案。周二熟悉MATLAB软件,学会软件的简单编程方法。 周三根据可行的方法,编写程序,调试并修改方案。周四根据调试结果,选取最佳方案并完成设计论文。周五进一步完善设计论文,准备论文答辩。 参考资料[] MICHAEL SIPSER著,张立昂等译,《计算理论导引》,机械工业出版社,2000。 [2] 王晓龙,关毅等编,《计算机自然语言处理》,清华大学出版社,2005。 [3] R.C.Gonzales等著,阮秋崎等译,《数字图像处理》,电子工业出版社,2002。 [4] 王文杰等编,《人工智能原理》,人民邮电出版社,2003。 指导教师签字基层教学单位主任签字 2010年 12 月 24 日

手写体数字的识别

手写体数字识别 第一章绪论 (4) 1.1课题研究的意义 (4) 1.2国内外究动态目前水平 (4) 1.3手写体数字识别简介 (5) 1.4识别的技术难点 (5) 1.5主要研究工作 (6) 第二章手写体数字识别基本过程: (6) 2.1手写体数字识别系统结构 (6) 2.2分类器设计 (7) 2.2.1 特征空间优化设计问题 (7) 2.2.2分类器设计准则 (8) 2.2.3分类器设计基本方法 (9) 3.4 判别函数 (9) 3.5训练与学习 (10) 第三章贝叶斯方法应用于手写体数字识别 (11) 3.1贝叶斯由来 (11) 3.2贝叶斯公式 (11) 3.3贝叶斯公式Bayes决策理论: (12) 3.4贝叶斯应用于的手写体数字理论部分: (16) 3.4.1.特征描述: (16) 3.4.2最小错误分类器进行判别分类 (17) 第四章手写体数字识别的设计流程及功能的具体实现 (18) 4.1 手写体数字识别的流程图 (18) 4.2具体功能实现方法如下: (19) 结束语 (25) 致谢词 (25) 参考文献 (26) 附录 (27)

摘要 数字识别就是通过计算机用数学技术方法来研究模式的自动处理和识别。随着计算机技术的发展,人类对模式识别技术提出了更高的要求。特别是对于大量己有的印刷资料和手稿,计算机自动识别输入己成为必须研究的课题,所以数字识别在文献检索、办公自动化、邮政系统、银行票据处理等方面有着广阔的应用前景。 对手写数字进行识别,首先将汉字图像进行处理,抽取主要表达特征并将特征与数字的代码存储在计算机中,这一过程叫做“训练”。识别过程就是将输入的数字图像经处理后与计算机中的所有字进行比较,找出最相近的字就是识别结果。 本文主要介绍了数字识别的基本原理和手写的10个数字字符的识别系统的设计实现过程。第一章介绍了数字识别学科的发展状况。第二章手写体数字识别基本过程。第三章贝叶斯方法应用于手写体数字识别。第四章手写体数字识别的设计流程及功能的具体实现,并对实验结果做出简单的分析。 关键词:手写体数字识别分类器贝叶斯vc++6.0 错误!未找到引用源。

数字图像处理在指纹识别中的应用本科毕业设计

数字图像处理在指纹识别中的应用 摘要 指纹具有唯一性和稳定性,因此被人们用来当作鉴别个人身份的主要依据。随着光学技术、化工技术、纳米技术等多种学科的快速发展.指纹显现和提取技术取得了较快的控展。但有不少显现或提取得到的指纹效果较差,不易分辨指纹纹线与客体背景主间的差异或指纹纹线成像模糊等,主要表现为指纹纹统与客体背景的反差较弱。指纹纹线受客体背景的干扰、两枚或多枚指纹相互重叠干扰、弯曲表面客体上的指数威像问题等。但由于存在指纹图像的噪声和皮肤弹性等因素影响,指纹识别一直存在识别率不高、运算速度较慢的问题。这时可利用数字图像处理技术对不易辨识的指纹进行增强处理.便于后续的指纹识别鉴定。本文总结了基于小波变换的数字图像处理在指纹图像增强、指纹图像二值化、指纹图像压缩编码、指纹图像细化、指纹图像特征提取等方向的各种算法及技术。另外本文还给出了基于matlab软件的指纹自动识别系统实现。在指纹图像的预处理中,首先进行分块归一化,为后续处理提供统一的规格图像;在求方向图中,用沿着某个方向的灰度方差代替Metre方法中的灰度变化,相当于在求点方向图之前先进行了一次均滤波操作,这样得到的方向图更有鲁棒性;在二值化中,阀值的选取引入最大熵的概念,使图像具有抗噪性。但对于部分噪声严重的指纹图像仍然无法识别,另外,算法的运行效率还有待提高。在指纹图像的降噪中:应用中值滤波与小波包变换相结合去除图像随机噪。 关键词:数字图像,指纹处理,小波变换,matlab,指纹识别系统研究 注:本设计(论文)题目来源于教师的国家级(或部级、省级、厅级、市级、校级、企业)科研项目,项目编号为:。

Abstract Fingerprint is unique and stability, and therefore are used as main basis of personal identity. With the rapid development of optical technology, chemical technology, nanotechnology and other disciplines. Fingerprint and extraction technology has made rapid development. But many poor fingerprint effect appeared or extract, is not easy to distinguish the difference between background and object of the main ridge or fingerprint image blur, mainly for the contrast fingerprint system and object background of the weak. Interference, fingerprint by object background two or more fingerprints overlap interference, index Wei curved surface objects like problem etc.. But because of the existence of the fingerprint image noise and the elasticity of the skin and other factors, the fingerprint recognition has been the recognition rate is not high, the low speed problem. Then the difficult identification of fingerprint enhancement processing by using digital image processing technique for fingerprint identification later. This paper summarizes the wavelet transform of digital image processing in the fingerprint images enhancement, two values, fingerprint image compression coding, the fingerprint image thinning, fingerprint image feature extraction algorithm based on direction and technology. In addition the system of automatic fingerprint identification system based on MATLAB software. In the fingerprint image preprocessing, the first block normalization, image unified specifications for the subsequent processing; in the pattern of change, gray gray variance in one direction instead of the Metre method, the equivalent of before asking the direction of point to a mean filtering operation, robustness pattern more so obtained; in the two value, threshold selection by introducing the concept of maximum entropy, the image with noise immunity. But for the fingerprint image noise serious still not recognized, in addition, the efficiency of the algorithm is yet to be improved. In the noise of fingerprint image: application of median filtering and wavelet packet transform combined with random noise removal of images. KEY WORDS:digital image, fingerprint processing, wavelet transform, MATLAB, fingerprint recognition system

(完整版)基于数字图像处理的车牌识别本科毕业论文

本科生毕业论文(设计) 题目: 基于数字图像处理的车牌识别设计 **: *** 学院: 数理与信息工程学院专业: 电子信息工程 班级: 111 学号: 指导教师: 刘纯利职称: 教授

2014 年12 月24 日 安徽科技学院教务处制 目录 摘要 ....................................................................关键词 .................................................................. 1、设计目的 ............................................................. 2、设计原理: ............................................................ 3、设计步骤: ............................................................ 4、实行方案 ............................................................. 4.1. 总体实行方案:................................................... 4.2. 各模块的实现:................................................... 4.2.1输入待处理的原始图像: ....................................... 4.2.2图像的灰度化并绘制直方图: ................................... 4.2.3 边缘检测.................................................... 4.2.4图像的腐蚀操作:............................................ 4.2.5平滑图像.................................................... 4.2.6除去二值图像的小对象 ........................................

基于MATLAB的手写体数字识别算法的实现与分析毕业论文

基于MATLAB的手写体数字识别算法的实现与分析 摘要 手写体数字识别是利用计算机自动辨认手写体阿拉伯数字的一种技术,是光学字符识别技术的一个分支。手写体数字识别在邮政编码、财务报表、银行票据、各种凭证以及调查表格的识别等等方面有着重要应用,由于数字识别经常涉及财会、金融领域,其严格性更是不言而喻的。所以,对识别系统的可靠性和识别率要求很高,构成了手写体数字识别面临的主要困难,大批量数据处理对系统速度又有相当高的要求。 本文基于MNIST数据集,通过Matlab平台,对决策树算法、SVM算法和人工神经网络(ANN)算法进行实现,并对分类算法的准确率进行评估。实验结果表明,人工神经网络(ANN)的准确率最高,为99.69%,SVM算法次之,准确率为94.53%,决策树算法的准确率为83.53%。三种分类算法中,决策树算法的速度最快,SVM算法的速度最慢。另外,针对每一种分类算法在MNIST数据集上的实验结果,本文还得出以下结论: 第一,MNIST数据集的归一化与否对决策树的分类效果几乎没有影响;对SVM的分类效果影响较大,未归一化时的准确率为11.35%,归一化之后的准确率为94.53%;对人工神经网络的分类效果影响较小,未归一化时的准确率为82.11%,归一化之后的准确率为99.69%。这说明三种分类算法对数据的不平衡分布的敏感程度各不相同。 第二,对于SVM分类算法,当训练数据集的样本容量小于60000(MNIST训练数据集的最大样本容量)时,该算法对测试数据集分类预测的准确率随样本容量的增大而增大。 第三,针对人工神经网络,数据类标签的表示形式对分类预测的准确率的影响较大。使用10位数据表示类标签是的准确率为99.69%,远远高于使用1位数据表示类标签时的准确率60.24%。 关键词:手写体数字识别;决策树算法;SVM算法;人工神经网络算法

数字验证码识别的设计与实现-毕业论文

---文档均为word文档,下载后可直接编辑使用亦可打 印--- 摘要]数字验证码在安全方面起着十分大的用处,因此在很多网站都可以看到数字验证码的使用。如今互联网的发展相当快速,紧随着我们也就需要思考安全问题,隐私的泄露会或重或轻的影响用户,而数字验证码作为互联网安全的常用的屏障,可以让互联网生态环境更加健康便利且很好的保护用户隐私。目前,在网站上中相对常用的是由数字、字母组成的数字验证码。 本文针对粘连且存在干扰噪声的数字验证码图像识别性能欠佳的情况,通过比较各种识别数字验证码的方法,最终选择使用KNN算法作为数字验证码字符识别方法,本课题对有粘连扭曲情况的数字验证码的识别进行设计和分析,过程主要是以下三步:预处理、匹配识别、分析识别率。图片预处理过程采用了灰度化、二值化、降噪和分割,在分割图片阶段,可能出现检测出四、三、二和一个字符的情况,分别采用不同的方法进行处理,再采用Python工具进行单字符匹配,最后通过KNN算法来识别匹配数字验证码,得到了高达94.4%的识别率,这说明采用该算法能很好的识别粘连扭曲的数字验证码图片。 [关键词]验证码识别;KNN算法;验证码匹配;Python Design and Implementation of Digital Authentication

Code Recognition Student: Li Xinyu,College of Electronic Information Instructor: Wang Yuanmei,College of Electronic Information [Abstract]Digital Authentication Code (DAC) plays a very important role in security, so it can be used in many websites.With the rapid development of the Internet, we also need to think about security issues. The leak of privacy will affect users more or less. Digital Authentication Code, as a common barrier to Internet security, can make the Internet ecological environment healthier, more convenient and better protect user privacy.At present, the relatively common digital verification code on websites is composed of numbers and letters. In view of the poor performance of image recognition of digital verification codes with glue and interference noise, this paper chooses KNN algorithm as the character recognition method of digital verification codes by comparing various methods of identifying digital verification codes. This topic designs and analyzes the recognition of digital verification codes with glue distortion. The process mainly consists of three steps:preprocessing,Match recognition, analyze recognition rate.Picture preprocessing process uses grayscale, binarization, noise reduction and segmentation. In the phase of image segmentation, four, three, two and one characters may be detected. Different methods are used to process them, then single character matching is performed with Python tools. Finally, matching number verification codes are recognized by KNN algorithm, and the recognition rate is up to 94.4%.This demonstrates that the algorithm can recognize the distorted digital authentication code picture very well. [Keywords]Verification code identification;KNN recognition;Verification Code Matching;Python 第一章绪论

(完整版)手写体数字识别系统设计毕业设计

石河子大学 信息科学与技术学院毕业论文 课题名称:手写体数字识别系统设计 学生姓名: 学号: 学院:信息科学与技术学院

专业年级:电子信息工程2007级指导教师: 职称: 完成日期:二○一一年六月十一日

手写体数字识别系统设计 学生: 指导教师: [摘要] 随着科学技术的迅速发展,在邮政编码、统计报表、财务报表、银行票据等处理大量字符信息录入的场合,手写数字识别系统的应用需求越来越强烈,如何将数字方便、快速地输入到计算机中已成为关系到计算机技术普及的关键问题。本文设计实现了一个基于Matlab软件的手写体数字识别系统,采用模块化设计方法,编写了摄像头输入、直接读取图片、写字板输入三个模块,利用摄像头等工具,将以文本形式存在的手写体数字输入进计算机,完成对手写体数字图片的采集,并设计了一种手写数字识别方法,对手写体数字图像进行预处理、结构特征提取、分类识别,最终以文本形式输出数字,从而实现手写体数字的识别。 [关键词] 预处理,结构特征提取,分类识别,手写体数字识别

Handwritten Digit Recognition System Students: Teacher:

Abstract:With the rapid development of science and technology, in zip code, statistics, reports, financial statements, Bank bills dealing with a large number of characters, such as information recorded occasions, handwritten digit recognition system of requirement has become stronger and stronger, how easily and quickly the number entered in the computer has become a key issue relates to the popularization of computer technology. This article design implementation has a based on Matlab software of handwriting body digital recognition system, used module of design method, write has camera entered, and directly read pictures, and write Board entered three a module, using camera, tools, will to text form exists of handwriting body digital entered into computer, completed on handwriting body digital pictures of collection, and design has a handwriting digital recognition method, on handwriting body digital image for pretreatment, and structure features extraction, and classification recognition, eventually to text form output digital, to implementation handwriting body digital of recognition. Key words: Pretreatment, structure feature extraction, classification and recognition, handwritten digit recognition.

开题报告-基于SVM的手写数字识别的应用与实现

毕业设计开题报告 计算机科学与技术 基于SVM的手写数字识别的应用与实现 一、综述本课题国内外研究动态,说明选题的依据和意义 阿拉伯数字作为唯一被世界各国通用的符号,是人类文明发展的标志之一,也是人类交流沟通的主要媒介。在人们日常生活当中,离不开数字的使用,我们每天都要进行大量的数字工作处理,比如邮政编码、统计报表、财务报表、银行汇款转账等等,如此繁琐的数字工作处理占去了我们很大一部分时间,空间。而对于,计算机大范围普及,人工智能高度发展的当今社会,利用手写数字识别系统代替人们进行这样繁重的手工劳动,备受国内外人士的高度重视。 由于手写数字识别本身的一些特点,对它的研究有及其重要的理论价值: ⑴阿拉伯数字是唯一被世界各国通用的符号,对手写体数字识别的研究基本上与文化背景无关,各地的研究工作者基于同一平台开展工作,有利于研究的比较和探讨。 ⑵手写数字识别应用广泛,如邮政编码自动识别,税表系统和银行支票自动处理等。这些工作以前需要大量的手工录入,投入的人力物力较多,劳动强度较大。手写数字识别的研究适应了无纸化办公的需要,能大大提高工作效率。 ⑶由于数字类别只有10个,较其他字符识别率较高,可用于验证新的理论和做深入的分析研究。许多机器学习和模式识别领域的新理论和算法都是先用手写数字识别进行检验,验证理论的有效性,然后才应用到更复杂的领域当中。这方面的典型例子就是人工神经网络和支持向量机(Support Vector Machine)。 ⑷手写数字的识别方法很容易推广到其它一些相关问题,如对英文之类拼音文字的识别。事实上,很多学者就是把数字和英文字母的识别放在一起研究的。 手写数字识别的一般原理为:首先把数字图像经过预处理,然后得到的数据进行特征提取或不用进行特征提取就可以直接输入识别器进行识别得到结果。手写数字识别的预处理通常包括数字图像的二值化处理、细化处理等步骤。数字图像的二值化处理是将上一步骤所得到的灰度数字图像转化为二值数字图像,即在数字图像中区分出字符和背景。二值化处理方法很多,但考虑到大量数字识别的需要,一般只能采用一维的阈值分割算法进行处理以获得二值化数字图像,预处理技术在当前比较成熟。 基于SVM的手写数字识别系统主要是利用支持向量机在识别领域良好的识别性能。对于一个完整的识别系统应包括从图像采集到得出识别结果的过程,由于本系统主要是用来检验支持向量机在手写数字识别系统中的应用,所以在本系统中图像采集、样本预处理等就不在

【论文】基于MATLAB的手写体数字识别算法的实现与分析毕业论文

【关键字】论文 基于MATLAB的手写体数字识别算法的实现与分析 摘要 手写体数字识别是利用计算机自动辨认手写体阿拉伯数字的一种技术,是光学字符识别技术的一个分支。手写体数字识别在邮政编码、财务报表、银行票据、各种凭证以及调查表格的识别等等方面有着重要应用,由于数字识别经常涉及财会、金融领域,其严格性更是不言而喻的。所以,对识别系统的可靠性和识别率要求很高,构成了手写体数字识别面临的主要困难,大批量数据处理对系统速度又有相当高的要求。 本文基于MNIST数据集,通过Matlab平台,对决策树算法、SVM算法和人工神经网络(ANN)算法进行实现,并对分类算法的准确率进行评估。实验结果表明,人工神经网络(ANN)的准确率最高,为99.69%,SVM算法次之,准确率为94.53%,决策树算法的准确率为83.53%。三种分类算法中,决策树算法的速度最快,SVM算法的速度最慢。另外,针对每一种分类算法在MNIST数据集上的实验结果,本文还得出以下结论: 第一,MNIST数据集的归一化与否对决策树的分类效果几乎没有影响;对SVM的分类效果影响较大,未归一化时的准确率为11.35%,归一化之后的准确率为94.53%;对人工神经网络的分类效果影响较小,未归一化时的准确率为82.11%,归一化之后的准确率为99.69%。这说明三种分类算法对数据的不平衡分布的敏感程度各不相同。 第二,对于SVM分类算法,当训练数据集的样本容量小于60000(MNIST训练数据集的最大样本容量)时,该算法对尝试数据集分类预测的准确率随样本容量的增大而增大。 第三,针对人工神经网络,数据类标签的表示形式对分类预测的准确率的影响较大。使用10位数据表示类标签是的准确率为99.69%,远远高于使用1位数据表示类标签时的准确率60.24%。 关键词:手写体数字识别;决策树算法;SVM算法;人工神经网络算法 ABSTRACT Handwritten numeral recognition is a technique that uses computer to recognize handwritten Arabic numerals automatically and is a branch of optical character recognition technology. Handwritten numeral recognition has important applications in postal codes, financial statements, bank notes, various kinds of vouchers and the identification of survey forms. Since digital identification often involves accounting and finance, its strictness is self-evident. The demand for identification system of the reliability and recognition rate is very high, constituting a handwritten

图像处理与识别技术与应用 毕业论文

图像处理与识别技术与应用 摘要 随着科学技术的发展,数字图像处理技术得到了空前的发展,被广泛应用于众多的科学与工程领域。可以说人们生产、工作和生活方式的方方面面都离不开数字图像处理技术。本文通过对数字图像处理技术主要内容的概述来宏观地了解数字图像处理技术。 关键词:数字图像处理,增强,恢复,压缩,分割,信息,码,变换 目录 1引言 (1)

中北大学继续教育学院2013届专科毕业论文 2 图像的基本概念 (1) 2.1 图像的定义 (1) 2.2 图像的表示: (1) 2.3 图像的分类: (1) 3 颜色模型 (2) 3.1 颜色的三要素:色调:反映颜色的类别,如红色、绿色、蓝色等 (2) 3.2 常见模型: (2) 3.2.1 RGB模型 (2) 3.2.2 HIS模型 (2) 3.3.3 CMY模型 (2) 4 数字图像处理 (2) 4.1 数字图像处理系统基本组成 (2) 4.2 图像变换 (3) 4.2.1 傅立叶变换 (3) 4.2.2 其他常见变换概述 (4) 4.3 数字图像处理内容 (4) 4.3.1 图像增强 (4) 4.3.2 图像恢复 (5) 4.3.3 图像压缩 (5) 4.3.4 图像分割 (6) 5 结束语 (6) 参考文献 (7) 致谢 (8)

1引言 也许以前对图像处理仅仅停留在把模糊的图像清晰化的理解上,通过以上内容的学习,我们可以比较全面地了解图像处理的主要内容。我们可以知道数字图像处理技术绝不是一种简单的手工技术,它是一种应用了数学、计算机等多学科知识的技术。 2 图像的基本概念 2.1 图像的定义 信号是信息的载体。更一般的意义上说,信号可以视为是指标空间d∈D到值空间u ∈U的映射f。而图像则可以定义为一个映射,其值空间为亮度(包括颜色),其指标空间由位置、时间、波长等组成。 2.2 图像的表示: 二维图像可以用二维亮度函数来表示。由于光是能量的一种表现形式,所以图像的亮度可以表示为(,) =, I f x y 式中I为图像的亮度,(,) ≤<+∞。 x y是坐标。显然0(,) f x y 光学图像一般是由物体表面反射的光形成的。虽然投射光也可以形成图像,但是没有特别说明时,一般指反射光形成的图像。(,) f x y可以看成是由所看到的景物上入射光量及物体对光的反射系数共同确定的。如果用(,) r x y来表示反 i x y表示入射分量,用(,) 射系数,那么(,)(,)(,) ≤<+∞≤≤。 i x y r x y ==*, 其中0(,),0(,)1 I f x y i x y r x y 全吸收时,r为0;全反射时r为1。这里(,) r x y i x y是由光源的性质来决定的,而(,)取决于被照的物体。 2.3 图像的分类: 2.3.1 根据指标空间D中元素d的连续与离散性可以分为连续图像和离散图像。 2.3.2 根据与时间有无关系可以分为静止图像和运动图像。 2.3.3 根据有无颜色信息可以分为灰度图像和彩色图像。

数字识别论文

保密类别编号 毕业论文 数字识别实现 学院计算机学院 专业软件工程 班级2班 姓名王茜 指导教师黄祥林 中国传媒大学 年月日

数字识别实现 王茜 摘要 在信息化飞速发展的时代,光学字符识别是一种重要的信息录入与信息转化的手段。数字识别作为光学字符识别中的一个分支,在车牌识别、邮政编码识别、统计报中等领域有着非常广泛的应用,用数字识别系统代替手工录入,可节约大量的人力和财力。因此,数字识别的研究有着重大的现实意义。 本文主要研究的即数字识别问题。首先,对数字图像的预处理工作进行了详细的介绍,其中包括:二值化、字符切分、归一化等。接着介绍了当前数字识别的几种常用方法。然后重点描述了用于印刷体数字识别的模板匹配法和基于整体特征的快速手写体数字识别法的原理,并给出了算法实现的过程。 实验结果证明,上述算法能取得较好的识别效果。 关键词:数字识别,图像预处理,模板匹配,整体特征

Xi. Wang ABSTRACT OCR (Optical Character Recognition) has become one of the important methods in gathering information and information transformation. Digit recognition has a promising business feature in many fields in society, for example the car license plate recognition、postcode recognition, the statistics of report forms, financial report forms. So the researching on the Digit recognition is one of the important things. The paper describes the basic process and methods of numeral recognition system. First, Keywords: Numeral recognition \

手写数字识别算法开题报告

手写数字识别算法开题报告 手写数字识别算法开题报告 一、引言 手写数字识别是计算机视觉领域中的一个重要任务,其应用广泛,包括自动邮件分拣、手写数字识别验证码等。本文旨在研究和设计一种高效准确的手写数字识别算法,以提高数字识别的准确性和效率。 二、问题陈述 手写数字识别算法的目标是将手写数字图像转化为对应的数字类别。然而,由于手写数字的多样性和复杂性,识别准确率和效率仍然是一个挑战。因此,本文将重点研究以下问题: 1. 如何提取手写数字图像的特征,以便进行数字分类? 2. 如何选择合适的分类器,以提高数字识别的准确性? 3. 如何优化算法,以提高数字识别的效率? 三、研究方法 本文将采用以下方法来解决上述问题: 1. 特征提取:通过分析手写数字图像的像素分布、轮廓和灰度等特征,提取出能够表征数字特征的数值。 2. 分类器选择:比较常用的分类器,如支持向量机、K近邻算法和深度学习算法等,选择最适合手写数字识别的分类器。 3. 算法优化:通过优化特征提取和分类器参数调优,提高数字识别的准确性,并通过并行计算等方法提高算法的效率。 四、预期成果

本文预期将设计并实现一个准确性较高、效率较高的手写数字识别算法。具体 成果包括: 1. 提出一种新颖的手写数字特征提取方法,能够有效地表征数字图像的特征。 2. 选择最适合手写数字识别的分类器,并通过调优参数提高分类准确性。 3. 通过算法优化,提高数字识别的效率,使得算法能够在实时场景中应用。 五、研究计划 1. 数据收集:收集大量手写数字图像数据集,包括不同风格和难度的手写数字。 2. 特征提取:分析手写数字图像的特征,设计合适的特征提取方法,并实现特 征提取算法。 3. 分类器选择:比较不同分类器的性能,选择最适合手写数字识别的分类器, 并实现分类器算法。 4. 算法优化:通过调优特征提取和分类器参数,提高数字识别的准确性,并实 现算法优化方法。 5. 实验评估:使用收集的手写数字图像数据集,评估算法的准确性和效率,并 与现有方法进行对比。 6. 结果分析:分析实验结果,总结算法的优势和不足,并提出改进方案。 7. 论文撰写:根据研究结果撰写论文,并进行修改和完善。 六、研究意义 手写数字识别算法在现实生活中有着广泛的应用。通过研究和设计高效准确的 手写数字识别算法,可以提高自动邮件分拣的准确性和效率,提升验证码的安 全性,促进数字化办公的发展等。同时,本研究还可以为计算机视觉领域的相 关研究提供借鉴和参考。

关于身份证的数字编码小论文300

关于身份证的数字编码小论文300 今天,爸爸妈妈都上班,留我一个人在家写作业。爸爸临走前告诉我,做半小时作业后要休息一会儿,注意保护眼睛,我答应了。 30分钟很快就过去了,我停了下来,看看远处,在家里走走,走着走着,我突然发现爸爸的身份证放在茶几上。我很好奇,于是,拿起爸爸的身份证研究起来。 我发现,身份证的正面由姓名。性别。名族。出生年月日。住址。身份证号码和照片组成,背面还有“签发机关”“有效期限”等字样。 令我最不能理解的是身份证号码——那一大串数字和身份证的有效期限。 身份证号码是由18位数字组成的,全中国有13多亿人口,是怎样做到没有一个重复号码的呢?我一头雾水。于是我打开了我的“百事通”——电脑。认真查阅起来。 原来,身份证的号码是有规律的。前1~16位数字为地区代码,其中第1。2位数字是各省级政府的代码,第3。4位数字是地。市级政府的代码,第5。6位数字是县。区级政府代码;第7~14位数字是出生年月日的代码;第15~17位数字是顺序码,是县。区级政府所辖派出所的分配码,第17位顺序码的奇数分配给男性,偶数分配给女性;第18位数字是识别码,通过复杂的公式算出,普遍用计算机自动生成。

解决了一个问题,另一个问题有涌上心头。 有效期限是什么?难道身份证也有不能用的时候?正当我茫然的时候,爸爸回来了。爸爸知道了我的困惑,他道出了这其中的奥秘:“人在成长的过程中,相貌会发生变化。人越小,变化就越快;人老了,相貌就会定型。所以,16周岁至25周岁的公民发给有效期限10年的居民身份证,26周岁至45周岁的公民发给有效期限20年的居民身份证,46周岁以上的公民发给长期有效的居民身份证。”爸爸的一番话,让我明白了一切。 一张小小的身份证都蕴含着这么多知识,在我们的生活中一定有更多的知识。

相关主题