搜档网
当前位置:搜档网 › 脱机手写体汉字识别综述

脱机手写体汉字识别综述

脱机手写体汉字识别综述
脱机手写体汉字识别综述

脱机手写体汉字识别综述

摘要: 脱机手写体汉字识别是模式识别领域最具挑战性的课题之一.本文分析了近年来脱机手写体汉字识别的最新进展,讨论了脱机手写体汉字分割、特征提取和分类器设计等关键技术的各种主流方法,介绍了3种典型的汉字识别数据库,并提出了脱机手写体汉字识别的难点问题和今后发展的趋势,为该领域的研究者指明研究方向,共同促进脱机手写体汉字识别技术的发展.

关键词: 脱机手写体汉字识别;字符分割;特征提取;分类器设计;

1 引言

汉字识别是模式识别的一个重要分支,也是文字识别领域最为困难的问题之一,它涉及模式识别、图像处理、统计理论等学科,呈现出综合性的特点,在办公和教学自动化、银行票据自动识别、邮政自动分拣、少数民族语言文字信息处理等技术领域,都有着重要的理论意义和实用价值[1].汉字识别技术可分为印刷体和手写体汉字识别两大类.手写体汉字识别又可分为联机(on2line)和脱机(off2line)手写体汉字识别.脱机手写体汉字识别可分为受限和非受限两种情况,如图1所示.

清华大学、中科院自动化所等著名高校和科研院所都致力于汉字识别的研究,以汉王科技股份有限公司为首的科技企业也推出了一系列成熟的商业产品[2].目前,很多论文提出的脱机手写体汉字识别的方法在不同的字符数据库试验中,取得了95%~99%的识别率,但是对真正的手写文档的识别效果却难以达到实际应用的要求.目前脱机手写体汉字识别仍处于实验室研究阶段,成功的商业产品仍未发布[2~4].本文着重讨论脱机手写体汉字识别的现状和存在的问题,明确今后的发展趋势,为脱机手写体汉字识别领域的广大研究人员提供参考和借鉴.

2 手写汉字字体特点

从识别的角度分析,汉字具有如下4个特点.

2.1 汉字类别多

汉字的个数很多,国家标准GB1803022000《信息交换用汉字编码字符集基本集的扩充》收录27484个汉字[5].汉字个数在模式识别问题中体现为汉字的类别,因此汉字识别问题属于超大规模数据集的模式识别问题.

2.2 字体结构复杂

汉字基本笔画(stroke)分为:横、竖、撇、点、折[6].笔画的组合方式分为相离、相接和相交三种.特征结构笔画和相应笔画的组合方式在以笔画为特征的汉字识别中起到关键作用.

汉字的组合方式包括独体字和合体字.合体字又包括上下结构、左右结构、品字结构等多种结构.以部件(radical)为基础的手写体汉字识别中,需根据汉字的组合方式对已提取的部件进行重新组合.

2.3 字形变化多

手写体汉字字形总的来说可以分为:手写印刷体(hand2printfashionscripts)、行书(fluentscripts)和草书(cursivescripts).对于相同的字形又因不同人书写风格的差异造成手写汉字的变形.脱机手写汉字在日常生活中以行书为主.对于行书和草书等笔迹相连的情况,字符分割是识别的关键环节,如果出现分割错误,将影响后续识别结果的精度.

2.4 相似字多

汉字集合中相似字较多,由于手写体汉字变形的存在,使得手写体中相似字的区分比印刷体要困难得多[1].比如,在手写体中的一点,可能会因为不当的预处理而消失,从而造成字符的误识.因此要求预处理方法能够针对手写汉字的特点,做到尽量不丢失笔画信息.在识别过程中,对于相似的字体,可以采用更精确的细分类过程进行鉴别.在识别后处理阶段,通常采用相似字符集作为候选字符集的主体.

3 识别过程

对于脱机手写体汉字识别而言,其识别过程通常如图2所示.

原始的手写文稿通过扫描仪等OCR(OpticalCharac2terRecognition)设备,转换成灰度图像或者二值图像,并进行预处理.字符特征分为统计和结构特征两种模式.识别阶段,根据提取的特征,选择相应的分类器及其组合形式进行模式分类.识别后处理根据前后文字的上下文关系选择最合乎逻辑的字词,能进一步提高识别准确率,最后输出分类结果.

4 图像预处理

很多图像处理技术可以应用于脱机手写体汉字图像,包括:(对灰度图像)二值化、

(对二值图像)伪灰度化、去噪、骨架化、边缘提取、倾斜矫正等.本节主要介绍字符图像分割的关键技术和方法.

基于切分的汉字识别方法是目前汉字识别的主流方法.汉字的分割通常首先对整篇文档做行切分,再在行分割的基础上进行单个字符的分割.图3显示了手写体汉字分割处理的一般流程只有当每一单个字符的图像都能正确地从整个文本页面图像中分割出来,才有可能进行正确的文字识别[5].然而,手写体汉字的书写随意性很大,相邻汉字之间的位置关系也复杂多样.手写体汉字的书写可能产生如下4种基本位置排列情况[7,8],如图4所示.

(1)正常:汉字各自分开独立为整体;单个汉字中各个部件间的距离远小于字间距离.

(2)粘连:汉字的某一笔在一点或几点与相邻汉字接触;

(3)重叠:汉字间无接触,但无法用垂直分割线分割;

(4)过分:汉字左右部分间距过大或汉字内部出现笔画断裂.

真实手写文档上述情况往往同时出现,这是造成无法正确分割汉字的主要因素,对这种手写体汉字的切分是今后研究的重点和难点问题[8].

目前手写体汉字分割广泛采用的方法如下:

4.1 投影法

投影法(ProjectProfileHistogram,PPH)通过统计图像中每一列(行)黑像素的个数得到投影直方图.在直方图中字符区域对应于波峰,字符间隔对应于波谷.投影法简单,速度快,对印刷体汉字和手写印刷体汉字的分割有相当好的效果,但是会将粘连或重叠的字符识别为一个字符,出现弱分割现象;或将过分字符识别为若干字符,产生过分割现象.

4.2 连通域分析法

连通域分析法[8](ConnectedComponentAnalysis,CCA)是在整个字符图像中寻找相连的像素作为连通元,分析这些连通元本身的图像属性,判断它们是否属于同一个字符图像,然后利用先验知识对它们进行拆分和合并.连通域分析法对于重叠字符和倾斜字符能够取得理想的分割效果.但使用该方法时连通元容易过碎,使严重断裂的字符图像无法重新合并,真正粘连的字符也不能通过连通元切分开,需在后续的识别模块中加入粘连字符模板或者通过其它方法进行再切分.

4.3 Viterbi算法

字符分割路径可视为一个自上而下的m层单向图,建立一个隐马尔可夫模型(HiddenMarkovModel,HMM)来表示该有向图[8,9].图中的每个节点对应隐含状态,有向边表示状态的转移方向,用节点轨迹组成观测序列,其概率分布为分割路径穿过结点的几率大小,m 是观测序列的长度.采用Viterbi算法[10~12]

寻求分割路径,相当于在图中沿着有向边方向找出所有路径中的最大概率者,组成顺向首尾相接的一串有向边的集合,即得到非线性的分割路径.Viterbi算法对于交错、单处笔划粘连等字符能够得到较好的分割效果,但并未从根本上解决多种粘连方式的分割问题.

4.4 基于识别的方法

将字符分割与识别截然分开,分割将是手写体汉字识别误差的主要来源,基于识别的统计分割方法是汉字分割的新出路[5].基于识别的方法首先将字符分成若干组成部分,并采用合并策略在多条候选的合并路径中通过识别结果选择一条最佳路径[13,14].基于识别的字符分割方法通过识别模块来指导切分,识别结果对分割起着决定性的作用,分割是识别的副产品[9],分割结果依赖于识别分类器的性能[13].

图像预处理会给字符图像带来干扰或形变,引入新的误差.改进的二值化、细线化、字符归一化、字符分割等图像预处理算法[15~17],能够减少预处理带来的字体变形等不利影响,但不能从根本上解决预处理带来的干扰.由于目前尚不能完全实现字符的正确分割,所以,对于基于分割的脱机手写体汉字识别,字符分割的精度直接决定后续汉字识别的精度,是手写体识别系统精度的瓶颈.文献[18]提出了一种无分割的手写体汉字识别方法,并通过实验证明了该方法的可行性.这种方法实质上是对文本进行行分割,再在行分割的基础上提取字符特征,而非精确到单个字符的分割.行分割相对字符分割简单,计算量小,引入误差更小.无分割脱机手写体汉字识别更符合人类识别字符的习惯,将是未来汉字手写体识别的新趋势.

5 特征提取

手写体汉字识别特征提取方法可分为基于结构特征、统计特征和将结构特征和统计特征相融合的方法.

5.1 结构特征

结构特征是汉字识别研究初期的主流方法,需要先抽取结构基本单元,再由这些基本单元构成来描述汉字特征.结构特征比较直观,符合人们书写汉字的过程,能较好地反映汉字的结构特性;缺点是对结构基本单元提取困难,各结构元素之间的拓扑关系复杂,抗干扰性较差.同时,由于汉字的结构特征通常都要利用细化算法提取,不仅计算量大而且会出现形变问题,给汉字识别带来新的噪声影响.

5.1.1 基于特征点

特征点是反映汉字形体特征整体分布状况的关键点.通常对大多数结构稳定的汉字,一旦获得了正确的特征点集,就可能顺利地按一定的策略和步骤(连接笔划、结构匹配等)将汉字形体划归为正确的字类.根据不同的研究思路,研究人员对特征点的定义也不尽相同。

5.1.2 基于笔画

一个汉字区分于其它汉字的主要特征就是笔画及其所在的位置,“横”、“竖”、“撇”、“捺”四种笔画的数量及其相对位置唯一地确定了一个汉字[22].基于笔画的特征提取方法将字符分解成笔画,并根据笔画的数量、顺序和位置进行识别[23~26].“横”、“竖”、“撇”、“捺”是构成汉字的四种基本笔画,所占比重大,并且提取容易,因而在识别系统中常采用它们作为识别特征.

5.1.3 基于部件

部件是一个居于笔画和单字之间的中间层次,相当于西文的字母.把若干个部件按照一定规则加以组合就可构成方块汉字.我国语言文字工作委员会对GB130001字符集中的20902个汉字逐个进行拆分、归纳与统计后,制定《汉字基础部件表》,共有560个可供独立使用的部件.这560种部件并不都适用于汉字识别,

通常从中选用若干部件作为识别特征[27].文献[28]提出的基于部件的汉字分解示意图,如图5所示.图中的4个汉字具有相同的3个部件,可根据最后一级分解部件来进行识别

5.2 统计特征

统计特征一般针对单个汉字,即整字(Holistic),提取方便,抗干扰能力强.文献[5]指出,汉字结构的复杂,在统计识别方法中,不仅不是缺点,而且使得汉字具有比其他西方文字具有更强的鉴别能力,不仅可以识别成千上万个超多类汉字,而且具有高抗干扰和高鲁棒识别性能,这是结构分析方法无法达到的.统计特征的缺点是没有充分利用汉字的结构信息.本节针对脱机手写体汉字主流的统计特征方法进行介绍.

5.2.1 弹性网格特征

弹性网格特征(ElasticMesh,EM)用一种弹性网格将汉字图像分块,对每一块内的像素进行变换或者分析后产生特征向量[29~32].对字符进行弹性网络的划分能有效地反映汉字的结构细节和字符的共同特征,避免手写体汉字中因个人书写风格差异引起的字体变形和因数据采集、非线性变换等因素导致的样本变形等问题.但该方法各个块之间互不关联,不能体现汉字的整体结构信息.5.2.2 方向线素特征

方向线素特征(DirectionalElementFeature,DEF)首先抽取汉字的轮廓,并考察轮廓点像素的8邻域内的黑像素点在水平、垂直、+45°、-45°四个方向上的分布情况.如有符合四个方向上的任一种情况,则该像素对应方向上的方向线素值加一个常数[33~35].方向线素特征同时反映了字符的结构和统计特征,比较全面地代表图像信息,是汉字识别领域一种成熟的特征提取方法.但方向线素特征的特征维数多,在进行特征匹配之前要对特征向量进行降维处理,增加了识别算法的复杂度.5.2.3 Gabor特征

Gabor滤波器是窄带带通滤波器,有明显的方向选择和频率选择特性,能在空域和时域同时达到最优联

合分辨率[31],因此Gabor滤波器在脱机手写体汉字识别中提取特征方面得到了广泛应用[36~38].Gabor变换提取汉字特征充分反映了笔画结构在空间上的局域性,笔画的方向性以及在频域上笔画与干扰的可分性等重要特性,提高了识别算法的鲁棒性和对细节的分辨率.Gabor滤波器缺点在于特征提取时间较长且提取的特征数据存在冗余性,需通过主成分分析等方法进行压缩.5.2.4 矩特征

脱机手写体汉字识别中采用Hu不变矩、Legendre矩、Zernike矩、Krawtchouk矩、小波矩[3946].Hu矩为非正交矩,含有大量冗余信息.正交矩对模式具有位移、旋转和变换不变性,在应用中最具代表性的是Legendre矩

和Zernike矩.CHO2HUAKTHE和ROLANDT.CHIN[47]

对Legendre矩和Zernike矩在噪声敏感性、信息冗余和图像表示能力三方面进行了实验对比和理论分析,结论表明Zernike矩的效果在各方面都优于Legendre矩.Zernike矩可以任意构造高价矩,因而包含更全面的图像信息,所以Zernike矩识别效果更好.与Zernike矩和Legendre

矩等连续正交矩特征相比,Krawtchouk矩是数字域的离散正交矩,不存在数字化过程中所带来的近似误差问题,在计算过程中不需要进行坐标转换,而且构造简单,更加适合用来描述数字图像[46].小波矩能同时得到图像的全局特征和局部特征,因而在识别相似形状的物体时有更高的识别率[48,49].

对于手写体汉字识别,单独运用结构特征和统计特征中的任何一种单一的特征,必然存在识别的盲区.将汉字结构特征和统计特征等多种特征相结合,可以实现各种特征的优势互补,能够更全面地反映汉字的特征.特征融合后的脱机手写体汉字通常具有多维的特征,增加了识别算法的计算复杂度,因此普遍采用PCA,LDA和FDA等方法[50~52]对特征向量进行降维处理后再送入分类器分类.多特征融合的方法成为手写体汉字识别特征提取的主流方法[53~56],是未来发展的必然趋势.如果能够借鉴相关领域的研究成果,引入更适于手写体汉字的特征描述方法,特别是能够直接从原始字符图像提取的特征,将简化图像预处理步骤,减少因预处理带来的误差,进一步提高脱机手写体汉字的识别精度.6 分类器设计

手写体汉字识别的对象是几千个(种)汉字,脱机手写体汉字识别常用的分类器可分为单分类器和多分类器集成两种.多分类器集成的方法是目前的主流技术,同时也是未来的发展趋势.

6.1 单分类器

6.1.1 改进的二次判别函数

改进的二次判别函数(ModifiedQuadraticDiscrimina2tionFunction,MQDF)分类器以一个Gauss 分布去描述每个类的样本分布,直接采用常数代替偏小特征值,有效地缓解了小特征值估计误差所带来的系统性能下降[5].基于统计模型的MQDF分类器便于设计与实现,且具有很好的鲁棒性和较高的识别准确率,因此在脱机手写体汉字识别中得到广泛的应用[57,58].

6.1.2 支持向量机

支持向量机(SupportVectorMachine,SVM)根据Vap2nik提出的结构风险最小化原理,通过最大化分类间隔,使学习机的泛化性能尽量提高,其优越性在理论和实验方面都得到了深入地研究和验证.SVM是一个两类问题的判别方法,在对多类问题实现分类时,采用一对一、一对多、SVM决策树和有向无环图支持向量等分解策略,因此SVM的计算复杂度和时间复杂度较大,一般不用于直接分类[52].针对这个问题,目前研究者[15,59~63]提出了如下解决方法:(1)采用SVM作细分类;(2)将大规模字符集划分成小的子集;(3)采用多种SVM算法的改进形式.引入各种改进的快速SVM多分类算法[64~66]到脱机手写体汉字识别领域中,也能够提高识别的速度.

6.1.3 人工神经网络

人工神经网络(ArtificialNeuralNetwork,ANN)具有并行处理、自组织、自适应和学习能力,被广泛的应用于脱机手写体汉字识别领域,包括:BP网络[67]、多层感

知器网络、模块径向基神经网络[50]

、自适应振荡神经网络[68,69]、Hopfield网络、自组织特征映射网络等[1].ANN用于大字符集分类时,训练时间和分类时间太长,一般不用于直接分类[52].文献[70]针对这个问题,提出了在预分类结果的基础上,采用简化的样本集对ANN进行训练的策略,在不降低识别效果的基础上,大大缩短了ANN在大样本集上的收敛时间.

6.1.4 隐马尔科夫模型

常用的统计语言模型是建立在将文本语言看作为字或词的不同阶的马尔可夫链的基础上,语言相关模型的参数可以通过大型语料库的学习而获得.语言模型和单字识别结果的可信度结合,利用Viterbi算法,获得在考虑上下文信息的语言模型条件下的最优文本识别结果.由于实际资源的限制,实际系统中往往采用字或词的一阶或二阶马尔科夫模型[71,72].隐马尔科夫模型适合于大规模分类,缺点是尚缺乏公认权威的语言模型.目前广泛应用的是对某种特定领域

进行小规模的建模,如邮政地址系统,银行手写支票金额的模型.

6.2 多分类器集成

多分类器集成算法通过特定的组合方式,能够对单分类器取长补短,发挥各个组成分类器的最大优势.

多分类器集成算法中每一个组成的分类器称为元分类器,可以采用611节介绍的任何一种单分类器的形式.集成算法根据其结构可分为串行和并行结构两类.6.2.1 串行结构

串行结构的集成算法[73]是根据汉字识别特点对整个识别过程进行分级,或分阶段处理.前一级的输出结果是后一级的输入,后一级识别是对前一级识别的细化和延续,实现多特征多方法的互补以及多识别级间信息的利用,以进一步提高汉字识别率.6.2.2 并行结构

并行结构的集成算法首先构造多个分类器,这些分类器基于不同特征、不同分类器形式或是不同训练样本集合,每个分类器独立训练,相互之间没有影响.针对各分类器的输出结果,采取一定的规则进行融合或表决,得到最终的输出结果.常用的表决策略有投票法、D2S(Dempster2Shafer)法、行为知识空间法、综合集成法、基于置信度的神经网络集成法等[1].从模式识别的观点来说,汉字识别是一种超多类的模式集合,已有的适用于模式类别较少的识别方法和理论已不完全适用[27].应选择针对大规模数据集的分类方法或者对汉字类别进行合理的划分,以适应目前的分类方法.采用结合了串、并行结构的混合结构多分类器集成对脱机手写体汉字进行分类是未来的发展趋势.串行分类器具有分类递进,后级分类器能够弥补前一级识别的不足,实现细节上的互补的优点;并行分类器能够在全局的分类器输出结果间取得整体上的平衡.因此,采用混合结构的多分类器集成策略,能够实现细节与整体上的双保险,从而提高脱机手写体汉字识别的精度.7 数据库

建立手写汉字数据库是研究和开发手写汉字识别技术的基础.目前国内外一些研究团体已建立并公开了大规模的字符识别数据库.脱机手写体汉字识别的结果在这些数据库上实验,更有利于公正客观地对比实验结果,促进汉字识别技术研究的深入与发展.目前,具有典型代表性的数据库有以下几种.7.1 ETL字符数据库

ETL字符数据库由日本电子工业发展协会(JapanElectronicIndustryDevelopmentAssociation,现在的Japanelectronicsandinformationtechnologyindustriesassociation)、大学和研究机构联合协助的电工技术实验室(Elec2trotechnicalLaboratory,现在的Tsukubacentral2,national instituteofadvancedindustrialscienceandtechnology,AIST)

收集[74].ETL数据库包含了120万手写和机器印刷字符图片,涵盖了用于识别研究的日文,中文,拉丁文和数字字符.数据库图片分别有60×60,64×63,72×76,和128×127不同像素规格.字符图片文件包含不止一个记录,每个记录有一个字符图片和对应的ID信息的编

码.该数据库不包含书写者信息.图6是ETL8中的字符样本[24]和ETL9B数据库中的部分字符[56].

7.2 HCL2000数据库

HCL2000数据库[75]是由北京邮电大学信息工程系在国家863计划的资助下研发的一个大规模脱机手写汉字数据库系统.该数据库面向一级汉字,包含了3755×1300个手写汉字样本和1300个书写者的个人信息,可实现汉字样本信息和书写者信息间的互查,为研究各类人员的文字书写特征及影响识别率的相关因素提供了方便.每个汉字样本采用64×64个二值像素描述,占用512字节.书写者信息除书写者标识信息外,还包括性别、年龄、职业、文化程度、书写工具等.图7是两幅

来自于HCL2000数据库[76]

的字符图片,编号分别为Hh451和Hh453.HCL2000数据库是目前我国汉字识别领域被广泛采用的数据库.

7.3 HIT2MW数据库

HIT2MW数据库[3,18]由哈尔滨工业大学计算机科学与技术学院开发.该库由780多个书写者在无监督的情况(无监督情况是指书写参与者与数据库收集者并不发生正面接触,而是通过邮寄等方式将数据库页面交与书写者,书写者按照自己习惯的书写规则在一块未经分格的区域书写题签上标注的内容,允许出现涂改、文本行倾斜和交叠等复杂手写现象)下书写完成,优化出合格的手写样本853份.HIT2MW数据库字量为

186444字(包括标点、字母和汉字),涵盖了大部分GB2312280一级汉字,一定量的GB2312280二级汉字,甚至GB2312280字符集以外的少量汉字.图8和图9是两幅来自HIT2MW数据库的样本,编号分别为b04090303和b04090902.

HIT2MW数据库中的手写体样本不是按照孤立的

汉字书写,而是按照一定的规则从《人民日报》上随机抽取的一段200字左右具有一定含义的文字,因此可以看作是真实的手写体样本.迄今为止,HIT2MW数据库已被美国UCBerkeley,日本Tokyo大学,清华大学,吉林大学和华南理工大学等多家科研院所采用,应用领域主要集中在中文文档的行切分、汉字的切分识别、中文文本的无切分识别、笔迹鉴别和签名验证等方面.

8 识别后处理及评价准则

手写体汉字识别后处理一般是根据上下文关系对单字的识别进行处理.利用后处理技术,能够实现对单字识别结果的确认或者纠错,进一步提高整个汉字识别系统的正确率.目前主流的后处理技术包含以下3个步骤:

(1)根据上下文关系建立基于词或字的N元语法(N2gram)统计语言模型,即N-1阶Markov模型.实践中最常见的是bi2gram或tri2gram模型[77~81];

(2)确定并调整候选字的相似字集,作为候选字符集;

(3)在候选字符集上,根据统计语言模型,以句子为处理单元,采用Viterbi算法选择具有最大概率的句子路径,从而确定相

印刷体汉字识别及其MATLAB实现

印刷体汉字的识别及其MATLAB实现 0.汉字识别研究的意义 汉字已有数千年的历史,是中华民族文化的重要结晶,闪烁着中国人民智慧的光芒。同时也是世界上使用人数最多和数量最多的文字之一。现如今,汉字印刷材料的数量大大增加,一些专业单位所接触的印刷材料更是浩如烟海,信息量均是爆炸性增长。然而,汉字是非字母化、非拼音化的文字,因此,如何将汉字快速高效地输入计算机,是信息处理的一个关键问题,也是关系到计算机技术能否在我国真正普及的关键问题,更是传播与弘扬中华民族悠久历史文化的关键问题。而且随着劳动力价格的升高,利用人工方法进行汉字输入也将面临经济效益的挑战。因此,对于大量已有的文档资料,汉字自动识别输入就成为了最佳的选择。因此,汉字识别技术也越来越受到人们的重视。汉字识别是一门多学科综合的研究课题,它不仅与人工智能的研究有关,而且与数字信号处理、图像处理、信息论、计算机科学、几何学、统计学、语言学、生物学、模糊数学、决策论等都有着千丝万缕的联系。一方面各学科的发展给它的研究提供了工具;另一方面,它的研究与发展也必将促进各学科的发展。因而有着重要的实用价值和理论意义。 1.印刷体汉字识别的研究 1.1印刷体汉字识别技术的发展历程 计算机技术的快速发展和普及,为文字识别技术应运而生提供了必备条件。加上人们对信息社会发展的要求越来越高,文字识别技术的快速发展可想而知。印刷体文字的识别可以说很早就成为人们的梦想。印刷体汉字的识别最早可以追溯到60年代,但都是西方国家进行的研究。我国对印刷体汉字识别的研究始于70年代末80年代初。同国外相比,我国的印刷体汉字识别研究起步较晚。从80年代开始,汉字ORC的研究开发一直受到国家重视,经过科研人员十多年的辛勤努力,印刷体汉字识别技术的发展和应用,有了长足进步。 1.2印刷体汉字识别的原理分析及算法研究 汉字识别实质是解决文字的分类问题,一般通过特征辨别及特征匹配的方法来实现。目前汉字识别技术按照识别的汉字不同可以分为印刷体汉字识别和手写体汉字识别。印刷体汉字识别从识别字体上可分为单体印刷体汉字识别与多体印刷体汉字识别。 印刷体汉字识别的流程如图1-1所示:

手写字符识别系统设计

版本:V1.0 手写字符识别系统设计说明书 湖南大学信息科学与工程学院 二0一四年六月

目录 1引言 (2) 1.1目的 (2) 1.2阅读对象 (2) 2项目概述 (2) 2.1项目简介 (2) 2.2项目任务 (2) 2.3实验环境介绍 (2) 3任务描述 (3) 3.1背景资料概述 (3) 3.2系统组成 (3) 3.3系统评估 (5) 4机器学习算法介绍 (5) 4.1支持向量机 (5) 4.2BP神经网络 (6) 4.3决策树方法 (7) 5特征选择 (8) 6参考资料和实用网站 (9)

1引言 1.1目的 随着图像处理技术与机器学习技术的发展,机器视觉技术已广泛应用于工业生产、日常生活及城市管理中。字符识别作为机器视觉的一种基本应用,在车牌识别、光学字符识别(OCR,Optical Character Recognition)等应用中均有涉及。 本说明书旨在介绍基于常用机器学习算法(如BP神经网络、支持向量机、朴素贝叶斯、K近邻分类)的手写字符识别系统的设计需求,设计方法和环境介绍,帮助学生了解字符识别的基本流程,常用机器学习算法的基本原理,掌握机器视觉应用的开发技术。 1.2阅读对象 本说明书的阅读对象有: ●数字媒体类相关专业学生 ●相关客户人员,体验用户等 2项目概述 2.1项目简介 本项目旨在基于机器学习算法实现手写字符(包括数字和大小写字母)的识别。该系统通过读入一张图片或通过鼠标绘制字符的方式,实现识别对象的输入,通过BP神经网络、支持向量机、朴素贝叶斯或K近邻分类方法实现手写字符的识别,并输出识别的结果。 2.2项目任务 项目名称:手写字符识别系统的设计 项目内容:1)手写字符的输入; 2)图片预处理与特征提取; 3)机器学习与字符分类; 项目周期:1个月(2014年8月25日——2014年9月20日) 参与人数:2~4人。 2.3实验环境介绍 A)Visual Studio 2010

26个英语字母大小写标准手写体规范练习

26个英语字母大小写标准手写体规范练习

\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\> \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\>

脱机手写体汉字识别综述

脱机手写体汉字识别综述 赵继印1,郑蕊蕊2,吴宝春1,李 敏1 (1.大连民族学院机电信息工程学院,辽宁大连116600;2.吉林大学通信工程学院,吉林长春130025) 摘 要: 脱机手写体汉字识别是模式识别领域最具挑战性的课题之一.本文分析了近年来脱机手写体汉字识别 的最新进展,讨论了脱机手写体汉字分割、特征提取和分类器设计等关键技术的各种主流方法,介绍了3种典型的汉字识别数据库,并提出了脱机手写体汉字识别的难点问题和今后发展的趋势,为该领域的研究者指明研究方向,共同促进脱机手写体汉字识别技术的发展. 关键词: 脱机手写体汉字识别;字符分割;特征提取;分类器设计;汉字识别数据库中图分类号: TP39114 文献标识码: A 文章编号: 037222112(2010)022******* A Review of Off 2Line Handwritten Chine se Character Recognition ZH AO Ji 2yin 1,ZHE NG Rui 2rui 2,W U Bao 2chun 1,LI Min 1 (1.College o f Electormechanical and Information Engineering ,Dalian Nationalities Univer sity ,Dalian ,Liaoning 116600,China ; 2.College o f Communication Engineering ,Jilin Univer sity ,Changchun ,Jilin 130025,China ) Abstract : Off 2line handwritten Chinese character recognition is one of the most challenging problems in pattern recognition field.This paper analyzed the latest developments of off 2line handwritten Chinese character recognition in recent years.Main meth 2ods of the key technologies such as Chinese characters segmentation ,feature extraction and classifier design were discussed.This pa 2per also introduced 3typical off 2line handwritten Chinese character recognition databases.Finally ,remain difficult issues and future trends of off 2line handwritten Chinese character recognition were proposed.This paper will guide researchers in this field and pro 2mote development of off 2line handwritten Chinese character recognition technology. K ey words : off 2line handwritten Chinese character Recognition ;characters segmentation ;feature extraction ;classifier design ;Chinese recognition database 1 引言 汉字识别是模式识别的一个重要分支,也是文字识 别领域最为困难的问题之一,它涉及模式识别、图像处理、统计理论等学科,呈现出综合性的特点,在办公和教学自动化、银行票据自动识别、邮政自动分拣、少数民族语言文字信息处理等技术领域,都有着重要的理论意义和实用价值[1].汉字识别技术可分为印刷体和手写体汉字识别两大类.手写体汉字识别又可分为联机(on 2line )和脱机(off 2line )手写体汉字识别.脱机手写体汉字识别可分为受限和非受限两种情况,如图1所示. 清华大学、中科院自动化所等著名高校和科研院所都致力于汉字识别的研究,以汉王科技股份有限公司为首的科技企业也推出了一系列成熟的商业产品[2].目前,很多论文提出的脱机手写体汉字识别的方法在不同的字符数据库试验中,取得了95%~99%的识别率,但是对真正的手写文档的识别效果却难以达到实际应用的要求. 目前脱机手写体汉字识别仍处于实验室研究阶 段,成功的商业产品仍未发布[2~4].本文着重讨论脱机手写体汉字识别的现状和存在的问题,明确今后的发展趋势,为脱机手写体汉字识别领域的广大研究人员提供参考和借鉴. 2 手写汉字字体特点 从识别的角度分析,汉字具有如下4个特点.2.1 汉字类别多 汉字的个数很多,国家标准G B1803022000《信息交换用汉字编码字符集基本集的扩充》收录27484个汉字[5].汉字个数在模式识别问题中体现为汉字的类别,因此汉字识别问题属于超大规模数据集的模式识别问题. 收稿日期:2009202216;修回日期:2009206213 基金项目:大连民族学院科研基金(N o.20086201);吉林省科技厅科技引导计划(N o.20090511)   第2期2010年2月 电 子 学 报 ACT A E LECTRONICA SINICA V ol.38 N o.2 Feb. 2010

标准英语手写体书写——详细教程

小学英语26个字母标准手写体教程 英语的26个字母构成了奇妙的英语世界,对于英语初学者来说,学好26个字母是非常重要的,那么怎样学好26个字母呢?下面Tom教你如何书写26个字母! 工具/原料 英语本

方法/步骤 1.1、斜度:每个字母都要稍向右倾斜约10°左右,斜度要一致 如图:A F H的书写 2.2、大写字母的书写规格是:上不顶天下立地。即笔画的上端稍离第一线,笔画 的下端必须紧贴第三线,不许离线也不许出格。 3.3、占中间格的小写字母有a、c、e、m n、o、r、s、u、v、w x、z共13 个,它们笔画的上端必须紧贴第二线,下端必须紧贴第三线,不许离线也不许出格。 C C N就0 ?

R沪-s 4. 4、占第一、第二两格的小写字母共有5个:b、d、h、k、l,它们笔画的 上端必须顶第一线,下端必须顶第三线,不许离线也不许出格。

X % Z n 5.5、小写字母i和t也占第一、第二两格。但t的上端在第一格中间,短 横重合第二线;i的小圆点在第一格中间稍偏下处 I也丁上 5—* 6.6、占第二、第三两格的小写字母共有3个:g、q、y,它们的笔画的顶端 要紧贴第二线,下端要紧贴第四线,不可离线也不可出格。

7. 7、占第一、第二及第三格的小写字母共有 3个:f 、j 、p 。其中f 的上端 稍离第一线(和大写字母一样),下端紧贴第四线,短横重合第二线; j 的小 圆点与i 的小圆点位置相同,下面一笔的上端顶第二线,下端紧贴第四线; p 8. &要注意书写的规范 ① 字母a 、d 、g 、o 、q 等上端必须圭寸闭,不可开口; ② 字母I 、k 的收笔处是圆钩,不可写成尖钩或竖弯钩; ③ 字母r 的收笔处不可多加一个弯。

2020年整理汉字相近字.doc

一些词汇识别模型认为,当一个单词呈现时,它的字形相近词也会被激活,从而对目标词识别产生影响。已有研究表明,字形相近词对目标词识别的影响存在语言上的差异。我们对汉字识别中字形相近字的作用进行了研究。REM(retrieving effect ively from memory)模型和提取模型(retrieval model)认为,词汇识别与再认记忆一样都是从记忆中提取信息。鉴于再认记忆和词汇识别关系密切,我们也研究了字形相近字在再认记忆的作用。本研究中,字形相近字的操作定义是形旁家族和声旁家族。形旁家族指在相同位置拥有同一形旁的所有汉字。声旁家族指在相同位置拥有同一声旁的所有汉字。一个家族中汉字的多少用家族大小来表示。围绕字形相近字在汉字认知和记忆中的作用,我们进行了三项研究。在研究一中,我们考察了形旁家族大小、声旁家族大小和高频同声旁字在不同难度词汇判断任务中对形声字识别的影响。结果发现,形旁家族大小、声旁家族大小和高频同声旁字对形声字识别有重要影响。形旁家族大和声旁家族大对词汇判断起促进作用,高频同声旁字对词汇判断起抑制作用。这些作用受词汇判断任务难度的影响。根据结果,我们对多重标准识别模型(The multiple read-outmod el)进行了修正。研究二使用命名实验范式,考察了声旁家族大小和高频同声旁字对形声字命名的影响。结果发现,在一致字和不一致字上存在声旁家族大小的抑制作用,声旁家族越大,命名就越慢,还发现有高频同音邻近字的目标字和有高频异音

邻近字的目标字在加工上存在差异。这说明,在字形表征水平和语音表征水平上均存在字形相近字的竞争。研究一和研究二结果表明,在词汇识别中,字形相近字之间既存在着相互激活,也存在着相互竞争。这证明了交互激活模型提出的词汇识别中的两个机制:词汇到亚词汇的相互激活机制和同一词汇水平上的相互竞争机制。研究三使用记得/知道再认范式以及迫选再认范式,考察了同声旁家族大小对再认记忆的影响。结果发现,声旁家族小的汉字具有记忆优势,声旁家族小的汉字比声旁家族大的汉字有更高击中率。声旁家族大的汉字击中率低是因为在编码或提取阶段受到了同声旁字形相近字的干扰。基于实验结果,我们对汉字教学和学习提出建议:要培养学生关于汉字字形的形旁家族意识和声旁家族意识,利用家族效应促进学生对汉字的学习和记忆,同时也要注意加强对形旁家族字和声旁家族字内部分化的教学,防止高频同形旁字或高频同声旁字的消极影响。 关键字:家族,高频,形相近,汉字识别,再认记忆,词汇识别,字形,词汇判断任务,抑制作用,影响,存在,识别模型,形声字,激活,表征水平,目标词,命名,竞争,机制,提取信息 字形相近字,形旁家族,声旁家族,汉字识别 :

(完整版)手写体数字识别系统设计毕业设计

石河子大学 信息科学与技术学院毕业论文 课题名称:手写体数字识别系统设计 学生姓名: 学号: 学院:信息科学与技术学院

专业年级:电子信息工程2007级指导教师: 职称: 完成日期:二○一一年六月十一日

手写体数字识别系统设计 学生: 指导教师: [摘要] 随着科学技术的迅速发展,在邮政编码、统计报表、财务报表、银行票据等处理大量字符信息录入的场合,手写数字识别系统的应用需求越来越强烈,如何将数字方便、快速地输入到计算机中已成为关系到计算机技术普及的关键问题。本文设计实现了一个基于Matlab软件的手写体数字识别系统,采用模块化设计方法,编写了摄像头输入、直接读取图片、写字板输入三个模块,利用摄像头等工具,将以文本形式存在的手写体数字输入进计算机,完成对手写体数字图片的采集,并设计了一种手写数字识别方法,对手写体数字图像进行预处理、结构特征提取、分类识别,最终以文本形式输出数字,从而实现手写体数字的识别。 [关键词] 预处理,结构特征提取,分类识别,手写体数字识别

Handwritten Digit Recognition System Students: Teacher:

Abstract:With the rapid development of science and technology, in zip code, statistics, reports, financial statements, Bank bills dealing with a large number of characters, such as information recorded occasions, handwritten digit recognition system of requirement has become stronger and stronger, how easily and quickly the number entered in the computer has become a key issue relates to the popularization of computer technology. This article design implementation has a based on Matlab software of handwriting body digital recognition system, used module of design method, write has camera entered, and directly read pictures, and write Board entered three a module, using camera, tools, will to text form exists of handwriting body digital entered into computer, completed on handwriting body digital pictures of collection, and design has a handwriting digital recognition method, on handwriting body digital image for pretreatment, and structure features extraction, and classification recognition, eventually to text form output digital, to implementation handwriting body digital of recognition. Key words: Pretreatment, structure feature extraction, classification and recognition, handwritten digit recognition.

三种认知模型

模板匹配模型、原型模型和区别性特征模型各自如何解释汉字的知觉过程?什么样的实验证据能够支持或反对这些模型? 罗文翰 00911060 生命科学学院 模型概述: 在对汉字的识别中,有三种模型可以解释汉字的知觉过程:模板匹配模型、原型模型和区别性特征模型。 模板匹配模型认为,在长期记忆中,储存着许多外部模式的“袖珍副本”,称作模板。它们与外部模式有着一一对应的关系。当一个刺激作用于人的感官时,刺激信息便被拿来与记忆中的各种模板一一比对,认为刺激与匹配程度最高的模板相同。汉字识别时,刺激的汉字与脑中储存的汉字的模板相对应,如果一致则识别出该汉字,否则不能识别出该汉字。由此我们可以知道,无论是什么汉字,其识别过程是一样的,使用的时间应该一致。 原型匹配理论认为,人的记忆中存储的不是与外部模式有一一对应关系的模板,而是原型。原型是对事物形象的一种概括的心理表征,反映一类事物的基本特征。在进行原型匹配的时候,需要把复杂对象的结构进行拆分,拆分成简单的形状,通过对部件的原型进行匹配,以达到识别对象的目的。这种比对不需要严格的准确匹配,只需近似匹配即可。即使某一范畴的客体之间存在外形、大小等方面的差异,所有这些客体可以通过原型匹配得到识别。在汉字识别过程中,把汉字分解为各种各种的组成部分,然后与脑中储存的原型进行匹配。 区别性特征模型认为,该理论认为模式是由若干元素或成分按一定关系构成的,这些元素或成分称为“特征”,特征间的关系也称为特征。特征分析理论认为所有复杂的刺激都是由一些可以区分的、相互分离的特征组成。各种模式是以分解后的一些特征形式来表征和储存的。进行识别的时候,需要抽取刺激的特征,并将其与记忆中的各种模式的特征进行比较和匹配。特征匹配模型强调的是特征、区别的分析。成功与否决定于刺激的可分解性。应用到汉字上来说就是,识别汉字时是通过识别汉字中的组成部分并且组成部分的位置关系等,由此来识别汉字。 实验证据: 在一项对汉字觉知模型的研究中(关于汉字加工单位的研究张武田冯玲),研究者发现汉字中高频字和低频子、笔画多和笔画少对于笔画多对被试对识别时间和识别正确率有影

手写体数字的识别

手写体数字识别 第一章绪论 (4) 1.1课题研究的意义 (4) 1.2国内外究动态目前水平 (4) 1.3手写体数字识别简介 (5) 1.4识别的技术难点 (5) 1.5主要研究工作 (6) 第二章手写体数字识别基本过程: (6) 2.1手写体数字识别系统结构 (6) 2.2分类器设计 (7) 2.2.1 特征空间优化设计问题 (7) 2.2.2分类器设计准则 (8) 2.2.3分类器设计基本方法 (9) 3.4 判别函数 (9) 3.5训练与学习 (10) 第三章贝叶斯方法应用于手写体数字识别 (11) 3.1贝叶斯由来 (11) 3.2贝叶斯公式 (11) 3.3贝叶斯公式Bayes决策理论: (12) 3.4贝叶斯应用于的手写体数字理论部分: (16) 3.4.1.特征描述: (16) 3.4.2最小错误分类器进行判别分类 (17) 第四章手写体数字识别的设计流程及功能的具体实现 (18) 4.1 手写体数字识别的流程图 (18) 4.2具体功能实现方法如下: (19) 结束语 (25) 致谢词 (25) 参考文献 (26) 附录 (27)

摘要 数字识别就是通过计算机用数学技术方法来研究模式的自动处理和识别。随着计算机技术的发展,人类对模式识别技术提出了更高的要求。特别是对于大量己有的印刷资料和手稿,计算机自动识别输入己成为必须研究的课题,所以数字识别在文献检索、办公自动化、邮政系统、银行票据处理等方面有着广阔的应用前景。 对手写数字进行识别,首先将汉字图像进行处理,抽取主要表达特征并将特征与数字的代码存储在计算机中,这一过程叫做“训练”。识别过程就是将输入的数字图像经处理后与计算机中的所有字进行比较,找出最相近的字就是识别结果。 本文主要介绍了数字识别的基本原理和手写的10个数字字符的识别系统的设计实现过程。第一章介绍了数字识别学科的发展状况。第二章手写体数字识别基本过程。第三章贝叶斯方法应用于手写体数字识别。第四章手写体数字识别的设计流程及功能的具体实现,并对实验结果做出简单的分析。 关键词:手写体数字识别分类器贝叶斯vc++6.0 错误!未找到引用源。

联机手写数字识别实验报告

联机手写数字识别设计 一、设计论述 模式识别是六十年代初迅速发展起来的一门学科。由于它研究的是如何用机器来实现人(及某些动物)对事物的学习、识别和判断能力,因而受到了很多科技领域研究人员的注意,成为人工智能研究的一个重要方面。 字符识别是模式识别的一个传统研究领域。从50年代开始,许多的研究者就在这一研究领域开展了广泛的探索,并为模式识别的发展产生了积极的影响。 字符识别一般可以分为两类:1.联机字符识别;2.光学字符识别(Optical Chara- cter Recognition,OCR)或称离线字符识别。在联机字符识别中,计算机能够通过与计算机相连的输入设备获得输入字符笔划的顺序、笔划的方向以及字符的形状,所以相对离线字符识别来说它更容易识别一些。 参照联机字符识别的原理,我们对手写数字的特征进行了深入的研究,同时作为一个初学者,我们本次考虑设计联机手写数字0——9识别,以达到加深对《模式识别》课程理论的了解和掌握的目的。 二、设计内容 本次设计,我们使用Visual C++ 6.0软件,在《模式识别》课程理论基础上,运用VC++语言设计联机手写数字识别系统。 三、设计原理 1、基于笔划及笔划特征分类的联机识别 联机手写汉字识别的方法可以分为两类:基于整字识别方法和基于笔划识别的方法。大多数联机识别都是采取笔划识别的方法,这是因为在联机识别过程中,汉字笔划是以点坐标形式一笔一划地输入到计算机的,同样,数字在联机输入过程中也是按照一笔一划输入的。 笔划的分类有很多,基于便于识别的原理,我们在这里仅介绍一种笔划的分类。我们把汉字看成是由把构成所有汉字的笔划分为两大类:即单向笔划和变向笔划。单向笔划表示笔划的走向保持在某一方向上,即人们通常所说的基本笔划,包括有横(笔划代码1)、竖(笔划代码2)、撇(笔划代码3)、捺(笔划代码4)。变向笔划的一种分类,规定变向笔划由三种笔划组成:(1)顺笔划(笔划代码5):笔划的变向是按照顺时针规律变化的;(2)逆笔划(笔划代码6):笔划的变向是按照逆时针规律变化的;(3)混合笔划(笔划代码7):笔划的变向既有顺时

手写体英文字母的书写规范及练习

26个英文字母规范 一、书写要求 1、斜度:每个字母都要稍向右斜约5°左右,斜度要一致。 2、大写字母的书写规格是:上不顶天下立地。即笔画的上端稍离第一线,笔画的下端必须紧贴第三线,不许离线也不许出格。 3、占中间格的小写字母有a,c,e,m,n,o,r,s,u,v,w,x,z 13个,它们笔画的上端必须紧贴第二线,下端必须紧贴第三线,不许离线也不许出格。 4、占一格、二格的小写字母有b,d,h,k,l 共5个,它们笔画的上端必须顶第一线,下端必须顶第三线,不许离线也不许出格。 5、小写字母i和t也占一格、二格。但t的上端在第一格中间,短横重合第二线;i的小圆点在第一格中间稍偏下处。 6、占二格、三格的小写字母有g,q,y 3个,它们的笔画的顶端要紧贴第二线,下端要紧贴第四线,不可离线也不可出格。 7、占一格、二格、三格的小写字母有f, j, p 3个。其中f的上端稍离第一线(和大写字母一样),下端紧贴第四线,短横重合第二线;j的小圆点与i的小圆点位置相同,下面一笔的上端顶第二线,下端紧贴第四线;p的上端略高于第二线,约占第一格的三分之一,下端紧贴第四线。 8、要注意书写的规范,字母a,d,g,o,q等上端必须封闭,不可开口。 9、字母l, k的收笔处是圆钩,不可写成尖钩或竖弯钩。

10、字母r的收笔处不可多加一个弯。 11、字母g,j,y收笔的弯钩要自然弯曲,不可太长,也不可太钩。 二、书写范例

三、书写笔画总结 (1)一笔完成的字母: 大写:C G J L O S V W Z 小写:a b c d e g h k l m n o q r s u v w y z (2)两笔完成的字母: 大写:B D K M N P Q R T U X Y 小写:f i j p t x (3)三笔完成的字母: 大写:A E F H I (4)元音字母: Aa Ee Ii Oo Uu 四、英语字母书写格式(顺口溜) 英语字母大小写,初学书写要规范; 大写一律上两格,原则顶住第一线; 小写有头上两格,b,d,h,k和l; 有尾下面占两格,g,q,y,p莫写错; 无头无尾中间格,十三字母无漏写; a,c,e,m,n,o,r,s,u,v,w,x,z; 中间i,t中上一个半,还有f,j三格点; 所有字母略右斜,笔顺笔画须记请; 始学养成好习惯,大小宽窄要协调。

文字识别算法

题目图像分割技术 学院计算机科学与技术班级计软1401 学生兰俊锋 学号20141214023

文字识别是智能识别技术中的一个重要技术。文字具有便于信息保存和传递的优点,使信息在时间和空间上得以迅速扩散。在人们的日常生活中,在机关事务处理、工业以及商业交往中,需要识别文字的数量如同天文数字,但利用计算机识别的文字量却很少。最近几年,随着计算机技术、数学和图像技术的发展,文字识别的应用领域逐步扩大,目前较为活跃的应用包括数字识别,文字识别等。文字识别是指用计算机字典、高速地识别现在介质(如纸张等)上的数字、英文符号或汉字。文字识别实际上就是解决文字的分类问题,一般通过特征及特征匹配的方法来进行处理。 本文将从算法、应用两方面介绍文字识别技术,本文介绍的文字识别应用有英文字母识别、车牌特殊文字识别、书写文字识别、特殊文字识别。 文字是人类相互交流信息的重要工具。社会发展进入信息时代,人们已不再停留在用自己的耳朵和眼睛去直接获得这些信息,而是使用计算机将文字自动的输入计算机,用计算机对他们进行处理,随时以各种方式满足人们的不同需要。因此,研究如何用计算机自动识别文字图像,解决文字信息自动输入计算机,并进行高速加工处理的问题已引起大家的广泛关注。 归一化算法一般作为一种图像的预处理技术,其目的是将采集到的原始图像转换成特征提取器所能接受的形式(灰度图像或二值图像),消除一些与类别无关的因素(噪声消除、归一化等) 。从理论上讲,经过归一化后的骨架应该是宽度为一的中心线,但这是不可能的。不同的硬件设备和不同的算法得出的结果可能不是唯一的,其结果与原图案的扭曲程度也是不~样的,扭曲程度尽量的小应该是归一化算法追求的目的之一。既然预处理是为后续的特征提取和分类器设计服务的,那么预处理方法的选择就应该有利于特征的提取,以使分类变得简单。 汽车牌照识别,在高速公路收费、电子警察和治安卡口等系统中有重要的应用价值。作为图像识别的典型问题,汽车牌照识别的研究有很长的历史,但因为实际路况的高度复杂性(如车速、光线、污染及变形等),目前的性能还不能令人满意。 1.文字识别过程概述 一般来说,文字图像的识别过程主要由以下 4 个部分组成:①正确地分割文字图像区域;②正确地分离单个文字;③正确识别单个文字;④正确地连接单个文字。其中①、④属于文字图像分析技术问题,③属于文字识别技术问题。关于②,由于仅从分割处理不能对其进行评价,通常采用文字识别地评价值来判断分离的正确性。单纯的文字识别是指经二值化处理后的单个文字识别。

手写体数字识别系统的设计与实现

大学生研究计划项目 论文报告 项目名称:_手写体数字识别系统的设计与实现 负责人:_________ _______________ 学院/专业:_____ ______ 学号:____ ________ 申请经费:_____ _________________ 指导教师:______ _______ 项目起止时间:2011年6月-2012年3月

摘要 手写体数字识别系统依托计算机应用软件为载体,利用C++程序设计的相关知识,运用模块设计等相关技术,最终完成手写体设计系统的程序综合设计。 关键字:手写体数字处理模式识别程序设计 一、论题概述 模式识别是六十年代初迅速发展起来的一门学科。由于它研究的是如何用机器来实现人(及某些动物)对事物的学习、识别和判断能力,因而受到了很多科技领域研究人员的注意,成为人工智能研究的一个重要方面。 字符识别是模式识别的一个传统研究领域。从50年代开始,许多的研究者就在这一研究领域开展了广泛的探索,并为模式识别的发展产生了积极的影响。 字符识别一般可以分为两类:1.联机字符识别;2.光学字符识别(Optical Chara- cter Recognition,OCR)或称离线字符识别。在联机字符识别中,计算机能够通过与计算机相连的输入设备获得输入字符笔划的顺序、笔划的方向以及字符的形状,所以相对OCR来说它更容易识别一些。但联机字符识别有一个重要的不足就是要求输入者必须在指定的设备上书写,然而人们在生活中大部分的书写情况是不满足这一要求的,比如人们填写各种表格资料,开具支票等。如果需要计算机去认识这些己经成为文字的东西,就需要OCR技术。比起联机字符识别来,OCR不要求书写者在特定输入设备上书写,它可以与平常一样书写,所以OCR 的应用更为广泛。OCR所使用的输入设备可以是任何一种图像采集设备,如CCD、扫描仪、数字相机等。通过使用这类采集设备,OCR系统将书写者已写好的文字作为图像输入到计算机中,然后由计算机去识别。由于OCR的输入只是简单的一副图像,它就不能像联机输入那样比较容易的从物理特性上获得字符笔划的顺序信息,因此OCR是一个更具挑战性的问题。 数字识别是多年来的研究热点,也是字符识别中的一个特别问题,它是本文研究的重点。数字识别在特定的环境下应用特别广泛,如邮政编码自动识别系统,税表和银行支票自动处理系统等。一般情况下,当涉及到数字识别时,人们往往要求识别器有很高的识别可靠性,特别是有关金额的数字识别时,如支票中填写

自由手写体数字识别系统的设计与实现

自由手写体数字识别系统的设计和实现 摘要:本文论述并设计实现了一个脱机自由手写体数字识别系统。文中首先对待识别数字的预处理进行了介绍,包括二值化、平滑滤波、规范化、细化等图像处理方法;其次,探讨了如何提取数字字符的结构特征和笔划特征,并详细地描述了知识库的构造方法;最后采用了以知识库为基础的模板匹配识别方法,并以MATLAB作为编程工具实现了具有友好的图形用户界面的自由手写体数字识别系统。实验结果表明,本方法具有较高的识别率,并具有较好的抗噪性能。 关键词:手写体数字;预处理;模式识别;特征提取 Abstrct: This paper describes and designs a free handwritten number recognition system. Firstly, the pretreatment of the character to be recognized is introduced, including binarization, smoothing, normalization and thinning. Next, how to extract the structural features of the numbers is discussed, and we describe the constructing method of repository. Finally, we use the method of template matching, based on repository, to recognize the digital number. Matlab is used as a program tool to realize this free handwritten digital recognition system with friendly graphical user interface. The experimental results show that the rate of the recognition system is high, and the proposed method is robust to noise. Keywords: handwritten number; pretreatment;pattern recognition; feature extraction 1 引言 OCR(Optical Character Recognition)即光学字符识别技术,是通过扫描仪把印刷体或手写体文稿扫描成图像,然后识别成相应的计算机可直接处理的字符。OCR是模式识别的一个分支,按字体分类主要分为印刷体识别和手写体识别两大类。对于印刷体识别又可以分成单一字体单一字号和多种字体多种字号几类。而手写体识别又可分为受限手写体和不受限手写体两类;按识别方式可分为在线识别和脱机识别两类。 字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是用各国家、各民族的文字(如:汉字,英文等)书写或印刷的文本信息,目前在印刷体和联机手写方面技术已趋向成熟,并推出了很多使用系统;另一类是数据信息,主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据,如:邮政编码、统计报表、财务报表、银行票据等等,处理这类信息的核心技术是手写数字识别。因此,手写数字的识别研究有着重大的现实意义,一旦研究成功并投入使用,将产生巨大的社会和经济效益。 在整个OCR领域中,最为困难的就是脱机自由手写字符的识别。到目前为止,尽管人们在脱机手写英文、汉字识别的研究中已取得很多可喜成就,但距离实用还有一定距离。而在手写数字识别这个方向上,经过多年研究,研究工作者已经开始把它向各种实际使用推广,为手写数据的高速自动输入提供了一种解决方案。 本文首先介绍了自由手写体数字识别的基本原理,包括数字图像预处

相关主题