搜档网
当前位置:搜档网 › 基于分形几何的甲骨文字形识别方法

基于分形几何的甲骨文字形识别方法

第32卷 第10期

2018年10月中文信息学报JOU RNAL OF CHINESE INFORM A TION PROCESSING Vol .32,No .10Oct .,2018文章编号:1003‐0077(2018)10‐0138‐05

基于分形几何的甲骨文字形识别方法

顾绍通

(江苏师范大学语言科学与艺术学院,江苏徐州221009)

摘 要:甲骨文是流行于我国古代商朝的成熟文字系统,本质上是一种平面图形,笔画和结构不是非常稳定。很多字形具有图画性质,难以区分明显的结构,难写难记。已有的编码输入方法受众面小,效率很低,使用受限。该文分析了甲骨文字形的分形性质,在此基础上,通过字形的重心建立二维平面直角坐标系,将甲骨文字形的平面图形划分为四个象限。利用分形几何的原理,通过计算字形以及各个象限的分形维数,将甲骨文字形形式化为一组分形描述码。再通过与甲骨文字形的分形特征库进行配准,从而识别甲骨文字形。实验结果显示,利用分形几何可以较好地识别甲骨文字形。

关键词:甲骨文;分形几何;分形维数;识别

中图分类号:T P 391 文献标识码:A

Identification of Oracle ‐bone Script Fonts Based on Fractal Geometry

GU Shaotong (School of Linguistic Science and Art ,Jiangsu Normal University ,Xuzhou ,Jiangsu 221009,China )

Abstract :Oracle ‐bone script is an mature w riting system used in Shang dynasty ,w hich is engraved on tortoise shells and animal bones .Oracle ‐bone script is essentially a plane figure ,in w hich the strokes and structures aren 't stable ,and many characters look like a picture .So it 's hard to distinguish obvious structures ,hard to w rite and remember .The existing coding input methods have fewer audiences ,low efficiency and limited use .This paper analyzes the fractal property of oracle ‐bone script according to the theory of fractal geometry .On this basis ,the 2D plane rectan ‐g ular coordinate system is established through the center of gravity of glyph ,and the planar graph of oracle ‐bone g lyph is divided into four quadrants .By using fractal geometry principle ,the oracle ‐bone glyph is formed into a component description code by calculating the glyph and fractal dimensions of each quadrant .The oracle ‐bone script is identified by registration with a fractal feature library of the oracle ‐bone script .Experimental results show that the

scheme of fractal geometry is effective to recognize the oracle ‐bone script .Keywords :oracle ‐bone script ;fractal geometry ;fractal dimension ;identification 收稿日期:2017‐10‐16 定稿日期:2017‐11‐23基金项目:国家社会科学基金(13CYY 039)0 引言

甲骨文是书写在龟甲和兽骨上的文字,是我国

迄今发现的最早的一种成熟文字系统。

甲骨文字形的输入可以采用编码输入或者识别

输入的方法。目前对甲骨文字形采用编码输入的方

案已有多种,如基于甲骨文字形动态描述库的输入

方法[1]、可视化甲骨文输入法[2]、基于拓扑结构的输

入方法[3]、甲骨文自由笔画输入法[4]

和象形码输入方法[5]。以上方案或多或少需要记住某些规则,这对它的推广使用是不利的。以上方案从字形某一方面的特点出发进行编码,在一定程度上解决了甲骨文字形的输入问题,但也存在不足之处。出土甲骨拓片上的甲骨文字形中,大部分字形无法正确辨识其读音和意义,使得甲骨文编码输入方法存在规则繁琐、重码多和效率低的局限。要让一般用户掌握其复杂的规则并不现实,只有少数从事甲骨文研究万方数据

相关主题