搜档网
当前位置:搜档网 › 基于中国少数民族语言的语音识别研究

基于中国少数民族语言的语音识别研究

基于中国少数民族语言的语音识别研究
基于中国少数民族语言的语音识别研究

基于中国少数民族语言的语音识别研究

陈楠

(云南民族大学电气信息工程学院,云南昆明 650031)

摘要:语音识别是当今语音研究的热点,它是一门涉及多领域的交叉学科,也是模式识别和人工智能领域的重要分支。针对中国有着55个少数民族这一实际情况,不少语言都处于濒临状态,因此,本文主要介绍了语音识别在少数民族语言应用中的技术和概况。希望利用这一数字化技术达到保护少数民族语言文化遗产的目的。

关键字:语音识别,隐马尔可夫,数字化处理,少数民族语言

Based on China's minority language speech recognition research

CHEN Nan

(College of Electrical and Information Engineering,Yunnan University of

Nationalities,Kunming650031,China)

Abstract:Speech recognition is the voice of today's hot, it is an interdisciplinary field involving multiple, pattern recognition and artificial intelligence is an important branch. China has 55 ethnic minority groups for the actual situation, many languages are at the brink of the state, therefore, this paper describes the application of speech recognition in minority languages in the technology and profiles. Hope to use this digital technology to achieve the purpose of protecting the cultural heritage of minority languages.

Keywords:speech recognition, Hidden Markov, digital processing, minority languages

1 引言

1.1语音识别技术概述

语音识别技术,也被称为自动语音识别(Automatic Speech Recognition, ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容[1]。

语音识别技术是以语音信号处理为研究对象,让机器接收并识别、理解语音信号,并将其转换为相应数字信号的技术。让机器听懂人类的语言,这是人们长期以来梦寐以求的事情,而语音识别是一门非常复杂的交叉性学科,它涉及语音语言学、计算机科学、信号处理学、生理学、心理学等一系列学科,是模式识别的重要分支。50年代,是语音识别研究工作的开始时期,它以贝尔实验室研制成功可识别十个数字的Audry系统为标志。20世纪80年代语言识别研究进一步走向深入,基于特定人孤立语音技术的系统研制成功。在过去的30年里,隐马尔可夫模型和人工神经元网络在语音识别中得到了成功的应用。

语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。并通过算法和计算机技术相结合的方式来实现。目前,这样的系

统能够做到识别理解数十万条词汇的连续语音信号。这种现代模式识别系统除了在语音领域的应用外,还可以广泛应用于信号处理和模式识别的其他领域。语音识别一般分为两个步骤:学习和识别阶段。学习阶段的任务是建立识别基本单元的声学模型以及语言模型。识别阶段是将输入的目标语言的特征参数和模型进行比较,得到识别结果。语音识别系统本质上讲是一种模式识别系统,其原理如下图所示:[2]

图1语音识别原理示意图

该流程简单介绍如下:

(1)语音采集设备如话筒、电话等将语音转换成模拟信号。

(2)数字化一般包括预滤波、采样和A/D变换。该过程将模拟信号转变成计算机能处理的数字信号。

(3)预处理一般包括预加重、加窗分帧。经预处理后的信号被转换成了帧序列的加窗的短时信号。

(4)参数分析是对时信号进行分析并提取语音特征参数的过程,如时域、频域分析,矢量量化等。

(5)语音识别是目标语音根据特征参数与模型库中的参数进行比较,产生识别结果的过程。一般有模板匹配法、随机模型法和神经网络等。

1.2中国少数民族语言概述

语言是一种特殊的社会资源, 语言资源由语言本体和语言应用两部分构成。语言本体包括语音、词汇、语法、语义系统, 是语言资源的物质基础语言应用包括人类社会对语言的各种使用及其所产生的影响, 是语言资源价值的具体体现。

中国是一个统一的多民族国家,已确定民族成分的有56个民族,有55个人口较少的民族。多民族、多语言、多文种(文字和语音)并存是我国的一个基本国情。除回族、满族已全部转用汉语外,其他54个民族都有自己的语言,有30个民族有余自己的语言相一致的文字;分七种语系。由于有的民族使用一种以上的语言或文字,如瑶族使用3种语言,高山族使用13多种语言;傣族使用4种文字,景颇族使用2种文字等,因此,共有73种语言,55多种文字,63多种语言[3]。

随着社会开放程度的不断提高 ,民族语言文字的使用有衰退的趋势 ,中国一些使用人口比较少的民族语言已经处于濒临状态 ,民族语言文字的消亡 ,直接危及民族文化的繁荣和发展 ,抢救和保护民族语言文字资源 ,是繁荣和发展民族文化的重要前提 ,而且刻不容缓。

2 中国少数民族语言发音特点分析

2.1 中国少数民族语音特性分析

其中由于我国是个多民族的国家,个少数民族的语音各有其特点,先统计如下表[4]:

表 1 中国少数民族语言语音情况表

表2 中国少数民族语言语音情况表-续表1

表3 中国少数民族语言语音情况表-续表2

表4 中国少数民族语言语音情况表-续表3

2.2 中国少数民族语音识别研究现状

在语音识别的领域中主要涉及到的研究内容包括:语音信号处理、特征提取和选择;语音识别模型、识别基元及模型研究。目前,句不完全统计,我国共有36个民族或多或少的开展了语音方面的研究工作,其中研究工作相对比较深入的少数民族语言种类有蒙古语、藏语、维吾尔语、哈萨克语、壮(侗)语等。但是黎族,傈僳族,仫佬族,普米族,京族,塔塔尔族,门巴族,珞巴族,布依族的研究在语言学和音位学上的研究都很少见。

3 少数语言研究中的关键技术和模型

3.1语音识别技术流程

少数民族语言的语音识别与其他语音识别技术类似,可以将流程简单概括为:

图2 少数民族语音识别流程图

3.2预处理算法

语音信号在处理成数字信号的过程中,将受到周围的各环境的影响而使语音产生变形,预处理的任务就是修正这种变形,尽可能的还原人的有效发音。少数民族语音识别预处理包括:信号获取、去除噪声、语音增强三个环节。

3.2.1语音信号的获取

计算机声卡作为语音信号与计算机的接口卡件,其最基本的一项功能就是A/D转换。声卡是pc的一种多媒体设备,可以用windows的MCI(Media Control Interface)命令来控制声卡[5]。

图3信号获取过程中相关函数使用流程示意图

3.2.2语音信号的降噪增强

在语音采集过程中,都会或多或少的产生背景噪音,设法去除语音信号中的噪声,增强

有用信号,提高语音信号的信噪比就成为预处理研究中的一个重要步骤。

常用的语音降噪增强算法

(1)基于语音频谱特征的谐波增强法

(2)基于短时谱估计的增强算法

(3)基于信号子空间处理的增强算法

(4)于听觉掩蔽效应的语音增强算法

(5)基于小波变换的语音增强算法

3.3端点检测算法

端点检测是指从背景噪声中找出语音的开始点和终止点,是语音处理领域的基本问题,特别是在孤立词语识别中,找出每个单字的语音信号范围是很重要的,确定语音信号的开始和终止可以减少系统的大量计算,使系统运行效率得到很大的提高。少数民族语言的端点检测采用加窗、短时能量、过零率相结合的方法进行。

3.3.1加窗[6]

(1)矩形窗

??

?>-≤≤=N n N n n w ,010,1)( (1)

(2)汉宁窗

??

?>-≤≤--=N n N n N n n w ,010),12cos(46.054.0)(π (2)

(3)汉明窗

?

??>-≤≤--=N n N n N n n w ,010)],12cos(1[5.0)(π (3) 3.4 针对语音特征建立语音识别模型

3.4.1原始语音数据

我国少数民族语言的语音同英语等其他语音一样,原始语音数据量大,且多余信息占很大比例,需要提取的核心特征参数为频幅、频率、和时长,可以将其看为一个三维的数据模型如图:

图4原始语音的三维模型

3.4.2 MFCC特征参数

MFCC是基于人的听觉机理,通过模拟人的听觉系统导出的声学特征对不同频率的语音具有不同的感知能力,在1000Hz以下,感知能力与频率间的线性关系,而1000Hz以上,感知能力则与频率成对数关系。

图5 MFCC提取过程示意图

3.4.3 HMM模型

在语音识别领域中占据主导地位的HMM,包括有满协方差矩阵和对角协方差矩阵的连续混合密度的HMM 、半连续的HMM ,以及基于VQ的离散HMM .一个HMM通常由状态转移

概率矩阵A、观察概率密度函数矩阵B和初始概率分布矢量π表征。

隐马尔可夫模型是一种用参数表示的,用于描述随机过程统计特性的概率模型,他是马尔可夫链演变而来的。隐马尔可夫模型既解决了用短时模型描述平稳段的信号,有解决了每

一个短时间平稳短是如何转变到下一短时平稳段的问题。由于语音结构信息是多层次的,除了语音特性外,还牵扯到音调、音长、能量等超音段信息及语法、语句等高层次语音结构信息。而HMM既可以描述瞬变的随机过程,又可以描述动态的随机过程转移的特性,所以他能

够利用这些超音段和语音结构的信息。

HMM可分为两部分,一部分是马尔可夫链,由 ,A描述,产生的输出为状态序列,另一部分是一个随机过程,由B描述,产生的输出为观察值序列,T为观察值时间长度[7]。

图 6 HMM的两个组成部分

3.4.4 CDCPM模型

中心距离连续概率模型(Center-Distance Continuous Probabilistic Model,CDCPM)新概率统计模型,可用于非特定人或特定人、孤立词或连续语音识别。模型的参数是每个状态的均值特征矢量以及特征矢量与其均值特征矢量之间距离的均值;与连续HMM(CHMM)不同的是,中心距离连续概率模型(CDCPM) 只保留HMM模型中的B矩阵,且B中的PDF被一个一维的PDF取代,它没有状态转移概率矩阵A,且输出观察概率矩阵B中各状态的概率密度函数只是一个一维的(中心距离的)概率密度函数(PDF)。在三个不同的数据库上进行的实验表明这是一个很有潜力的模型,它极大地减小了模型存储的空间复杂度和模型训练及识别的时间复杂度。[7]

3.5少数民族的语言模型

语言模型主要分为规则模型和统计模型两种。统计语言模型是用概率统计的方法来揭示语言单位内在的统计规律,其中N-Gram简单有效,被广泛使用。

N-Gram:该模型基于这样一种假设,第n个词的出现只与前面N-1个词相关,而与其它任何词都不相关,整句的概率就是各个词出现概率的乘积。这些概率可以通过直接从语料中

统计N个词同时出现的次数得到。由于计算量太大,N一般取值不会很大,常用的是二元的Bi-Gram和三元的Tri-Gram。

语言模型的性能通常用交叉熵和复杂度(Perplexity)来衡量。交叉熵的意义是用该模型对文本识别的难度,或者从压缩的角度来看,每个词平均要用几个位来编码。复杂度的意义是用该模型表示这一文本平均的分支数,其倒数可视为每个词的平均概率。平滑是指对没观察到的N元组合赋予一个概率值,以保证词序列总能通过语言模型得到一个概率值。通常使用的平滑技术有图灵估计、删除插值平滑、Katz平滑和Kneser-Ney平滑。

4 建立相关的语音库

语音数据库是语音识别、语音合成和实验语音学研究的基础。汉语语音是被研究历程告诉我们,实验语音研究和提高识别系统顽健性,离不开大规模、多样化、高质量的语音数据库。因此,迫切需要加强数据库建设。

图 7 民族语言中相关库的建立

5 期望和总结

语言作为一种认知系统、一种思维方式、一种意识形态的直接体现 ,包含着该语言使用者对客观世界和主观世界的认知体系,积淀了该语言使用者对客观世界和主观世界的认知成果。因此 ,对一个民族的语言的研究也是探寻一个民族认知心理机制的重要途径。也正因为如此 ,人们才担心 ,语言多样性的丧失可能会导致人类思维方式的退化和绝对化问。对于人类文明来说,所有的语言都是一笔巨大的财富。而且 ,我们也可以推测,目前所知的 6000多种类语言中,没有哪一种语言在发展过程中没有受到过其他语言的或多或少的影响。从这个意义上说,研究如何保护和利用少数民族语言也是在尝试破译人类社会文化多样性的密码。中国的少数民族语言是人类社会文化的一笔巨大财富,所以主要的研究方法还是通过数字化的技术来对我国个少数民族语言文字等非物质文化进行补救,可利用的数字化技术包括[8]:(1)数字化录音及录像技术

(2)动态三维成像技术

(3)数字化舞蹈编排与声音驱动技术

(4)数字化图案数据库及计算机辅助设计系统

因此,希望国内各省份的语言研究工作者应该有所作为,对此展开长期深人的系统研究,保护我们的非物质文化遗产,就是保护中华民族的文化,弘扬民族的传统精神。

参考文献

[1]维基百科.(2011-07-31).[2011-10-04].https://www.sodocs.net/doc/1c6809213.html,

[2]尹江艳.基于HMM和ANN语音识别研究[J].2007.4:14.

[3]中国少数民族语言[M].成都:四川民族出版社,1987:259-268

[4]王昆仑,吐尔洪江?阿不都克力木.中国少数民族语音技术研究进展[C]//第十届全国人机语言通讯学术

会议.中国兰州,2009-08-15

[5]裴春宝.基于标准拉萨语的藏语语音识别技术研究[D].西藏大学,2011:45-47

[6]苗苗.基于HMM的语音识别技术的研究[D].西安建筑科技大学,2007-05-09:10

[7]郑方,吴文虎,方棣棠.CDCMP及其在语音识别中的应用[J].软件学报,1996-10-07:69-75

[8]蔡群,任荣喜,邱望标.贵州少数民族非物质文化遗产的数字化保护方法研究[J].贵州工大学学报,

2007-08:36

中国少数民族语言文学

中国少数民族语言文学专业硕士生培养方案 (蒙古语言研究方向) 一、专业简介 中央民族大学中国少数民族语言文学(分语族)专业始建于二十世纪五十年代初, 主要研究方向有: 少数民族语言研究、少数民族文学研究、少数民族文献研究, 已成为国内外规模最大的中国少数民族语言教学研究中心。1981年国务院第一批硕士、博士授权学科专业审批中,我校获得了藏缅语族语言文学、壮侗语族语言文学、苗瑶语族语言文学专业、蒙古语族语言文学、突厥语族语言文学等专业硕士学位授权,1983年获得了藏缅语族语言文学专业博士学位授权,1986年获得了其他语族语言文学(朝鲜语族语言文学)专业硕士学位授权。1997年学科专业目录调整,各语族语言文学专业合并称为中国少数民族语言文学(分语族)专业。1995年该专业被确立为“国家文科基础学科人才培养与科学研究基地”。2001年设立了“中国语言文学博士后流动站”,2002年该专业被评为“国家级重点学科”。本专业研究领域涉及汉藏、阿尔泰、南岛、南亚、印欧等五大语系的80多种语言和30多种文字, 50多个民族的文学和文献学, 具有多民族、多语种、多学科的特有学术平台和综合比较研究及群体优势和鲜明的民族学科特色。 中央民族大学少数民族语言文学学院蒙古语言文学专业始建于二十世纪50年代初,是我校最早设置的专业之一。1981年,经国务院学位办第一批博士、硕士学位授予权专业审批,我校获得了蒙古语族语言文学专业硕士学位授予权;1996年开始招收蒙古族民间文学方向的博士研究生;1997年学科专业调整后,蒙古语族语言文学和其他语族语言文学专业合并改称为中国少数民族语言文学(分语族)专业。我专业是中央民族大学的优势、特色学科之一,名师云集、人材辈出。 二、培养目标

语音识别技术的发展与未来

语音识别技术的发展与未来 与机器进行语音交流,让它听明白你在说什么。语音识别技术将人类这一曾经的梦想变成了现实。语音识别就好比“机器的听觉系统”,该技术让机器通过识别和理解,把语音信号转变为相应的文本或命令。 在1952年的贝尔研究所,Davis等人研制了世界上第一个能识别10个英文数字发音的实验系统。1960年英国的Denes等人研制了第一个计算机语音识别系统。 大规模的语音识别研究始于上世纪70年代以后,并在小词汇量、孤立词的识别方面取得了实质性的进展。上世纪80年代以后,语音识别研究的重点逐渐转向大词汇量、非特定人连续语音识别。 同时,语音识别在研究思路上也发生了重大变化,由传统的基于标准模板匹配的技术思路开始转向基于统计模型的技术思路。此外,业内有专家再次提出了将神经网络技术引入语音识别问题的技术思路。 上世纪90年代以后,在语音识别的系统框架方面并没有什么重大突破。但是,在语音识别技术的应用及产品化方面出现了很大的进展。比如,DARPA是在上世界70年代由美国国防部远景研究计划局资助的一项计划,旨在支持语言理解系统的研究开发工作。进入上世纪90年代,DARPA计划仍在持续进行中,其研究重点已转向识别装置中的自然语言处理部分,识别任务设定为“航空旅行信息检索”。 我国的语音识别研究起始于1958年,由中国科学院声学所利用电子管电路识别10个元音。由于当时条件的限制,中国的语音识别研究工作一直处于缓慢发展的阶段。直至1973年,中国科学院声学所开始了计算机语音识别。 进入上世纪80年代以来,随着计算机应用技术在我国逐渐普及和应用以及数字信号技术的进一步发展,国内许多单位具备了研究语音技术的基本条件。与此同时,国际上语音识别技术在经过了多年的沉寂之后重又成为研究的热点。在这种形式下,国内许多单位纷纷投入到

基于中国少数民族语言的语音识别研究

基于中国少数民族语言的语音识别研究 陈楠 (云南民族大学电气信息工程学院,云南昆明 650031) 摘要:语音识别是当今语音研究的热点,它是一门涉及多领域的交叉学科,也是模式识别和人工智能领域的重要分支。针对中国有着55个少数民族这一实际情况,不少语言都处于濒临状态,因此,本文主要介绍了语音识别在少数民族语言应用中的技术和概况。希望利用这一数字化技术达到保护少数民族语言文化遗产的目的。 关键字:语音识别,隐马尔可夫,数字化处理,少数民族语言 Based on China's minority language speech recognition research CHEN Nan (College of Electrical and Information Engineering,Yunnan University of Nationalities,Kunming650031,China) Abstract:Speech recognition is the voice of today's hot, it is an interdisciplinary field involving multiple, pattern recognition and artificial intelligence is an important branch. China has 55 ethnic minority groups for the actual situation, many languages are at the brink of the state, therefore, this paper describes the application of speech recognition in minority languages in the technology and profiles. Hope to use this digital technology to achieve the purpose of protecting the cultural heritage of minority languages. Keywords:speech recognition, Hidden Markov, digital processing, minority languages 1 引言 1.1语音识别技术概述 语音识别技术,也被称为自动语音识别(Automatic Speech Recognition, ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容[1]。 语音识别技术是以语音信号处理为研究对象,让机器接收并识别、理解语音信号,并将其转换为相应数字信号的技术。让机器听懂人类的语言,这是人们长期以来梦寐以求的事情,而语音识别是一门非常复杂的交叉性学科,它涉及语音语言学、计算机科学、信号处理学、生理学、心理学等一系列学科,是模式识别的重要分支。50年代,是语音识别研究工作的开始时期,它以贝尔实验室研制成功可识别十个数字的Audry系统为标志。20世纪80年代语言识别研究进一步走向深入,基于特定人孤立语音技术的系统研制成功。在过去的30年里,隐马尔可夫模型和人工神经元网络在语音识别中得到了成功的应用。 语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。并通过算法和计算机技术相结合的方式来实现。目前,这样的系

中央民族大学中国少数民族语言文学钟进文中国少数民族文学研究考博参考书-考博分数线-专业课真题

中央民族大学中国少数民族语言文学钟进文中国少数民族文学研究考博参考书- 考博分数线-专业课真题 一、专业的设置 中央民族大学少数民族语言文学系每年招收博士生19人,下设语言学及应用语言学、中国古典文献学、中国少数民族语言文学、比较文学与世界文学。 中国少数民族语言文学专业下设李锦芳的汉藏语系语言;钟进文的中国少数民族文学研究。 二、招生专业、人数及考试科目 招生专业中国少数民族语言文学 本专业备注 招生导师(或 导师组) 研究方向考试科目导师备注 钟进文 中国少数民族 文学研究①1001英语或1002俄语或1003日语②2017语言学理论、文学 理论(二选一)③3021汉藏语概论/中国少数民族文学(选 拟招收普通计划生1人 少数民族骨干计划 招生专业中国少数民族语言文学 本专业备注 招生导师 (或导师组) 研究方向考试科目导师备注 钟进文 中国少数民 族文学研究①1001英语或1002俄语或1003日语②2017语言学理论、 文学理论(二选一)③3021汉藏语概论/中国少数民族文 学(选 拟招收少数民族骨干计划生1人 骨干计划考生的定向生源省区:新 疆、其它类、青海、云南、贵州 三、参考书目(推荐) 专业课信息应当包括一下几方面的内容: 第一,关于参考书和资料的使用。这一点考生可以咨询往届的博士学长,也可以和育明考博联系。参考书是理论知识建立所需的载体,如何从参考书抓取核心书目,从核心书目中遴选出重点章节常考的考点,如何高效的研读参考书、建立参考书框架,如何

灵活运用参考书中的知识内容来答题,是考生复习的第一阶段最需完成的任务。另外,考博资料获取、复习经验可咨询叩叩:八九叁,二肆壹,二二陆,专业知识的来源也不能局限于对参考书的研读,整个的备考当中考生还需要阅读大量的paper,读哪一些、怎么去读、读完之后应该怎么做,这些也会直接影响到考生的分数。 第二,专题信息汇总整理。每一位考生在复习专业课的最后阶段都应当进行专题总结,专题的来源一方面是度历年真题考点的针对性遴选,另一方面是导师研究课题。最后一方面是专业前沿问题。每一个专题都应当建立详尽的知识体系,做到专题知识点全覆盖。 第三,专业真题及解析。专业课的试题都是论述题,答案的开放性比较强。一般每门专业课都有有三道大题,考试时间各3小时,一般会有十几页答题纸。考生在专业课复习中仅仅有真题是不够的,还需要配合对真题最权威最正统的解析,两相印证才能够把握导师出题的重点、范围以及更加偏重哪一类的答案。 第四,导师的信息。导师的著作、研究方向、研究课题、近期发表的论文及研究成果,另外就是为研究生们上课所用的课件笔记和讨论的话题。这些都有可能成为初复试出题的考察重点。同时这些信息也是我们选择导师的时候的参照依据,当然选择导师是一个综合性的问题,还应当考虑到导师的研究水平、课题能力、对待学生的态度和福利等等。 第五,时事热点话题分析。博士生导师在选择博士的时候会一般都会偏重考查考生运用基础理论知识来解决现实热点问题的能力,这一点在初试和复试中都有体现。近几年的真题中都会有联系实际的热点分析。所以考生在复习备考时就应单多阅读一些本专业本学科的最新研究方向研究成果,权威的期刊上面“大牛们”都在关心、探讨什么话题,以及一些时事热点问题能不能运用本专业的知识来加以解释解决。 五、中央民族大学考博英语复习指导 中央民族大学大学的考博英语满分100分,题型有如下: Part1:听力,15分钟,15分。共3篇短文,15小题。(有些年份不考)。 Part2:阅读理解,50分钟,45分。共6篇短文,30小题。 Part3:完型填空,30分钟,10分。共20小题。

语音识别技术研究

基于Google技术的语音识别实现 前言 语音识别技术在手机上应用得相当广泛,我们日常最频繁的沟通方式是语音,在手机应用中,大部分是通过硬件手动输入,目前这依然是主要与手机互动的方式,然而对于像手机这种小巧的移动设备来说,使用键盘甚至是虚拟键盘打字是一件非常不爽的事情。于是,Google 推出了强大的语音搜索业务。2008年11月,Google的语音搜索已经在iPhone平台上线,而Android在1.5 SDK版本中也加强了语音识别功能,并应用到了搜索功能上,这的确是一个非常让人惊喜的更新。 Android语音识别 Android系统集成了Google的语音识别技术,我们只需要实现少量代码便可以是使用语音识别。 android语音识别方法一:使用intent调用语音识别程序 1、通过intent传递语音识别的模式 Intent intent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH); 2、语言模式和自由形势的语音识别 intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL,https://www.sodocs.net/doc/1c6809213.html,NGUAG E_MODEL_FREE_FORM); 3、设置语言库 intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE, Locale.CHINA.toString()); 4、开始执行intent、语音识别 intent.putExtra(RecognizerIntent.EXTRA_PROMPT, "请开始说话"); 5、开始 startActivityForResult(intent, 1234); RecognizerIntent包括的常量:

少数民族语言与文字

1、阿昌族 语言:阿昌族有语言。由于特殊的地理环境,大多数阿昌男子会讲汉语和傣语,有的还会讲缅语和景颇语。阿昌语属汉藏语系藏缅语族缅语支。主要分布在中国云南省德宏傣族景颇族自治州的陇川、梁河、潞西以及保山地区的龙陵等县。分陇川、潞西、梁河3个方言。 文字:无本民族文字。 2、德昂族 语言:属南亚语系、佤德昂语支。在中国,主要分布于云南省的潞西、镇康、保山、瑞丽、陇川、耿马、梁河、澜沧、永德和盈江等县。可分为纳盎、布雷、若买 3个方言。 文字:无本民族文字。 3、基诺族 语言:使用基诺语,属汉藏语系藏缅语族彝语支。基诺族有自己的语言,属汉藏语系藏缅语族。 文字:由于无文字,过去多靠刻竹木记事,无本民族文字。 4、蒙古族 语言:云南的蒙古族会彝语和汉语,其蒙古语与北方的蒙古语大致可相通。 文字:使用汉字。 5、布依族 语言:布依语属壮侗语族壮泰语支。 文字:现行的布依文是放弃布壮文字联盟方针之后,于1981年至1985年间拟定的。以布依族较为集中、语音较有代表性的望谟县复兴镇话(属布依语第一土语区)为基础。 6、独龙族 语言:属汉藏语系藏缅语族。语支未定。又名俅语。在中国,主要分布于云南省怒江傈僳族自治州贡山独龙族怒族自治县。分独龙江和怒江两个方言。 文字:独龙族没有文字,1951年,缅甸独龙族江尾列尼池人白吉斗,蒂其吉创造了一种拉丁文拼音文字,以其族名“日旺”命名为“日旺文”,但该文字没有流传开。独龙族的通讯和记事均依靠“刻木”、“结绳”。 7、水族 语言:使用汉语。 文字:使用汉字。 8、满族 语言:使用汉语。 文字:使用汉字。 9、景颇族

语言:属汉藏语系藏缅语族景颇语支。在中国,主要分布在云南省德宏傣族景颇族自治州的潞西、陇川、瑞丽、盈江等县。 文字:景颇人使用的景颇文是一种以拉丁字母为基础的拼音文字。 10、布朗族 语言:属南亚语系孟高棉语族布朗语支(一说属佤德昂语支)。分布在中国云南省部分地区。分布朗、阿尔佤两个方言。布朗方言主要分布于云南省西双版纳傣族自治州勐海县的布朗山、西定、八达、打洛和景洪县的大勐弄等地,人数较多。阿尔佤方言主要分布于云南省的澜沧、双江、镇康等县,内部比较复杂。 文字:无 11、普米族 语言:属汉藏语系藏缅语族羌语支。也有人认为属藏语支。主要分布在中国云南省兰坪、宁蒗、维西、丽江等县。 文字:没有系统的文字,只有一种称其丁巴文的文字。也可以说是无文字。 12、怒族 语言:属汉藏语系、藏缅语族,语支未定。分布于中国云南省怒江傈僳族自治州碧江、福贡、兰坪以及迪庆藏族自治州维西等县。此外,还分布于缅甸喀钦邦北部恩梅开江流域。 文字:无 13、佤族 语言:属南亚语系孟-高棉语族佤-德昂语支(原称佤-崩龙)。有布饶克、阿佤、佤三种方言,每种方言又有土语的差异。在中国主要分布在云南省的沧源、西盟以及孟连、澜沧、双江、耿马和永德等县。 文字:新中国建立前,部分佤族地区使用以拉丁字母拼音的佤文,但其字母不完善;解放后,中国科学院少数民族语言调查第三工作队与云南省少数民族语文指导工作委员会一起对佤语进行调查与分析研究并广泛征求意见,制订了以拉丁字母为基础的《佤(当时称佧佤)文文字方案》(草案),并经批准试行。1958年对草案又做了修改,继续推进并出版了普及读物。 14、纳西族 语言:属汉藏语系藏缅语族彝语支中一种独立的分支语言,同彝语、哈尼语以及拉祜语等有着非常密切的亲缘关系。纳西语在语音方面的特点是:辅音分清浊,其中浊辅音较多;韵母以单元音为主,复元音较少,而且元音往往不分松紧。 文字:一般认为,纳西族有两种传统文字:东巴文和哥巴文。东巴文(纳西象形文字):是一种兼备表意和表音成分的象形文字,文字形态比甲骨文还要原始。被认为是目前世界上唯一仍然活着的象形文字。哥巴文:是一种音节文字。 15、瑶族

语音识别方法及发展趋势分析

语音识别改进方法及难点分析 ——《模式识别》结课小论文 学院:化工与环境学院 学号:2120151177 姓名:杜妮

摘要:随着计算机技术的不断发展,人工智能程度也越来越高,作为人工智能的一部分——模式识别也在模型和算法上愈发成熟。本文根据近105年文献,分析最新声音识别的方法和应用。 关键字:模式识别声音识别方法应用 随着人工智能的迅速发展,语音识别的技术越来越成为国内外研究机构的焦点。人们致力于能使机器能够听懂人类的话语指令,并希望通过语音实现对机器的控制。语音识别的研究发展将在不远的将来极大地方便人们的生活。 语音识别大致的流程包括:特征提取、声学模型训练、语音模型训练以及识别搜索算法。作为一项人机交互的关键技术,语音识别在过去的几十年里取得了飞速的发展,人们在研究和探索过程中针对语音识别的各部流程进行了各种各样的尝试和改造,以期发现更好的方法来完成语音识别流程中的各步骤,以此来促进在不同环境下语音识别的效率和准确率。本文通过查阅近10年国内外文献,分析目前语音识别流程中的技术进展和趋势,并在文章最后给出几项语音识别在日常生活中的应用案例,从而分析语音识别之后的市场走势和实际利用价值。 一、语音识别的改进方法 (一)特征提取模块改进 特征提取就是从语音信号中提取出语音的特征序列。提取的语音特征应该能完全、准确地表达语音信号,特征提取的目的是提取语音信号中能代表语音特征的信息,减少语音识别时所要处理的数据量。语音信号的特征分析是语音信号处理的前提和基础,只有分析出可以代表语音信号本质特征的参数,才能对这些参数进行高效的语音通信,语音合成,和语音识别等处理,并且语音合成的好坏,语音识别率的高低,也都取决于语音特征提取的准确性和鲁棒性。目前,针对特定应用的中小词汇量、特定人的语音识别技术发展已较为成熟,已经能够满足通常应用的要求,并逐步投入了实用。而非特定人、大词汇量、连续语音识别仍是

中国少数民族语言文学专业职业生涯规划书范文格式(原创)

中国少数民族语言文学专业职业生涯规划书范文格式 (原创) 一、前言 每一个人人生中的大部分时间都将在工作中度过,每一个人的职业生命又都是有限的。作为大学生,我们早晚都会步入职场,为了让自己的职业生涯过得更有意义,我们必须学会及早为自己规划好自己的未来。试想一下,如果我们一直呆在大学的象牙塔中浑浑噩噩地度过大学四年,那么毕业势必就意味着失业。与其白白浪费掉四年大好光阴,倒不如未雨绸缪,为自己的将来做好打算。 职业生涯规划是非常重要的,规划职业生涯是一个职业探索与奋斗的历程,好的职业生涯规划可以帮助我们明确自己的奋斗方向,明白自己与理想之间的差距,同时激励我们为之而努力,帮助我们选择最佳的路径实现职业理想,从而实现自我价值。制定职业生涯规划能够帮助我们认识到就业形势,居安思危,同时培养我们的职业能力与职业素质,帮助我们在职场中立于不败之地。 二、自我分析 我来自重庆,重庆火热的天气培养了我活泼、热情的性格,我总是能够用自己的好心情感染别人,为别人带来欢笑。重庆不是个大城市,所以我没有大城市里来的女孩身上那种高高在上的脾气。我是一个简单的人。我没有什么太过远大的目标,没想过要大富大贵,或是权倾天下。我觉得生命的价值只是让自己尽可能地感受到幸福。但正

是因为如此,我比别人更加容易满足,容易了快乐。我很敏锐,总是能够很快地将事情和信息联系起来,然后很自信地根据自己的判断解决问题。我喜欢用欣赏的眼光去看待别人,乐于支持与关心别人。但同时,我也需要别人的肯定,来自他人的掌声总是能激励我做到更好。我喜欢与人交流,在这过程中我学会了倾听与理解他人,在无形中,我结交到了很多朋友,我在他们身上学到了很多书本上永远无法学到的东西,让我受益匪浅。与现在大多数同龄人不同是,我不是独生子女,我还有一个弟弟。作为一个姐姐,我深刻地理解到包容与责任的重要性。 3、就业前景分析 良好就业形势的背后是潜在、旺盛的市场需求。近年来,随着我国改革开放的深入和能源多元化、国内企业海外投资的增长,以及对外文化交流的扩大、国际旅游人数的迅速增长,我国与非洲、美洲、东南亚等非英语国家的交流范围、深度不断扩大和加深,越来越多的外国企业入驻我国境内,其中相当数量是来自非英语国家,因此小语种的作用正日益凸显,许多行业对小语种的需求量还将呈上升趋势。去年以来,虽然受金融危机影响,一些银行、证券、外贸出口、加工工业的招聘职位有所缩减,但小语种专业人才的市场需求却基本保持稳定。不少企业更是抓住了金融危机对经济市场重新调整的契机,积极储备人才,谋求新的发展,这些都为小语种人才的就业创造了新的机会和条件。此外,近年来我国加强了与东盟各国的经济、文化交往,缅甸语作为东南亚语言中重要的一环,亦广受追捧,就业形势比较好。

语音识别研究的背景意义及现状

语音识别研究的背景意义及现状研究的背景及意义 自从人类可以制造和使用各种机器以来,人们就有一个理想,那就是让各种机器能听懂人类的语言并能按人的口头命令来行动,从而实现人机的语言交流。随着科学技术的不断发展,语音识别 (Speech Recognition) 技术的出现,使人类的这一理想得以实现。语音识别技术就是让机器通过识别和理解把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术的结合,使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。当今,语音识别产品在人机认交互应用中己经占到越来越大的比例。 音乐就是一种艺术。通常可以解释为一系列对于有声、无声具有时间性的组织,并含有不同音阶的节奏、旋律及和声。音乐与人的生活情趣、审美情趣、言语、行为、人际关系等等,有一定的关联。音乐是人们抒发感情、表现感情、寄托感情的艺术,不论是唱、奏或听,都内涵着关联人们千丝万缕情感的因素。特别对人的心理,会起着不能用言语所能形容的影响作用。 音乐可以通过几种途径来体验,而音乐播放器是现代生活中最便捷 , 最实用的一种。现如今社会在飞速发展,人们的生活节奏也在不断加快,工作压力也在日益增大,致使越来越多的人选择在闲暇时间放松自己。而听音乐就成了人们缓解生活压力的第一选择,医学表明音乐不仅可以对人们紧张的心情带来放松,还能有效的缓解高血压对心血管造成的压力。因此音乐播放器已经成为人们日常生活中至关重要的物品。 然而可惜的是,传统的音乐播放器通常上是通过两种方式实现人们对播放器的控制的:一是按键式控制(其中也包括线控式),通过直接按键改变电平发出指令;二是通过远程控制,通过红外线或者蓝牙等对播放器发布命令。这对于疲劳中的人们或者残障人士来说是不方便的。为了减少手动操作的繁琐,此次设计专门致力于研究一种方案通过语音控制来实现对音乐播放器的控制,使其更加方便、更加人性化,实现音乐播放器的全自动语音控制。这个设计不仅是为了解决人们日常使用传统音乐播放器不方便的烦恼,而且是为了研究语音识别技术在单片机中的应用,特别是在SPCE061中实现语音识别的应用,设计出具有语音控制功能的音乐播放器。 国内外研究现状 语音识别的研究工作可以追溯到 20世纪50年代AT&T贝尔实验室的Audry 系统,它是第一个可以识别十个英文数字的语音识别系统。 但真正取得实质性进展,并将其作为一个重要的课题开展研究则是在 60年代末

中国少数民族语言文学论文题目选题参考

https://www.sodocs.net/doc/1c6809213.html, 中国少数民族语言文学论文题目 一、最新中国少数民族语言文学论文选题参考 1、伊犁师范学院人文学院中国少数民族语言文学(哈萨克语言文学) 2、伊犁师范学院人文学院中国少数民族语言文学(锡伯语言文学) 3、伊犁师范学院自治区级重点学科中国少数民族语言文学(哈萨克语言文学)简介 4、特色学科地缘优势打造品牌广西民族大学中国少数民族语言文学学 科简介 5、黑龙江大学满族语言文化研究中心中国少数民族语言文学(满语)学科学术带头人 6、黑龙江大学满族语言文化研究中心中国少数民族语言文学(满语)学科 7、满族语言文化研究中心中国少数民族少数语言文学(满语)学科 8、三峡大学中国少数民族语言文学专业2012年硕士研究生招生简章 9、伊犁师范学院人文学院自治区重点学科——中国少数民族语言文学(哈 萨克语言文学)简介 10、中国现当代少数民族文学的语言与表述问题 11、“中国社会转型与多民族语言文学发展关系暨少数民族语言文学学科 建设”研讨会召开 12、“双语”教学背景下的少数民族语言文学专业《中国文学系列作品选》课程探究 13、第二课堂活动在中国古代文学作品选读课程中的实施探讨——以新疆 某高校汉语言专业少数民族本科生教学为例 二、中国少数民族语言文学论文题目大全 21、伊犁师范学院人文学院中国少数民族语言文学(哈萨克语言文学) 22、伊犁师范学院人文学院中国少数民族语言文学(锡伯语言文学)

https://www.sodocs.net/doc/1c6809213.html, 23、伊犁师范学院自治区级重点学科中国少数民族语言文学(哈萨克语言文学)简介 24、特色学科地缘优势打造品牌广西民族大学中国少数民族语言文学学科简介 25、黑龙江大学满族语言文化研究中心中国少数民族语言文学(满语)学科 学术带头人 26、黑龙江大学满族语言文化研究中心中国少数民族语言文学(满语)学科 27、满族语言文化研究中心中国少数民族少数语言文学(满语)学科 28、三峡大学中国少数民族语言文学专业2012年硕士研究生招生简章 29、伊犁师范学院人文学院自治区重点学科——中国少数民族语言文学(哈萨克语言文学)简介 30、中国现当代少数民族文学的语言与表述问题 31、“中国社会转型与多民族语言文学发展关系暨少数民族语言文学学科 建设”研讨会召开 32、“双语”教学背景下的少数民族语言文学专业《中国文学系列作品选》课程探究 33、第二课堂活动在中国古代文学作品选读课程中的实施探讨——以新疆 某高校汉语言专业少数民族本科生教学为例 三、热门中国少数民族语言文学专业论文题目推荐 21、伊犁师范学院人文学院中国少数民族语言文学(哈萨克语言文学) 22、伊犁师范学院人文学院中国少数民族语言文学(锡伯语言文学) 23、伊犁师范学院自治区级重点学科中国少数民族语言文学(哈萨克语言文学)简介 24、特色学科地缘优势打造品牌广西民族大学中国少数民族语言文学学科简介

全国56个民族有129种语言.

全国56个民族有129种语言 路艳霞 北京日报2008.2.2 (9) 历经半个世纪调查和撰写,40多种语言首次公布,中国首部盘点民族语言专著《中国的语言》近日出版 中国幅员辽阔,共有56个民族,历来被世界公认为拥有语言资源的富矿,语言工作者因此被国外同行煞是羡慕。经过几代学者的艰辛努力,最近,中国第一部大型语言国情学术专著《中国的语言》面世,它第一次面向世界公布中国语言的整体状况:中国56个民族有129种语言。 从学者的个人田野调查、口问笔录,到归纳整理,反复核对;从一个个具体语言的描写研究,再到129种语言的综合集成,129种语言的盘点,历经半个世纪之久。 该书由商务印书馆出版,分概论、汉藏语系、阿尔泰语系、南岛语、南亚语、印欧语、混合语等7编,360万字,共有90多位学者参与编写,在编写过程中,已有10位学者先后过世。该书所展示的129种语言中,有五分之一是专为本书撰写的,40多种语言为第一次公布,其中相当部分语言已经濒危或正在走向濒危,个别语言在研究资料公布之际,已经完全失去交际功能。不过,就在该书编辑结束后,学者又发现了5种少数民族语言,北京大学教授陈保亚和其他专家因此认为,我国语言的种类还会增加。 一个民族好几种语言 作为外行人,每当看到129这个数字总会惊讶,为什么56个民族会有129种语言? 《中国的语言》主编孙宏开教授说,我国有55个少数民族,基本上每个少数民族都有自己的语言,不少民族还使用两种或多种语言。有一些少数民族除了使用母语以外,还使用另外一种或几种语言。像蒙古族主要使用蒙古语,但云南的蒙古族还使用卡卓语,新疆的蒙古族还使用图瓦语;景颇族主要使用景颇语,但部分景颇族还使用载瓦、浪速、波拉、勒期等语言;回族一般都使用汉语,但海南省三亚附近的回族使用回辉语,青海省尖扎县部分地区的回族使用康家语等。有的少数民族使用两种或多种不同的母语,像西藏的珞巴族分别使用博嘎尔语、苏龙语、义都语、崩汝语等;云南的怒族使用怒苏语、柔若语、阿侬语等。 汉族的语言不止汉语 很少有人知道,汉族作为人数最多的民族,虽说主要使用汉语,但还有一些汉族人在说临高语、标话、村语、茶洞语。 为什么会出现这种情况?专家解释说,有一些讲少数民族语言的居民,在民族识别的过程中,他们自报的是汉族,一直延续到现在。比如说,海南岛临高县有五十多万的临高人,他们自己报的是汉族,但是使用的语言却是少数民族语言,它跟侗台语族的语言比较接近,如与壮族、布依族、傣族、毛南族、水族等等民族使用的语言比较接近,属于同一个语族。再比如,广东省的怀集县,在这个县有一部分汉族,这七万多人自称是“标”人,但是他们讲的语言,实际上也是一种少数民族语言,在学术界,这种语言叫标话。 空白语言是如何发现的 一直到今天,语言学家仍然无法回答除汉语以外我国究竟有多少种少数民族语言。发现一种空白语言,对他们来说无异于发现一个新大陆。 “多数空白语言是在进行大语种调查时偶然发现的,有目的地去发现、调查空白语言,要在分布如此广阔的地区普遍调查小语种,好似大海捞针。我们的办法是发动所有开展少数民族语言实地调查的学者,有机会在少数民族语言分布地区调查研究时,通过各种方式对有差异的民族语言进行地毯式的排查、访问、记录和分析。”孙宏开说。

中国少数民族语言文学(彝缅语族语言文化)本科专业培养方案

中国少数民族语言文学(彝缅语族语言文化)本科专业培养方案 一、学制四年 二、授予学位文学学士 三、专业培养目标 本专业主要为国家相关科研机构、涉东南亚事务机构、经贸部门以及西部少数民族地区相关机构培养和输送德、智、体、美全面发展,兼通汉语言文学与彝缅语族语言文化知识与技能,熟悉南方少数民族以及缅甸等东南亚国家语言文化的复合型人才。 少数民族语言文学系的本科教育办学宗旨是“奠定专业基础、拓宽知识领域、提高语言技能、增强竞争实力”。本专业除了培养学生具有扎实的语言学理论基础、相关学科基本知识以及创新意识外,还加强对学生进行专业外语方面的培养,使他们能够及时掌握国外语言文化领域研究和发展的最新动态,一方面为更高层次的专业学习做好准备,另一方面将所掌握的知识有效地运用到将来的工作岗位,发挥专业特长。 四、人才基本规格 1.热爱社会主义祖国,拥护中国共产党,具有良好的思想品德、社会公德和职业道德,爱岗敬业,艰苦求实,愿为社会主义现代化服务。 2.具备良好的语言学理论基础及相关学科的基本知识、一定的外语(英语、缅甸语)和少数民族语言知识技能,具有创新精神,能将所学的专业理论知识和技能运用于民族语言文化研究、语言文化对比研究、涉外语言交际、民族地区汉语教学及双语教学、民族事务、编辑与出版等方面的工作。 3.具有健康的体魄,了解体育运动的基本知识,通过《学生体质健康标准》测试。五、知识结构和能力结构 1.掌握中国语言文学学科基本知识,包括古代、现代汉语知识,古代、现当代文学知识。 2.掌握普通语言学、中外彝缅语民族社会历史文化、彝缅语民族史、藏缅语比较等专业基础知识,能较熟练地使用彝缅语族的一种语言。 3.要求具有一定的民族学、民族关系史等相关学科基础。 4.除专业必修的缅甸外,再掌握一门通用外语,同时对文秘、旅游管理、行政管理等社会化基本知识有所了解。 5.能熟练操作计算机,具备语言文字工作现代化技能,包括语言文字信息管理和处理、民族文字编辑出版等方面的技能,具有一定的语言翻译(缅汉、英汉双向)能力和语言文字表达能力,同时具有较强的专业自学和创新能力。 六、主干学科中国语言文学 七、主要课程 语言学概论、现代汉语、古代汉语、语言调查、中国古代文学简史、彝缅语族概论、中国语文概要、民族语基础、民族语语法、基础缅语、缅语听力等。 八、课程类别及学时学分分配 课程类别学 %各学期学时分配 时学 例 分比 (

语音识别研究的背景意义及现状

语音识别研究的背景意义及现状 研究的背景及意义 自从人类可以制造和使用各种机器以来,人们就有一个理想,那就是让各种机器能听懂人类的语言并能按人的口头命令来行动,从而实现人机的语言交流。随着科学技术的不断发展,语音识别(Speech Recognition)技术的出现,使人类的这一理想得以实现。语音识别技术就是让机器通过识别和理解把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术的结合,使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。当今,语音识别产品在人机认交互应用中己经占到越来越大的比例。 音乐就是一种艺术。通常可以解释为一系列对于有声、无声具有时间性的组织,并含有不同音阶的节奏、旋律及和声。音乐与人的生活情趣、审美情趣、言语、行为、人际关系等等,有一定的关联。音乐是人们抒发感情、表现感情、寄托感情的艺术,不论是唱、奏或听,都内涵着关联人们千丝万缕情感的因素。特别对人的心理,会起着不能用言语所能形容的影响作用。 音乐可以通过几种途径来体验,而音乐播放器是现代生活中最便捷,最实用的一种。现如今社会在飞速发展,人们的生活节奏也在不断加快,工作压力也在日益增大,致使越来越多的人选择在闲暇时间放松自己。而听音乐就成了人们缓解生活压力的第一选择,医学表明音乐不仅可以对人们紧张的心情带来放松,还能有效的缓解高血压对心血管造成的压力。因此音乐播放器已经成为人们日常生活中至关重要的物品。 然而可惜的是,传统的音乐播放器通常上是通过两种方式实现人们对播放器的控制的:一是按键式控制(其中也包括线控式),通过直接按键改变电平发出指令;二是通过远程控制,通过红外线或者蓝牙等对播放器发布命令。这对于疲劳中的人们或者残障人士来说是不方便的。为了减少手动操作的繁琐,此次设计专门致力于研究一种方案通过语音控制来实现对音乐播放器的控制,使其更加方便、更加人性化,实现音乐播放器的全自动语音控制。这个设计不仅是为了解决人们日常使用传统音乐播放器不方便的烦恼,而且是为了研究语音识别技术在单片机中的应用,特别是在SPCE061A中实现语音识别的应用,设计出具有语音控制功能的音乐播放器。 国内外研究现状

中国少数民族语言文学专业人才培养方案

中国少数民族语言文学专业人才培养方案 一、培养目标 本专业培养具有彝、汉语言文学的基本知识以及与专业有关的新闻、文学艺术、历史哲学、翻译学、心理学、教育学、行政管理学、逻辑学、民族学等相关学科的知识,能在少数民族地区文化教育、党政管理部门及其它相关单位从事教学、科研、行政管理、文秘、翻译、编辑、新闻出版、文学创作等方面工作的应用型高职业技能素质的高级专门人才。 二、培养规格 (一)知识结构 1、具有扎实的中国少数民族语言文学(彝语言文学)专业必需的基础理论知识; 2、具有扎实的汉语言文学专业必需的相关基础理论知识; 3、掌握马克思主义的基本原理和有关民族语言文学的基本理论; 4、掌握彝汉语言文学的基本知识以及与专业有关的新闻、文学艺术、历史哲学、翻译学、心理学、教育学、行政管理学、逻辑学、民族学等相关学科的知识; 5、掌握我国民族语言文字和文学艺术的方针、政策及法规知识; 6、掌握计算机应用技能,能应用现代教育技术进行辅助彝汉双语教学和研究。 (二)能力结构 1、基本能力 (1)具有民族文献资料的查询方法,有较强的协作能力和初步的科研能力; (2)具有较强的彝汉语言、文学修养和鉴赏能力; (3)具备运用辩证唯物主义的基本观点和方法去认识,分析和解决问题的能力; (4)具备较强的彝汉双的语言及文字表达能力; (5)具备运用彝、汉语言文学的听、说、读、写、译能力; (6)具备利用计算机常用软件进行文字和信息处理的能力; (7)具有掌握新知识、新技术的自学和继续学习及自主创业的能力; 2、专业能力 (1)具备依据实际需求组织生产,管理生产,服务生产的能力; (2)具备在少数民族地区各级党政机关、社会团体等部门从事业务和

语音识别技术的发展与未来

语音识别技术的发展与未来-标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

语音识别技术的发展与未来 与机器进行语音交流,让它听明白你在说什么。语音识别技术将人类这一曾经的梦想变成了现实。语音识别就好比“机器的听觉系统”,该技术让机器通过识别和理解,把语音信号转变为相应的文本或命令。 在1952年的贝尔研究所,Davis等人研制了世界上第一个能识别10个英文数字发音的实验系统。1960年英国的Denes等人研制了第一个计算机语音识别系统。 大规模的语音识别研究始于上世纪70年代以后,并在小词汇量、孤立词的识别方面取得了实质性的进展。上世纪80年代以后,语音识别研究的重点逐渐转向大词汇量、非特定人连续语音识别。 同时,语音识别在研究思路上也发生了重大变化,由传统的基于标准模板匹配的技术思路开始转向基于统计模型的技术思路。此外,业内有专家再次提出了将神经网络技术引入语音识别问题的技术思路。 上世纪90年代以后,在语音识别的系统框架方面并没有什么重大突破。但是,在语音识别技术的应用及产品化方面出现了很大的进展。比如,DARPA是在上世界70年代由美国国防部远景研究计划局资助的一项计划,旨在支持语言理解系统的研究开发工作。进入上世纪90年代,DARPA计划仍在持续进行中,其研究重点已转向识别装置中的自然语言处理部分,识别任务设定为“航空旅行信息检索”。 我国的语音识别研究起始于1958年,由中国科学院声学所利用电子管电路识别10个元音。由于当时条件的限制,中国的语音识别研究工作一直处于缓慢发展的阶段。直至1973年,中国科学院声学所开始了计算机语音识别。 进入上世纪80年代以来,随着计算机应用技术在我国逐渐普及和应用以及数字信号技术的进一步发展,国内许多单位具备了研究语音技术的基本条件。与此同时,国际上语音识别技术在经过了多年的沉寂之后重又成为研究的热点。在这种形式下,国内许多单位纷纷投入到这项研究工作中去。 1986年,语音识别作为智能计算机系统研究的一个重要组成部分而被专门列为研究课题。在“863”计划的支持下,中国开始组织语音识别技术的研究,并决定了每隔两年召开一次语音识别的专题会议。自此,我国语音识别技术进入了一个新的发展阶段。 自2009年以来,借助机器学习领域深度学习研究的发展以及大数据语料的积累,语音识别技术得到突飞猛进的发展。

语音识别开题报告

青岛大学 毕业论文(设计)开题报告 题目:孤立词语音识别的并行编程实现 学院:自动化工程学院电子工程系 专业:通信工程 姓名:李洪超 指导教师:庄晓东 2010年3月22日

一、文献综述 语音识别是解决机器“听懂”人类语言的一项技术。作为智能计算机研究的主导方向和人机语音通信的关键技术,语音识别技术一直受到各国科学界的广泛关注。如今,随着语音识别技术研究的突破,其对计算机发展和社会生活的重要性日益凸现出来。以语音识别技术开发出的产品应用领域非常广泛,如声控电话交换、信息网络查询、家庭服务、宾馆服务、医疗服务、银行服务、工业控制、语音通信系统等,几乎深入到社会的每个行业和每个方面。 广泛意义上的语音识别按照任务的不同可以分为4个方向:说话人识别、关键词检出、语言辨识和语音识别[1]。说话人识别技术是以话音对说话人进行区别,从而进行身份鉴别和认证的技术。关键词检出技术应用于一些具有特定要求的场合,只关注那些包含特定词的句子。语言辨识技术是通过分析处理一个语音片断以判别其所属语言种类的技术,本质上也是语音识别技术的一个方面。语音识别就是通常人们所说的以说话的内容作为识别对象的技术,它是4个方面中最重要和研究最广泛的一个方向,也是本文讨论的主要内容。 1.1 语音识别技术现状 1.1.1 语音识别获得应用 伴随着语音识别技术的不断发展,诞生了全球首套多语种交谈式语音识别系统E-talk。这是全球惟一拥有中英混合语言的识别系统,能听能讲普通话、广东话和英语,还可以高度适应不同的口音,因而可以广泛适用于不同文化背景的使用者,尤其是中国地区语言差别较大的广大用户。由于E-talk可以大大提高工作效率,降低运营成本,并为用户提供更便捷的增值服务,我们相信它必将成为电信、证券、金融、旅游等重视客户服务的行业争相引用的电子商务应用系统,并成为电子商务发展的新趋势,为整个信息产业带来无限商机。 目前,飞利浦推出的语音识别自然会话平台SpeechPearl和SpeechMania已成功地应用于国内呼叫中心,SpeechPearl中的每个识别引擎可提供高达20万字的超大容量词库,尤其在具有大词汇量、识别准确性和灵活性等要求的各种电信增值服务中有着广泛的应用。 1.1.2 语音合成信息服务被用户接受 语音合成技术把可视的文本信息转化为可听的声音信息,其应用的经济效益和社会效益前景良好。尤其对汉语语音合成技术的应用而言,全球有十几亿人使用中文,其市场需求、应用前景和经济效益等可见一斑。

全民族都通用汉语的几个少数民族

全民族都通用汉语的几个少数民族,很自然地以汉字作为自己的文字,没有与自己语言相一致的文字的少数民族,大多也选择了汉字作为自己的文字。现在中国55个少数民族中,除回族、满族已不使用自己民族的文字而直接使用汉字外,有29个民族有与自己的语言相一致的文字。 1、语言 现在除少数几个民族程度不同地转用了汉语外,多数民族以本族语言作为日常生活的主要交际工具;一些民族有传统的文字,一些民族使用新创文字。少数民族语言文字在少数民族社会生活中起着十分重要的、其他民族的语言文字无法完全替代的作用。 目前少数民族语言的使用情况大致有以下三种类型: 第一种类型,如蒙古、藏、维吾尔、哈萨克、朝鲜等族,有大片聚居区,人口均在百万以上,文字历史也比较悠久,他们的语言除了在家庭内部、邻里亲友间使用外,还在本民族的政治、经济、文化、教育各个领域中使用,甚至在一些邻近的或者杂居在一起的其他民族中使用。 第二种类型,如彝族和傣族,他们虽然也有成片的聚居区,有传统的文字,但是文字没有统一的规范,方言差异也较大,本民族的语言在社会上的应用不如蒙古、藏、维吾尔、哈萨克、朝鲜等民族那么广泛。壮语和僳僳语、拉祜语、景颇语、载瓦语由于语言内部差别较大,全民族通用的共同语还没有形成,文字的使用范围也很小,语言使用情况与彝语、傣语接近。 第三种类型,民族的语言只在本民族内部日常生活中使用,在政治生活、学校教育中往往使用其他民族的语言(主要是汉语,有些地方也使用其他少数民族语言);没有与本民族语言相一致的文字,一般使用汉字。属于这个类型的少数民族语言相当多,大约占语言总数的四分之三以上,使用人口占少数民族总人口的一半以上。55个少数民族使用语言的情况列表如下(不包括兼用汉语或其他少数民族语言的情况):民族名称使用语言的名称 蒙古族蒙古语 回族汉语 藏族藏语 维吾尔族维吾尔语 苗族苗语 彝族彝语 壮族壮语 布依族布依语 朝鲜族朝鲜语 满族汉语 侗族侗语 瑶族勉语、布努语、拉珈语 白族白语 土家族土家语 哈尼族哈尼语 哈萨克族哈萨克语 傣族傣语 黎族黎语 僳僳族僳僳语 佤族佤语 畲族畲语 高山族泰耶尔语、赛德语、邹语、沙阿鲁阿语、卡那卡、那布语、排湾语、阿眉斯语、布农语、鲁凯语、卑南语、邵语、萨斯特语、耶眉语 拉祜族拉祜语 水族水语 东乡族东乡语 纳西族纳西语 景颇族景颇语、载瓦语

相关主题