当前位置：搜档网 › 机器翻译研究综述

机器翻译研究综述

机器翻译综述

1.引言

1.1机器翻译的历史

现代机器翻译的研究应该是从20世纪50年代开始，但是早在这以前很多人已经提出了相应的想法，甚至是远在古希腊时期就有人提出要用机器来进行语言翻译的想法。

在1946年，美国宾夕法尼亚大学的两位科学家设计并制造了世界上第一台电子计算机。与此同时，英国工程师同美国洛克菲勒基金会副总裁韦弗在讨论计算机的应用范围时，就提出了利用计算机实现语言的自动翻译的想法。在1949年，韦弗发表了一份名为《翻译》的备忘录，正式提出了机器翻译问题。他提出了两个主要观点：

第一，他认为翻译类似于解读密码的过程。

第二，他认为原文与译文“说的是同样的事情”，因此，当把语言A翻译为语言B时，就意味着从语言A出发，经过某一“通用语言”或“中

间语言”，可以假定是全人类共同的。

在这一段时间由于学者的热心倡导，实业界的大力支持，美国的机器翻译研究一时兴盛起来。

1964年，美国科学院成立语言自动处理咨询委员会，调查机器翻译的研究情况，给出了“在目前给机器翻译以大力支持还没有多少理由”的结论，随后机器翻译的研究就陷入了低潮期。直到70年代以后机器翻译的研究才重新进入了一个复苏期，随后机器翻译的发展又迎来了繁荣期

1.2机器翻译的主要内容

经过50多年的发展，在机器翻译领域中出现了很多的研究方法，总结如下：●直接翻译方法

●句法转换方法

●中间语言方法

●基于规则的方法

●基于语料库的方法

基于实例的方法（含模板、翻译记忆方法）

基于统计的方法

在当前的研究中，更多的是基于统计的方法进行的，因为基于统计的方法可以充分的利用计算机的计算能力，并且并不需要过多的语言学知识作为支撑，可以让更多的计算机科学家投入到实用系统的研究中，极大的促进了统计机器翻译的发展。

下面对各个方法逐一的进行介绍。

2.机器翻译主要方法

2.1直接翻译方法

所谓直接翻译方法就是从句子的表层出发，将单词、词组、短语甚至是句子直接置换成目标语言译文，有时进行一些简单的词序调整实现翻译，并不进行深层次的句法和语义分析。直接翻译方法也是早期翻译系统常用的方法。在1954年，美国乔治敦大学用IBM计算机进行了首次机器翻译的实验后来IBM提出的统计机器翻译模型也可以认为是采用了这一思想。

这种方法只能是作为研究初期的一种方法，因为方法本身就是一个很成熟的方法，举例如下：

How are you？直接翻译结果：怎么是你

How old are you？直接翻译结果：怎么老是你

从这个翻译结果就可以看到直接翻译方法的结果是非常不好的，直接翻译方法仅能满足特定译文生成的需要，比如说只在语言特点较为相似的语言之间的翻译效果较好。对于像英汉语言这样差异较大的语言的翻译就不能使用直接翻译的方法。鉴于直接翻译方法在机器翻译研究中的局限性，现如今几乎没有人继续在这个方法上进行进一步的研究，所以该方法只是在50、60年代作为机器翻译的起始研究方法存在。

2.2句法转换方法

1957年，美国学者V. Yingve在Framework for Syntactic（句法翻译框架）中提出了句法转换方法。

整个过程分为“分析”、“转换”、“生成”三个阶段，分别如下：

分析：将将源语言句子转换成源语言申城结构；在分析的过程中，有相关分析和独立分析两类。所谓相关分析就是在分析时需要考虑目标语言的特点。而独立分析就是分析过程与目标语言无关。

转换：将源语言深层结构转换为目标语言的深层结构；

生成阶段：由目标语言深层结构生成目标语言句子；生成过程也有两类：相关生成和独立生成。即相关生成是在生成时需要考虑语言的特点，而独立生成的生成过程与源语言无关。

理想的转换方法应该做到独立分析和独立生成，这样在进行多语言机器翻译的时候可以大大的减少分析和生成的工作量。但独立分析和独立生成同样也会造成翻译质量的下降。

转换方法的优点是可以较好的保持原文结构，产生的译文结构与原文结构关系密切，尤其对于语言现象已知或句法结构规范的源语言句子具有较强的处理能力和较好的翻译效果。主要不足就是：分析规则由人工编写，工作量大，规则的主观性强，规则的一致性难以保障，不利于系统扩充[1]。

2.3中间语言方法

中间语言翻译方法首先将源语言句子分析成一种与具体语言无关的通用语言或中间语言，然后再由中间语言得到目标语言。整个翻译过程分为“分析”和“生成”两个部分。中间语言的优点在于进行多语种翻译的时候，只需要对每种语言分别开发一个分析模块和一个生成模块，模块总数为2*n，相比之下，如果采用转换方法就需要对每两种语言之间都开发一个转换模块，模块总数为n*(n-1)。

虽然基于中间语言的机器翻译方法能够减少系统实现的工作量，但是如何定义和设计中间语言的表达式并不是一件容易的事情，中间语言在语义表达的准确性、完整性、鲁棒性和领域的可移植性等诸多方面都存在问题[1]。

在基于中间语言机器翻译的基础之上，文献[2]采用统计的方法实现源语言到中间语言的转换和中间语言到目标语言的转换，用以实现一个语音到语音的翻译系统。这种方法从思想方法上已经属于基于统计的范畴，但在技术方法上依然属于中间语言的方法。现在纯粹基于中间语言的方法现在也很少能够引起研究人员的关注。

2.4基于规则的机器翻译方法

自从乔姆斯基的转换生成语法提出后，基于规则的方法一直就是机器翻译研究的主流，乔姆斯基认为一种语言无限的句子可以由有限的规则推导出来[3]。后来法国著名机器翻译专家沃古瓦（B. Vauquois）教授把基于语言规则的机器翻译方法的翻译过程总结为如下图形，这个图形又被称为“机器翻译金字塔”[4]：

图1 机器翻译金字塔

基于规则的方法的优点在于直观，能够表达精确地语言学家的知识，而且规则的颗粒度有很强的可伸缩性：（1）大颗粒度的规则具有很强的概括能力；（2）小颗粒度的规则具有精细的描述能力。能够处理复杂的结构和进行深层次的理解，系统适应性较强，不依赖于具体的训练语料。基于规则的方法同样也存在问

题：（1）规则是由人制定的，主观因素重；（2）规则的覆盖性较差，特别是细粒度的规则很难总结的比较全面；（3）没有很好的办法解决规则之间的冲突。文献[3]中提到复杂特征集和合一运算[5]的提出使用更细粒度、更加准确的知识表示形式来描述规则。同时针对确定性规则降低了系统的鲁棒性的缺点，概率上下文无关文法[6]从全局最优的角度考虑，产生最优的翻译结果[3]。随着这些方法的引入，传统的基于规则的机器翻译方法逐步向以规则为基础、语料库方法为辅助的更高层次的机器翻译方法的研究。

2.5基于语料库的方法

在基于规则的机器翻译方法的研究面临一定的问题的情况下，很多学者就开始研究是否可以不依赖于人工制定的规则来进行机器翻译，即从大量语料中学习翻译知识。基于语料库的翻译方法拥有无需人工编写规则、从语料库中学习得到的知识比较客观、从语料库中学习到的知识的覆盖性比较好的优点。但同时，基于语料库的翻译方法同样也存在一定的问题：（1）翻译系统性能依赖于语料库；（2）数据稀疏问题严重；（3）语料库中不大容易得到大颗粒度的高概括性知识。所以说在机器翻译的众多方法中没有哪种方法可以说自己是没有缺点的，只是不同的方法在不同的应用领域中有各自的优点。

目前基于语料库的方法主要有基于实例的机器翻译和基于统计的机器翻译两种方法[7]。

2.5.1基于实例的机器翻译方法

日本学者长尾真（Makoto Nagao）提出了基于实例的机器翻译方法[8]。

在基于实例的机器翻译系统中，系统的知识来源是双语对照的翻译实例库，实例苦衷主要有两个字段，一个字段保存源语言句子，另一个句子保存与之对应的译文。

每输入一个源语言句子时，系统把这个句子同实例库中的源语言句子进行比较，找出与这个句子最为相似的句子，并模拟与这个句子相对应的译文，最后输出译文。

该方法的优点是：

（1）直接使用对齐的语料库作为知识表现形式，知识库的扩充非常简单；

（2）不需要进行深层次的语言分析，也可以产生高质量的译文。

缺点是覆盖率低，实用的翻译系统需要的实例库的规模极大（百万句对以上）。

2.5.2基于记忆的机器翻译方法

在基于实例方法的基础上，日本学者佐藤聡（Satoshi Sato）提出了一个衍生的方法——基于记忆的翻译方法[9]。

基于翻译的方法是基于实例方法的特例，同样都需要建立一个实例库，但是作为衍生方法，同样有其独特之处。该方法的基本思想为：把已经翻译过的句子保存

起来；在翻译一个新句子的时候，直接到语料库中查找，如果发现相同的句子，直接输出译文，否则交给人去翻译，但可以通过系统提供一个相似的句子作为参考译文。该方法的优缺点主要有：

●翻译质量有保证；

●随着使用时间的增长，匹配成功率逐步提高；

●特别适用于重复率高的文本翻译，例如公司的产品说明书；

●与语言无关，适用于各种语言对；

●缺点是在刚开始使用时匹配成功率不高，无法给出较为合理的参考译文。

2.5.3基于统计的机器翻译方法

如果说在机器翻译研究的初期，基于规则的方法是主流，吸引了大部分的研究人员的注意力的话，那现在就是基于统计方法大显身手的时候，目前基于规则的方法的研究依然在进行，只不过，更多的是作为统计机器翻译方法的补充方法。

其基本思想是为翻译过程建立模型，把翻译理解为搜索问题，即从所有可能的译文中选择概率最大的译文，而同为基于语料库方法的实例翻译方法则无需建立统计模型。在基于实例的翻译方法中，语言知识表现为实例本身，而统计机器翻译汇总，翻译知识表现为模型参数[7]。

基于统计方法的优点：

1)无需人工编写规则，利用语料库直接训练得到机器翻译系统；

2)系统开发周期短；

3)只要有足够多的语料，很容易适应新的领域或者语种。

缺点是：

1)时空开销大，进行模型参数的计算需要消耗较多的计算资源；

2)数据稀疏问题严重，当语料缺乏或语料的覆盖面不够全的时候就容易出

现无法统计出需要的语言知识的情况；

3)对语料库依赖严重，所有的工作都建立在语料库的基础上，好的语料库

可以产生较好的翻译结果，反之就会影响到翻译质量。

4)有时需要规则的方法进行辅助

基于统计的机器翻译方法主要有以下3种：

基于词的统计机器翻译

基于短语的机器翻译

基于句法的统计机器翻译

下面就是这3种方法的详细介绍。

2.5.

3.1基于词的统计机器翻译

在基于统计的机器翻译方法中首先发展起来的就是基于词的机器翻译方法。IBM公司的Peter F. Brown 等人在1990年提出了基于统计的机器翻译方法，他们使用的就是基于词的机器翻译方法[10]。

他们为翻译建立了概率模型，在文献中他们使用的英语句子和法语句子之间的翻译作为实例。

假设人一个英语句子e和法语句子f，我们定义f翻译成e的概率为：

于是将f翻译成e的问题就变成求解问题：.

通过提出噪声信道模型将以上计算公式改写为

其中P（E）为语言模型，反应“E像一个英语句子”的程度：称为流利度。P（F|E）为翻译模型，反应“F像E的程度”：称为忠诚度。在研究中，采用N 元语法模型计算P（E），在文献[11]中提出了5个基本的翻译模型用于计算P（F|E），进一步完善了基于词的机器翻译方法，也为统计机器翻译方法奠定了坚实的基础。

而自从IBM提出了统计机器翻译模型之后，一些研究人员也在做着改进的工作，由于对位模型是统计机器翻译方法中的关键模型，所以对对位模型的改进工作也受到很大的关注。Vogel在1996年提出了基于首序隐马尔可夫的词对位模型[12]是一项比较重要的改进工作，这种方法也常被称为首序对位模型[1]。在首序对位模型中，他们认为在一个句子内的所有的词并不是在各个位置上随意分布的，而是趋向于聚类的，即在一种语言的一个句子中临近的单词，在对应的另外一种语言中的单词同样会有这种临近关系。Vogel等人通过对一些欧洲语言对的分析，认为临近词在两种语言的句子内相对位置之间的差小于3[12]。

另外，王野翊在1998年提出了另外一种对位模型的改进方法——基于结构的对位模型[13]。由于IBM的模型完全没有考虑句子的结构信息，使得人们怀疑IBM的模型能否在句法结构相差加大的语言对中获得成功[14]。基于结构的对位模型的基本思想是，首先通过粗对齐模型对源语言和目标语言的短语进行对齐，然后利用细化的对齐模型对短语内的单词进行对齐。王野翊的实验表明，结构的引入不仅使统计机器翻译的正确率有所提高，同时还提高了整个系统的效率。

2.5.

3.2基于短语的机器翻译模型

基于词的翻译模型存在一定的问题[7]：

以词作为翻译的最小单位，对于一个词翻译到多个词的情况，都分解成一个词到一个词的概率

只刻画了词到词的翻译概率，词翻译的时候没有考虑上下文，难以刻画一定的搭配、习惯用法的解释

次序调整的复杂性，IBM模型中词序调整模型过于简单，很难刻画复杂的次序调整规律

Daniel Marcu 在2002年提出了基于短语的联合概率翻译模型[15]，而P. Koehn 等人在2003年提出了短语翻译对的提取方法[16]。

其基本思想是[15]：

把训练语料库中所有对齐的短语机器翻译概率存储起来，作为一部带概率的短语词典

这里的短语是任意连续的词串，不一定是一个独立的语言单位

翻译的时候将输入句子与短语词典进行匹配，选择最好的短语划分，将得到的短语译文重新排序，得到最优的译文

Richard Zens提出了使用单调搜索算法[17]进行短语对齐的翻译方法。而从目前实现的系统看基于短语的翻译模型是目前最成功的翻译模型。基于短语的翻译模型在形式上类似于基于实例的翻译方法，区别在于引入了统计模型，在性能上远远超过基于实例的方法。关于对基于短语的机器翻译模型的进一步改进就进入到了另外一个方法中——基于句法的机器翻译模型。

而目前使用较为广泛的机器翻译系统有：（1）法老（Pharaoh）由Philip Kohnn 开发，性能远高于基于词的系统；（2）丝路（SilkRoad）是一个基于短语的汉英统计机器翻译系统；（3）摩西（Moses）是最新的开源统计机器翻译工具，具有很高的性能和效率。

2.5.

3.3基于句法的机器翻译模型

尽管从实践的角度看，基于短语的机器翻译模型是最性能最好的，但是在方法理论层面上，该方法依然存在一些不足[7]：

a)产生的句子不符合语法

短语的简单组合，没有句法结构

b)无法表示不连续的短语搭配的翻译

召开了一次关于···的会议——hold a meeting on···

c)无法进行长距离的语序调整

解决的方法就是在翻译的过程中引入句法结构。

基于句法的统计机器翻译模型包括形式上基于句法的模型和语言学上基于句法的模型：

1)形式上基于句法的模型

不使用语言学方法获取句法结构，所有的句法结构直接从未标准的语料

库中自动学习得到。该类方法中有两种具体方法：1、基于反向转换文

法的翻译模型；2、基于层次短语的翻译模型。

2)语言学上基于句法的模型

必须使用语言学知识才能获取句法结构，完成翻译过程。句法模型通常

都是从句法树库中训练得到，常用的方法有：1、树到树的翻译模型；2、

树到串的翻译模型。

2.5.

3.3.1基于反向转换文法的机器翻译模型

香港科技大学的吴德凯教授在1995年提出了基于反向转换文法的机器翻译模型(ITG, Inversion Transduction Grammar)[18]。从本质上讲，反向转换文法就是一个面向双语的上下文无关文法。该方法从词语对齐的双语语料库中自动抽取规则，因此该方法就是一个基于统计的机器翻译方法。需要对源语言句子进行概率化的句法分析过程，在句法分析完成的同时也生成了译文的句法结构和译文句子。

如果建立的语料库是平行语料库，文献[19]考虑了在平行语料库中分析的可能性，提出了随机转换文法（SITG, Stochastic Inversion Grammar）。通过一个给定

的双语句对，利用SITG和动态规划算法可以计算出该句对的最佳句法结构，像单语种的句法分析过程一样，通过计算分析结构的最大似然概率来实现结构歧义消解[19]。

吴德凯教授在文献[20]中将反向转换文法的方法进一步完善，使其能够很好的应用到机器翻译工作中。

文献[21]中提出了一个容许A*启发式搜索的同步解析方法来对反向转换文法的内容进行改进，该方法可以用更快的速度得到最佳对齐结果，同时也能在第一时间内得到最佳的翻译结果，并且在BLEU评测中取得在相同计算量的情况下更高的分数。文献[22]将SITG应用到基于短语的翻译方法，通过双语对齐语料和SITG方法完善词对齐方法，解决IBM模型中关于词对齐方法的缺陷，进而改进短语对齐的方法，使得基于短语对齐方法的机器翻译方法有更好的性能。

2.5.

3.3.2基于层次短语的翻译模型

UMD的David Chiang（蒋伟）在2005年提出了基于层次短语的翻译模型[23]。David Chiang在他的讲义[24]中提到:

●传统的基于短语的翻译模型中，短语是平面的，不能嵌套

●在层次短语模型中，引入了嵌套的层次短语

●采用平行上下文无关语法作为理论基础，只使用唯一的非终结符标记

●效果比传统的短语模型有很大的提高

该方法不破坏基于短语的翻译方法的优势，而是利用这些优势：因为短语有助于实现次序调整，类似于句法分析，在对源语言进行嵌套短语分析的同时，产生目标语言结构。

但是在文献[23]中还没有对具体的短语抽取方法进行详细的说明，而在基于层次短语的翻译模型中，短语翻译对的抽取是该方法的核心内容，所以David Chiang在文献[25]中提出了分层短语抽取算法，而Franz J. Och等人也提出了相应的短语抽取算法[26]，使得该方法进一步完善，目前这两种方法是基于层次短语翻译模型最为常用的短语抽取方法。文献[27]中提出了一种基于多层过滤的短语对儿抽取方法，该方法能从当前句对儿中生成多层次短语，而不像在传统的方法中根据给定的词对齐结果只能生成固定模式的一种短语对儿，并且该方法不需要利用句法知识来对生成的短语对儿进行过滤。

另外还有大量的研究工作围绕一些特殊短语，包括命名实体、书名、电影名、专业术语等翻译对儿的提取[1]。

2.5.

3.3.3树到树的翻译模型

基于句法分析的翻译模型在近几年的统计翻译方法研究中得到了广泛的关注，树到树的翻译模型是基于句法的翻译模型中的一种。树到树的翻译模型即再源语言端和目标语言端都需要句法树，都需要进行详细的句法分析。

其基本过程是首先得到源语言句子的句法分析树，通过树到树的映射规则或转录机将源语言句子树转换成目标语言句子树。林德康在2004年提出了利用树到树的映射规则[28]实现翻译的方法，而Chris Quirk在2005年从转录机[29]的角度提出了树到树的方法。

两种方法的基本思想是一致的：需要一部概率化的同步语法，实现树到树的配对映射，其不同在于是否需要外部句法分析器的支持。在前一种方法中，解码的过程就是对源语言句子分析的过程；而对于第二种方法，解码过程则是源语言句子树到目标语言句子转换的过程。换句话说，第二中方法只考虑了源语言橘子树的一棵最优句法树，而第一种方法考虑了源语言句子的所有句法树[1]。

相对而言，树到树的翻译模型的复杂度较高，实现上也有想当的难度，因此目前基于该模型建立的实验系统还不是很多，很多理论问题有待进一步探索，模型的性能也有待进一步提高。针对树到树这种在源语言端和目标语言端都需要进行句法分析的而造成复杂度较高的问题，基于树到串的翻译模型被提出来解决这个问题。

文献[36]指出在树到树模型中存在两个问题：1、规则抽取的双边子树约束；

2、解码过程中的结点约束和精确匹配约束。他们提出了两个简单的方法：1、整合双语短语来改进规则覆盖问题——即双边子句法树约束问题；2、二值化双语解析树，以减轻刚性句法制约因素。

文献[37]同样也指出了两个问题，其中规则覆盖问题上面也提出了，两外一个就是针对树到树的模型对句法解析树错误的敏感性问题。他们提出了一个基于森林的树到树的模型来解决上面两个问题，结果是相比于摩西机器翻译系统可以获得更高的BLEU评测分数，并且改进效果较大。

2.5.

3.3.4树到串的翻译模型

树到树的翻译模型的优点是句法信息丰富，但是计算复杂度高，而且由于机器翻译的最终结果依然是一个串，所以目标语言一侧的句法分析似乎意义并不是很大，因此树到串的翻译方法还是有很大的合理性[1]。

树到串的翻译模型是指这样一类翻译模型：

i.在源语言端进行句法分析

ii.在目标语言端不进行句法分析

iii.从源语言端句法分析和词语对齐的语料库中抽取规则并构造翻译模型

中科院刘洋在2006年提出基于树到串对齐模板的翻译模型[30]。该模型的基本过程为：首先应用源语言句法分析器获得源语言句子的句法分析树，然后采用树到串的对齐模板将该句法分析树转换成目标语言字符串。该模型最大的优点在于可以自动获取树到串的对齐模板，而该模型的训练复杂度要低于树到树的翻译模型。另外，黄亮等[31]提出了“统计句法制导翻译”方法，递归的将源语言句法树转换成目标语言字符串，就像编译程序将高级语言源程序翻译成汇编代码一样。这两种方法在本质上一样的，只是在解码时，前者是自底向上，后者是自顶向下。

该模型也面临一定的问题：

1、无法使用非句法的双语短语。双语短语分为句法双语短语和非句法

双语短语。所谓句法双语短语是指双语短语能够被某棵句法子树覆盖；

否则就是非句法双语短语

2、句法分析速度慢，准确率低。句法分析的速度一般较慢，尤其当句

子较长的时候，这会给使用大规模训练语料带来很大的困难。

对于第一个问题，文献[32]中提出了森林到串的翻译规则弥补了树到串的翻

译模型的缺陷。对于第二个问题，是目前语言学基于句法的方法所面临的普遍问题，在句法分析技术的性能没有取得突破性进展的情况下，一个可行的方案是引入多个句法树，尽可能降低句法分析准确率低对翻译质量的影响[37]。

在文献[33]提出使用规则马尔科夫模型代替传统的构成规则可以将树到串的翻译模型的速度提升30%。文献[34]中使用增量解码模型进一步改进树到串的翻译方法，获得比基于短语的翻译系统摩西快30倍的速度。文献[35]使用深度句法信息（由HPSG分析器产生）来获取细粒度的树到串翻译模型的构成规则，对于规则的自动获取的准确性有很大的帮助。

3 总结

在机器翻译发展的几十年历程中，机器翻译取得了很大的进展，特别是最近的15年，各种机器翻译技术不断出现。网络技术的不断发展，也为机器翻译的发展提供了新的应用背景，同时也为机器翻译的发展提供了大量的数据来源和计算资源，这使得基于统计的机器翻译方法得以迅速的发展。同时，机器翻译依然面临着一些问题：语言知识的获取及其准确性的提高、歧义问题等等。

统计机器翻译是目前研究人员最多的方向，因此也得到了充分的发展成为机器翻译领域中的主流方法，但是部分研究人员在研究中还是有一点走上了另外一种极端——用到统计的方法就放弃了规则方法的研究。其实统计方法不应该排斥规则方法，同样规则方法也不应该拒绝统计方法，一个更好的方向是能将两者更好的结合起来。然而，到目前为止，统计机器翻译中用到的语言知识还是很有限的。基于词的方法和基于短语的方法几乎没有用到任何语言知识，而是采用了一种词汇化的概率计算方法，所有的语言知识通过对词语的概率统计表现出来[38]。而目前基于句法的统计翻译方法开始成为研究的热点，所以在本文中对句法翻译方法的介绍也较多。基于句法的翻译方法将句法知识更加充分的利用起来，所取得的效果已经开始超过基于短语的方法和基于简单规则的方法。另外，在未来的发展中，可能会有基于语义的方法加入到机器翻译的领域中，可以为歧义问题提供一种可能的解决方案。

机器翻译处理的是语言问题，处理语言问题就不应该离开语言知识的辅助。所以说，如果不引进更为复杂的语言知识，一些机器翻译问题可能无法得到很好的解决。随着研究的深入，研究人员会更加重视规则方法在当前主流的统计方法中的作用，使得机器翻译的水平能够再提升一个层次。

4 参考文献

[1] 宗成庆. 统计自然语言处理. 清华大学出版社，2008，北京.

[2] Yuqing Gao, Bowen Zhou, Zijian Diao, Jeffrey Sorensen. A Statistical Semantic Parsing and Generation-Based Multilingual Automatic Translation System. Machine Translation. 2002, vol. 17, No. 3, pp. 185-212.

[3] 戴新宇, 尹存燕, 陈家俊, 郑国梁. 机器翻译研究现状与展望. 计算机科学. 2004, vol.31, No.11, pp. 176-179.

[4] 冯志伟. 机器翻译：从基于规则的技术到基于统计的技术. 《2010年中国翻译职业交流大会论文集》, 2010.

[5] Kay Martin. Parsing in Functional Unification Grammar. Natural Language Parsing. 1985.

[6] Charniak E. Statistical Language Learning. Cambridge, MA: MIT Press, 1993.

[7] 刘群. 机器翻译原理与方法讲义. 2009.(Lecture)

[8] Makato Nagao. A framework of a mechanical translation between Japanese and English by analogy principle. Elsevier Science Publishers. B.V 1984.

[9] Satoshi Sato, Makato Nagao. Toward memory-based translation. COLING '90. 247—252.

[10] Peter F. Brown et al. A statistical approach to machine translation. Computational Linguistics. June 1990, pp. 79-85.

[11] Peter F. Brown, Vincent J. Della Pietra, Stephen A. Della Pietra, and Robert L. Mercer. The mathematics of statistical machine translation: parameter estimation. Computational Linguistics. June 1993, Vol. 19, No.2, pp. 263-311.

[12] Stephan Vogel, Hermann Ney, and Christoph Tillmann. HMM-based word alignment in statistical translation. Proceedings of the 16th conference on Computational linguistics - Volume 2. 1996, pp. 836-841.

[13] Ye-Yi Wang, Alex Waibel. Modeling with structures in statistical machine translation. Proceedings of the 17th international conference on Computational linguistics - Volume 2. 1998, pp. 1357-1363.

[14] 刘群. 统计机器翻译综述. 中文信息学报. 2003. Vol. 17, No. 4, pp. 1-12.

[15] Daniel Marcu, William Wong. A phrase-based, joint probability model for statistical machine translation. Proceedings of the ACL-02 conference on Empirical methods in natural language processing - Volume 10 (EMNLP '02). 2002, pp. 133-139.

[16] Philipp Koehn, Franz Josef Och, and Daniel Marcu. Statistical phrase-based translation. Proceedings of the 2003 Conference of the North American Chapter of the Association for Computational Linguistics on Human Language Technology - Volume 1. 2003, pp. 48-54.

[17] Richard Zens, Hermann Ney. Improvements in phrase-based statistical machine translation. Proceedings of HLT-NAACL 2004. 2004, pp.257-264.

[18] Dekai Wu. An algorithm for simultaneously bracketing parallel texts by aligning words. Proceedings of the 33rd annual meeting on Association for Computational Linguistics. 1995, pp. 244-251.

[19] Dekai Wu. Stochastic inversion transduction grammars and bilingual parsing of parallel corpora. Computational Linguistics. Vol.23, No.3. September 1997, pp. 377-403.

[20] Dekai Wu, Hongsing Wong. Machine translation with a stochastic grammatical channel. Proceedings of the 36th Annual Meeting of the Association for Computational Linguistics and 17th International Conference on Computational Linguistics. Vol. 2. 1998, pp. 1408-1415.

[21] Hao Zhang, Daniel Gildea. Efficient search for Inversion Transduction Grammar. Proceedings of the 2006 Conference on Empirical Methods in Natural Language Processing. 2006, pp. 224-231.

[22] Markus Saers, Dekai Wu. Improving phrase-based translation via word alignments from stochastic inversion transduction grammars. Proceeding SSST'09 Proceedings of the Third Workshop on Syntax and Structure Statistical Translation. 2009, pp.28-36.

[23] David Chiang. A hierarchical phrase-based model for statistical machine translation. Proceedings of the 43rd Annual Meeting on Association for Computational Linguistics. 2005, pp. 263-270.

[24] David Chiang, Hiero. Finding Structure in Statistical Machine Translation

in National University of Singapore.(Lecture)

[25] David Chiang. Hierarchical phrase-based translation. Computational Linguistics. 2007, Vol. 33, No. 2, pp. 201-228.

[26] Franz J. Och, Hermann Ney. The alignment template approach to statistical machine translation. Computational linguistics. 2004, Vol. 30, No. 4, pp. 417-449. [27] 周玉, 宗成庆, 徐波. 基于多层过滤的统计机器翻译. 中文信息学报. 2005, Vol. 19, No. 3, pp. 54-60.

[28] Dekang Lin. A path-based transfer model for machine translation. COLING '04. Article 625. 2004.

[29] Chris Quirk, Arul Menezes, Colin Cherry. Dependency treelet translation: syntactically informed phrasal SMT. ACL '05. 2005, pp. 271-279.

[30] Yang Liu, Qun Liu, Shouxun Lin. Tree-to-string alignment template for statistical machine translation. Proceedings of the 21st International Conference on Computational Linguistics and the 44th annual meeting of the Association for Computational Linguistics. 2006, pp. 609-616.

[31] Liang Huang, Kevin Knight, Aravind Joshi. Statistical syntax-directed translation with extended domain of locality. Proceedings of AMTA. 2006, pp. 66-73.

[32] Yang Liu, Qun Liu, Shouxun Lin. Forest-to String Statistical Translation Rules. ACL’ 07, 2007, pp. 704-711.

[33] Ashish Vaswani, Haitao Mi, Liang Huang, David Chiang. Rule markov models for fast tree-to-string translation. Proceedings of the Association for Computational Linguistics. 2011.

[34] Liang Huang, Haitao Mi. Efficient incremental decoding for tree-to-string translation. Proceedings of the 2010 Conference on Empirical Methods in Natural Language Processing. 2010, pp. 273-283.

[35] Xianchao Wu, Takuya Matsuzaki, Jun'ichi Tsujii. Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics. 2010, pp. 325-334. [36] Feifei Zhai, Jiajun Zhang, Yu Zhou, Chengqing Zong. Simple but effective approaches to improving tree-to-tree model. 2011.

[37] Yang Liu, Yajuan Liu, Qun Liu. Improving tree-to-tree translation with packed forests. Proceedings of the Joint Conference of the 47th Annual Meeting of the ACL and the 4th International Joint Conference on Natural Language Processing of the AFNLP: Volume 2. 2009, pp. 558-566.

[38] 刘群. 机器翻译研究新进展. 当代语言学. 2009, Vol. 11, No.2, pp. 147-158.

机器翻译技术的现状及发展

机器翻译技术的现状及发展篇一：翻译技术领域的现状与展望翻译技术领域的现状与展望作者/王华伟闫栗丽翻译技术在中国的发展起步相对较晚，但近年来随着中国在全球化进程中扮演着越来越重要的角色，催生了对翻译技术发展的强烈需求。中国翻译行业在借鉴国外同行经验的基础上，于2007~2008年间在翻译技术领域取得了一系列成就，也还存在一些亟需改进的方面，而这也势必对我国的翻译行业产生深远的影响。 1. 国家政策的扶持和行业协会的推动翻译技术的发展直接关乎整个翻译行业的翻译质量及效率，具备巨大的行业经济效益。对此，科技部、财政部都给与了足够的重视并拨出专项资金进行扶持。在 2008年的科技型中小企业技术创新基金扶持计划中，中文及多语种处理软件及基于先进语言学理论的中文翻译软件等赫然在列。而中国译协也在 2008年的第 18届世界翻译大会上专门辟出了翻译工具、术语管理和翻译标准等分论坛，着力推动翻译技术的探讨与发展。 2. 词典型翻译软件百花齐放词典是使用范围最广的工具，它以使用便利的优势，几乎占据了每个计算机的桌面，无论语言学习者还是专业翻译人员，几乎都是必备工具。词典的发展从最早的单机版本发展至今，已经有很多种产品

类型，我们可以见到的有：电子词典、在线词典、手机词典等。“金山词霸”的网络版本“爱词霸”在这两年获得了长足的发展，如爱词霸网络释义、谷歌金山词霸等一系列特色功能的相继推出，将词典型翻译软件的应用领域从传统的桌面计算机拓展到网络、手机等，并取得了显著的成功。另外，类似Google这样的搜索引擎，因为信息量大，检索便利而成为很多专业翻译人员查词的重要辅助工具。值得一提的是，最新推出的基于用户发布词汇的词典编撰系统之前的词典都是以各大出版社公开发行的词典中的词条作为主要数据库来源，为用户提供查询上的便利。但是传统出版词典的方式存在发布周期长、词汇更新慢的缺陷。互联网的出现，加快了信息传播的速度，也提高了用户对新词更新的速度要求，为了方便新词汇的发布，词典编纂系统也就应运而生了。这是一种基于用户的词典发布系统，用户可自由发起词典编纂项目，自发组织人员参与项目，发起人可以按照需要给小组成员分配不同的权限，将词汇添加等基本工作和审核人员明确区分，既确保了词典的专业性，也实现了专业语料的适时更新和发布。 3. 机器翻译应用软件融入普通网民生活谷歌语言工具的推出打破了互联网语言的藩篱，用户可以方便简捷地将目标语言的网页转化成自己的母语进行浏览。事实上，这也是机器翻译软件的一个应用领域，而国内的相关软件如金山快译等，专注于为普通网民提供更为友好的英中日网站浏览体验，并在亚洲语言的机器翻译应用方面积累了大量的经验。其他如华建等长期从事机器

机器翻译技术介绍

机器翻译技术介绍
常宝宝北京大学计算语言学研究所 chbb@https://www.sodocs.net/doc/69899280.html,

什么是机器翻译
研究目标：研制出能把一种自然语言（源语言）的文本翻译为另外一种自然语言（目标语言）的文本的计算机软件系统。制造一种机器，让使用不同语言的人无障碍地自由交流，一直是人类的一个梦想。随着国际互联网络的日益普及，网上出现了以各种语言为载体的大量信息，语言障碍问题在新的时代又一次凸显出来，人们比以往任何时候都更迫切需要语言的自动翻译系统。但机器翻译是一个极为困难的研究课题，无论目前对它的需求多么迫切，全自动高质量的机器翻译系统 (FAHQMT)仍将是人类一个遥远的梦。

机器翻译的基本方法
机器翻译的基本方法 ? 基于规则的机器翻译方法 ? 直接翻译法 ? 转换法 ? 中间语言法 ? 基于语料库的机器翻译方法 ? 基于统计的方法 ? 基于实例的方法 ? 混合式机器翻译方法
目前没有任何一种方法能实现机器翻译的完美理想，但在方法论方面的探索已经使得人们对机器翻译问题的认识更加深刻，而且也确实带动了不少不那么完美但尚可使用的产品问世。
20世纪90年代以前，机器翻译方法的主流一直是基于规则的方法，不过，统计方法后来居上，目前似乎已成主流方法，从学术研究的角度看，更是如此。(Google translate)

机器翻译的基本方法
20世纪90年代以前，机器翻译方法的主流一直是基于规则的方法，因此基于规则的方法也称为传统的机器翻译方法。直接翻译法 ? 逐词进行翻译，又称逐词翻译法(word for word translation) ? 无需对源语言文本进行分析 ? 对翻译过程的认识过渡简化，忽视了不同语言之间在词序、词汇、结构等方面的差异。 ? 翻译效果差，属于早期过时认识，现已无人采用 How are you ? 怎么是你 ? How old are you ? 怎么老是你 ?

机器翻译

机器翻译 1 概述机器翻译（machine translation），又称为自动翻译，是利用计算机把一种自然源语言转变为另一种自然目标语言的过程，一般指自然语言之间句子和全文的翻译。它是自然语言处理（Natural Language Processing）的一个分支，与计算语言学（Computational Linguistics ）、自然语言理解（ Natural Language Understanding）之间存在着密不可分的关系。 2 国内外现状机器翻译思想的萌芽关于用机器来进行语言翻译的想法，远在古希腊时代就有人提出过了。在17世纪，一些有识之士提出了采用机器词典来克服语言障碍的想法。笛卡（Descartes）和莱布尼兹（Leibniz）都试图在统一的数字代码的基础上来编写词典。在17世纪中叶，贝克（Cave Beck）、基尔施（Athanasius Kircher）和贝希尔（Johann JoachimBecher）等人都出版过这类的词典。由此开展了关于“普遍语言”的运动。维尔金斯（JohnWilkins）在《关于真实符号和哲学语言的论文》(An Essay towards a Real Character andPhilosophical Language, 1668)中提出的中介语（Interlingua）是这方面最著名的成果，这种中介语的设计试图将世界上所有的概念和实体都加以分类和编码，有规则地列出并描述所有的概念和实体，并根据它们各自的特点和性质，给予不同的记号和名称。本世纪三十年代之初，亚美尼亚裔的法国工程师阿尔楚尼（G.B. Artsouni）提出了用机器来进行语言翻译的想法，并在1933年7月22日获得了一项“翻译机”的专利，叫做“机械脑”（mechanical brain）。这种机械脑的存储装置可以容纳数千个字元，通过键盘后面的宽纸带，进行资料的检索。阿尔楚尼认为它可以应用来记录火车时刻表和银行的帐户，尤其适合于作机器词典。在宽纸带上面，每一行记录了源语言的一个词项以及这个词项在多种目标语言中的对应词项，在另外一条纸带上对应的每个词项处，记录着相应的代码，这些代码以打孔来表示。机械脑于1937年正式展出，引起了法国邮政、电信部门的兴趣。但是，由于不久爆发了第二次世界大战，阿尔楚尼的机械脑无法安装使用。1903年，古图拉特(Couturat)和洛(Leau)在《通用语言的历史》一书中指出，德国学者里格(W. Rieger) 曾经提出过一种数字语(Zifferngrammatik)，这种语法加上词典的辅助，可以利用机械将一种语言翻译成其他多种语言，首次使用了“机器翻译” （德文是ein mechanisches Uebersetzen）这个术语。真正对机器翻译进行研究应该说是从布恩和韦弗开始的。他们研究的是自动词典万, 从1954年1月7日公开展示的IBM701型计算机开始, 机器翻译进人一个繁荣发展的时期。从那时起, 很多国家都投人了大量的人力、物力从事这方面的研究和开发。随着 Internet 的普遍应用，世界经济一体化进程的加速以及国际社会交流的日渐频繁，传统的人工作业的方式已经远远不能满足迅猛增长的翻译需求，人们对于机器翻译的需求空前增长，机器翻译迎来了一个新的发展机遇。国际性的关于机器翻译研究的会议频繁召开，中国也取得了前所未有的成就，相继推出了一系列机器翻译软件，例如“译星” 、“雅信” 、“通译” 、“华建”等。在市场需求的推动下，商用机器翻译系统迈入了实用化阶段，走进了市场，来到了用户面前。中国机器翻译研究起步于1957年,是世界上第4个开始搞机器翻译的国家，60年代中期以后一度中断，70年代中期以来有了进一步的发展。现在，中国社会科学院语言研究所、中国科学技术情报研究所、中国科学院计算技术研究所、黑龙江大学、哈尔滨工业大学等单位都

机器翻译质量的研究与探讨

机器翻译质量的研究与探讨何站涛韩兆强闫栗丽交大铭泰软件有限公司北京１０００８１Ｅ—ｍａｉｌ：ｈｅｚｔ＠ｓｕｎｖ．ｃｏｍ＜摘要：本文简介了机器翻译的发展历史和常用方法，重点阐述了提高机器翻译质量的新思路，最后进行了展望．关键词：机器翻译Ｎ元文法语义网语料库计算机辅助翻译一、引言计算机对自然语言的研究和处理，一般应经过如下三个方面的过程：Ｉ．把问题在语言学上加以形式化．使之能用数学形式严密而规整地表示出来２．把这种数学形式表示为算法，使之在计算上形式化；３．根据算法编写计算机程序，使之在计算机上加以实现。因此．自然语言处理就成了语言学、数学和计算机科学之间的边缘学科。二、机器翻译概述面向计算机的语言的机器翻译研究是二十世纪五十年代才开始的：从五十年代初期到六十年代中期，机器翻译一直是自然语言处理系统研究的中心课题，当时采用的主要是“词对词”翻译方式，这种不是建立在对自然语言理解的基础上的简单技术，没有得到预期的翻译效果，如，威沃（Ｗｅａｖｅｒ）设计实现的机器翻译原型系统，该系统采取查找双语词典，句子译文只是单词译文的简单罗列。六十年代初，自然语言处理使用了简单的语料库统计方法，不仅依据词的意义．而且依据词与其他词的共现情况对词进行分类。但经验主义遭到了理性主义的批评，如乔姆斯基（Ｃｈｏｍｓｋｙ）对Ｎ元语法（Ｎ．Ｇｒａｍ）的批评、闵斯基（Ｍｉｎｓｋｙ）等对神经网络的批评。六十年代中期，人们开始转入对自然语言的语法、语义和语用等基本问题的研究，并尝试着让计算机来理解自然语言。乔姆斯基的转换语法和形式化理论为下一代的自然语言处理提供了一种新的解决方案。七十年代初，美国哈佛大学人工智能专家伍兹（Ｗｏｏｄｓ）提出了扩充转移网络（ＡｕｇｍｅｎｔｅｄＴｒａｎｓｉｔｉｏｎＮｅｔＷｏｒｋ，ＡＴＮ），通过使用成份寄存器和功能约束对有限状态机进行了扩充，ＡＴＮ考察了更多的上下文信息，保持了有限状态计算的简单性。从八十年代初期开始，国际计算语言学界出现了一批新的语法理论。比较著名的有广义短语结构语法（ＧｅｎｅｒａｌｉｚｅｄＰｈｒａｓｅＳｔｒｕｃｔｕｒｅＧｒａｍｍａｒ，ＧＰＳＧ）、中心语驱动的短语结构语法（Ｈｅａｄ－ｄｒｉｖｅｎＰｈｒａｓｅＳｔｒｕｃｔｕｒｅＧｒａｍｍａｒ，ＨＰＳＧ）、词汇功能语法（ＬｅｘｉｃａｌＦｕｎｃｔｉｏｎａｌＧｒａｍｍａｒ，ＬＦＧ）、功能合一语法（ＦｕｎｃｔｉｏｎＵｎｉｆｉｃａｔｉｏｎＧｒａｍｍａｒ，ＦＵＧ）等确定子句语法。 ?２１８?

机器翻译研究现状与展望1 Machine TranslationPast,Present,future

机器翻译研究现状与展望1 戴新宇，尹存燕，陈家骏，郑国梁（南京大学计算机软件新技术国家重点实验室，南京 210093）（南京大学计算机科学与技术系，南京 210093）摘要：本文回顾机器翻译研究的历史，介绍典型的机器翻译方法，包括：基于规则、基于统计以及基于实例的机器翻译方法；针对机器翻译的研究现状，详细介绍和分析了基于混合策略的机器翻译方法，对统计以及机器学习方法在机器翻译中的应用进行了描述；论文还介绍了当前机器翻译评测技术；最后对机器翻译进行总结和展望。关键字：机器翻译，基于规则，基于统计，基于实例，混合策略，机器学习 Machine Translation:Past,Present,future Dai Xinyu, Yin Cunyan, Chen Jiajun and Zheng Guoliang (State Key Laboratory for Novel Software Technology, Department of Computer Science & Technology Nanjing University, Nanjing 210093) Abstract：This paper firstly presents the history of machine translation, and introduces some classical paradigms of machine translation: RBMT, SBMT and EBMT. Secondly, we introduce the recent research on machine translation, and describe the hybrid strategies on machine translation in detail, and discuss the applications of machine learning for machine translation. We also analyze the current techniques about evaluation on machine translation. Finally, we draw a conclusion and prospect on the research of machine translation. Keywords：Machine Translation, RBMT, SBMT,EBMT, HSBMT, Machine Learning. 1本论文工作得到863课题资助（编号：2001AA114102, 2002AA117010-04）戴新宇博士生，主要研究自然语言处理；尹存燕助教，主要研究自然语言处理；陈家骏教授，博士生导师，主要研究自然语言处理、软件工程；郑国梁教授，博士生导师，主要研究软件工程。

机器翻译研究综述

机器翻译综述 1.引言 1.1机器翻译的历史现代机器翻译的研究应该是从20世纪50年代开始，但是早在这以前很多人已经提出了相应的想法，甚至是远在古希腊时期就有人提出要用机器来进行语言翻译的想法。在1946年，美国宾夕法尼亚大学的两位科学家设计并制造了世界上第一台电子计算机。与此同时，英国工程师同美国洛克菲勒基金会副总裁韦弗在讨论计算机的应用范围时，就提出了利用计算机实现语言的自动翻译的想法。在1949年，韦弗发表了一份名为《翻译》的备忘录，正式提出了机器翻译问题。他提出了两个主要观点：第一，他认为翻译类似于解读密码的过程。第二，他认为原文与译文“说的是同样的事情”，因此，当把语言A翻译为语言B时，就意味着从语言A出发，经过某一“通用语言”或“中间语言”，可以假定是全人类共同的。在这一段时间由于学者的热心倡导，实业界的大力支持，美国的机器翻译研究一时兴盛起来。 1964年，美国科学院成立语言自动处理咨询委员会，调查机器翻译的研究情况，给出了“在目前给机器翻译以大力支持还没有多少理由”的结论，随后机器翻译的研究就陷入了低潮期。直到70年代以后机器翻译的研究才重新进入了一个复苏期，随后机器翻译的发展又迎来了繁荣期 1.2机器翻译的主要内容经过50多年的发展，在机器翻译领域中出现了很多的研究方法，总结如下：●直接翻译方法 ●句法转换方法 ●中间语言方法 ●基于规则的方法 ●基于语料库的方法基于实例的方法（含模板、翻译记忆方法）基于统计的方法在当前的研究中，更多的是基于统计的方法进行的，因为基于统计的方法可以充分的利用计算机的计算能力，并且并不需要过多的语言学知识作为支撑，可以让更多的计算机科学家投入到实用系统的研究中，极大的促进了统计机器翻译的发展。下面对各个方法逐一的进行介绍。

机器翻译技术的探讨

机器翻译技术的探讨六院五队-徐允鹏-12060143 摘要随着国际交流的日益增多，在计算机、互联网等相关技术日新月异的基础上，机器翻译的技术与应用得到了蓬勃发展。本文详细探讨了基于规则的机器翻译方法、基于语料库的机器翻译方法和混合式机器翻译方法，并讲述了机器翻译的评估方法，最后介绍了机器翻译技术的最新进展。关键词：机器翻译；基于规则；语料库；评估方法 1.机器翻译概述随着国际化交流的普遍性，信息通信的日益膨胀，高效的处理不同领域各种语言之间的互译已成为当代人们的普遍需求。翻译是解决自然语言之间通信障碍最直接最有效的方法。传统的翻译工作都是通过专业翻译人员完成，利用语言学知识进行自然语言之间的互译，帮助人们实现信息通信。伴随着计算机技术的成熟与自然语言处理技术的不断进步，利用机器翻译系统帮助人们快速获取外文信息代替人工翻译已成为一种必然的趋势。机器翻译（machine translation），又称为自动翻译，是利用计算机把一种自然源语言转变为另一种自然目标语言的过程，一般指自然语言之间句子和全文的翻译。它是自然语言处理（Natural Language

Processing）的一个分支，与计算语言学（Computational Linguistics ）、自然语言理解（Natural Language Understanding）之间存在着密不可分的关系[1]。机器翻译是21世纪要解决的科技难题之一，主要困难是自然语言在各个层次上的歧义性。研究机器翻译具有重要的实践意义和理论意义。国际间的合作与交流，语言的差异是一个非常重要的障碍，各行各业的人们面对大量他们不熟悉的语言的文档资料，如果单纯的依靠人工翻译，这些日益的待翻译材料将是一种非常沉重的负担，而机器翻译可大幅度减轻这种负担。同时，机器翻译对于了解人类语言和思维的基本机制，探讨人工智能技术有着重要的意义。 2.机器翻译方法人们一直在寻求更好的解决机器翻译问题的方法，目前机器翻译方法主要有基于规则的机器翻译，基于语料库的机器翻译和混合式机器翻译方法。 2.1基于规则的机器翻译方法 2.1.1基于分析和转换的机器翻译方法人作翻译时，把一个源语言句子译成目标语言句子，设计到四个基本操作：目标语言单词的检索、调序、删词、增词；机器翻译系统的过程包括检索、分析、转换和生成主要四个阶段，这被称为基于分析和转换的机器翻译系统，也被认为是模拟人类翻译活动最恰当的机

浅谈机器翻译存在的问题

机器翻译及其问题浅析摘要：由于信息技术高速发展，国际交流日益频繁，如何克服语言障碍已经成为国际社会共同面对的问题，而人工翻译的方式已经远远不能满足需求。利用机器翻译协助人们快速获取信息已成为必然趋势，但机器翻译仍存在一些影响译文可读性和准确性的问题。本文将简单介绍机器翻译并对常见问题进行浅析。关键词：机器翻译问题语法应用一、引言机器翻译（Machine Tanslation，简称MT），又称自动翻译，是利用计算机来进行不用的自然语言之间的翻译，它是自然语言处理（Natural Language Processing）的一个分支，与计算语言学（Computational Linguistics ）、自然语言理解（Natural Language Understanding）之间存在着密不可分的关系。它是横跨语言学、数学、计算机科学、翻译学及人工智能等的综合学科，也是信息时代语言应用的一个重要领域。二、机器翻译的简介（一）机器翻译简史人类在近代就萌发了机器翻译的梦想，但是真正把设想付诸现实还是因为计算机的诞生和计算机技术的发展。机器翻译的研究历史课追溯到20世纪四五十年代。1946年第一台现代电子计算机ENIAC诞生，同一年，美国科学家韦弗（W. Weaver）和英国工程师布斯（A. D. Booth）在讨论电子计算机的应用范围时，提出了利用计算机进行语言自动翻译的想法。1949年，韦弗（W. Weaver）发表《翻译备忘录》，正式提出机器翻译的思想。经过六十年的曲折发展，到目前互联网的普遍应用，以及人们对翻译需求的迅猛增长，给机器翻译带来新的发展机遇。我国相继推出了一系列的机器翻译软件如“译星”、“雅信”、“通译”、“华建”等。在市场需求的推动下，商用机器翻译系统迈入了实用化阶段，走进了市场，来到了用户面前。（二）机器翻译的主要方法机器翻译的过程一般可简化为三个阶段：原文分析、原文译文转化和译文生成。表象上，机器翻译的核心问题是翻译的准确性；实质上，体现在技术层面则是机器翻译系统采用的方法论问题。在方法论层面，机器翻译系统可分为基于规则（Rule-Based ）和基于语料库（Corpus-Based）两大类。基于规则（Rule-Based ）就是由词典和语法规则库构成翻译知识库。尽管语言学家经过长期努力创建了含有成千上万条规则的规则库，覆盖了相当大范围的语言现象，但却难以

机器翻译技术的现状及发展

机器翻译技术的现状及发展摘要:本文在分析机器翻译内涵的基础上，阐述了机器翻译的历史和现状，探讨了机器翻译所面临的问题及机器翻译的发展趋势。关键词:机器翻译；自然语言；发展趋势 1.引言《圣经.创世纪》中第十一章巴别塔：“耶和华说：看哪，他们成为一样的人民，都是一样的言语，如今既作起这事来，以后他们所要作的事就没有不成就的了。我们下去，在那里变乱他们的口音，使他们的言语彼此不通。于是耶和华使他们从那里分散在全地上；他们就停工，不造那城了。因为耶和华在那里变乱天下人的言语，使众人分散在全地上，所以那城名叫巴别（就是变乱的意思）[1]。”这只是圣经故事，但告诉我们语言的不同确实是人们交流的极大障碍，因此人们一直在寻找打破语言障碍的途径和办法。翻译则能克服语言障碍，使得不同语言人们之间能相互交流。谭载喜在他的《西方翻译简史》一书中提到我国的翻译史时说：孔子周游列国，在各地言语发音不尽相同，彼此交流甚少的当时，也不得不通过象寄之才（即翻译人员）以“达其意，通其欲”。随着互联网的日益发展，网络信息的激增，国际社会交流愈加频繁，机器翻译已成为克服交流时所产生的语言障碍的重要手段之一。

2.机器翻译的定义计算机翻译通常叫机器翻译(Machine Translation或MT)，即全自动高质量机器翻译(Fully Automatic High Quality Machine Translation,简称FAHQMT或MT)，就是人类利用计算机进行自然语言间的相互翻译，利用软件实现从一种自然语言文本到另一种自然语言文本的翻译[2]。 3.机器翻译的历史与现状在古希腊时代就有人提出利用机械装置来进行语言翻译的想法，其中之一是如何用机械手段来分析自然语言。17世纪，人们首次提出使用机械字典克服语言障碍的设想。1903年，古图拉特(Couturat)和洛(Leau)在《通用语言的历史》一书中指出，德国学者里格(W.Rieger)首次使用了“机器翻译”(Machine Translation)这个术语。1952年在美国麻省理工学院(MIT)召开了第一届国际机器翻译会议，标志着机器翻译正式迈出了第一步。1978年在中科院计算机所的一台64K容量的计算机上成功地进行了20个标题的机器翻译测试。1987年在日本箱根举行了第一届机器翻译峰会(MT Summit)，并决定以后每两年轮流在亚、欧、美定期举行。20世纪90年代后，随着微机的普及，相继出现了多种翻译软件，例如金山公司的词霸系列，实达铭泰的东方快车系列，Trados 翻译软件等。到目前为止，由于计算机科学、语言学研究的发展，特别是计算机硬件技术的大幅度提高以及人工智能在自然语言处理上的应用，机器翻译已经取得了相当大的进步，不过，机器翻译的水平距理想的“全自动高质量（FAHQ）”的目标还有很远的距离[3]。4.机器翻译面临的问题 4.1影响机器翻译质量的核心是歧义的处理。在词汇的层面上，词汇的歧义主要是一词多义，如英语单词“note”可以指“笔记”、“短信”、“注释”、“纸币”等。以下是词汇歧义的例子：原文：Thank-you notes are heart-warming. 机器译文：感谢笔记温暖人心。人工译文：感谢信温暖人心。在结构层面上，常见的结构歧义有and(和)结构，如nice girls and boys, 它既可表示“好女孩和男孩”，也可表示“好女孩和好男孩”，这种歧义只有人工翻译才能消除，计算机无法识别此歧义，可见歧义的处理是影响机器翻译质量的关键。 4.2人类翻译目标集中于目标语言，如果有必要的话，译者会采用灵活的方式以使翻译传情达意，有的时候会使用意译的方法，这是机器翻译所无法达到的。以文学翻译为例，文学翻译是“传达作者的全部意图，即作者对在读者思想感情上产生艺术作用的全部意图……”。即使对于专业翻译工作者来说，文学翻译也不是件容易的事，更何况是对于没有任何认知能力的机器。笔者曾让机器翻译了下面几句：以下是美国19世纪著名作家爱默森长篇散文Beauty中的原句。原文："But this beauty of Nature which is seen and felt as beauty, is the least part." —Beauty Ralph Waldo Emerson 机器译文：但是这哪个看见并且作为美丽感到的自然的美丽，是最小部分。夏济安译文：可是凡是耳目所能辨认出来的美，只是自然之美的最低部分。以下是美国著名作家马克.吐温早期创作的一则优秀短篇小说《竞选州长》中的原句。原文："I hauled down my colors and surrendered." —Running For Governor Mark Twain 机器译文：我沿着我的颜色拖并且投降。张有松译文：我偃旗息鼓，甘拜下风。以上机器译文荒唐可笑。由于机器没有思维、推理、判断能力，缺乏人工译者的综合知识和长期积淀下来的文化知识等，无法对原文产生全面的了解，做的只是机械转码，无法突破思维障碍。要获得地道完整的译文，必须对机器译文进行人工

机器翻译技术的研究和应用综述

机器翻译技术的研究和应用综述 ACM Matrix_68 摘要：随着互联网的日益发展，网络信息的激增，国际社会交流愈加频繁，机器翻译已成为克服交流时所产生的语言障碍的重要手段之一。本文回顾机器翻译研究的历史，介绍典型的机器翻译方法，在分析机器翻译内涵的基础上，阐述了机器翻译的现状，探讨了机器翻译所面临的问题及机器翻译的发展趋势，对统计以及机器学习方法在机器翻译中的应用进行了描述；论文还介绍了当前机器翻译评测技术；最后对机器翻译进行总结和展望。关键字：机器翻译；自然语言；基于规则；基于统计；基于实例；混合策略；机器学习 1引言近年来，自然语言处理的研究已经成为热点，而机器翻译作为自然语言研究领域的一个重要分支，同时也是人工智能领域的一个课题，同样为大家所关注。当电子计算机1946年问世的时候，人们就提出了机器翻译的想法，并且在1954年进行了第一次机器翻译试验。然而与后来的各种语言信息处理研究和应用（语言信息检索、文本自动分类、自动文摘、信息提取等等）相比，机器翻译却是进展最慢的。从上个世纪40年代英国工程师Booth 和美国工程师Weaver提出利用计算机进行翻译的想法，到50年代欧美国家投入大量的人力、物力致力于机器翻译的研究，再到60年代ALPAC置疑报告的提出，机器翻译走向沉寂。学者们倾其大半生精力、商家投入为数可观的资金，经历五十多年不懈的研究和开发，得到的成果或者产品却常常不能令人满意。最近的二十年，随着语言学理论的发展、计算机技术的进步以及统计学和机器学习方法在自然语言处理领域中的广泛应用，人们对机器翻译本身的应用背景、目标等也有了更加准确的认识，机器翻译在此背景下取得了长足的发展，基于统计、基于实例等新的机器翻译方法也都是在这一时期出现，一些机器翻译系统也从实验室走向了市场。本文第二节介绍了机器翻译的历史现状；第三节介绍了机器翻译面临的问题；第四节介绍几种经典的机器翻译方法；第五节给出近期机器翻译的发展趋势，介绍基于混合策略的机器翻译方法，对统计机器学习在机器翻译中的应用进行总结；第六节讨论当前机器翻译的评测系统；最后，对机器翻译研究进行总结和展望。 2机器翻译的历史现状机器翻译的研究历史可以追溯到20世纪三四十年代。20世纪30年代初，法国科学家G.B.阿尔楚尼提出了用机器来进行翻译的想法。1933年，苏联发明家П.П.特罗扬斯基设计了把一种语言翻译成另一种语言的机器，并在同年9月5日登记了他的发明；但是，由于30年代技术水平还很低，他的翻译机没有制成。1946年，第一台现代电子计算机ENIAC诞生，随后不久，信息论的先驱、美国科学家W.Weaver和英国工程师A.D.Booth在讨论电子计算机的应用范围时，于1947年提出了利用计算机进行语言自动翻译的想法。1949年，W.Weaver发表《翻译备忘录》，正式提出机器翻译的思想。走过六十年的风风雨雨，机器翻译经历了一条曲折而漫长的发展道路，学术界一般将其划分为如下四个阶段： 2.1机器翻译的开创期（1947-1964） 1954年，美国乔治敦大学（GeorgetownUniversity）在IBM公司协同下，用IBM-701计算机首次完成了英俄机器

机器翻译的现状和发展趋势_岳涛

７２计算机教育 2005.4 人／才／培／养／与／就／业机器翻译（Ｍａｃｈｉｎｅ　Ｔｒａｎｓ－ｌａｔｉｏｎ）是通过计算机来实现不同自然语言之间的翻译。机器翻译是自然语言处理（Ｎａｔｕｒａｌ　ＬａｎｇｕａｇｅＰｒｏｃｅｓｓｉｎｇ）的一个分支，机器翻译与计算语言学（ＣｏｍｐｕｔａｔｉｏｎａｌＬｉｎｇｕｉｓｔｉｃｓ）、自然语言理解（Ｎａｔｕｒａｌ　Ｌａｎｇｕａｇｅ　Ｕｎｄｅｒｓｔａｎｄｉｎｇ）存在着密不可分的关系。机器翻译的研究与发展取决于计算机科学、数学、语言学、人工智能等多学科的发展，因此机器翻译可以说是一个跨学科的综合性系统工程。人类步入２１世纪以来，随着国际互联网（Ｉｎｔｅｒｎｅｔ）的迅猛发展，网络信息急剧膨胀，国际交流日益频繁以及地球村的形成，机器翻译正在逐渐成为克服人们之间进行交流时所面临的语言障碍的重要手段，同时也面临着很大的市场机遇和挑战。历史的回顾从美国人维弗（Ｗａｒｒｅｎ?Ｗｅａｖｅｒ）于１９４９年发表《翻译》备忘录并正式提出机器翻译的思想以来，机器翻译已经走过了５０多个风风雨雨的春秋。在这期间，机器翻译可以说经历了一条曲折而漫长的发展道路。１９５４年，在美国乔治敦大学（Ｇｅｏｒｇｅｔｏｗｎ　Ｕｎｉｖｅｒｓｉｔｙ）进行了人类历史上的第一次机器翻译的公开演示。尽管演示尚不算很成功，但是它却具有划时代的意义，因为它拉开了人们研究机器翻译的序幕。从２０世纪５０年代开始到２０世纪６０年代的前半期，机器翻译的研究呈不断上升的趋势。美国和前苏联两个超级大国出于军事和政治经济目的，纷纷对机器翻译项目提供了大量的资金支持，而欧洲国家由于地缘政治和经济的需要也对机器翻译研究给予了相当大的重视。１９６６年，美国科学院发表的ＡＬＰＡＣ报告使当时正在蓬勃发展的机器翻译陷入了停滞的状态。现在来看，该报告是非常片面、狭隘和短视的。从２０世纪６０年代中后期到整个７０年代，整个机器翻译领域处于一个相对平稳发展的时期，而在某些国家，特别是加拿大和欧盟，机器翻译的研究却取得了比较显著的进步。尤其是在加拿大，由于双语文化的影响，政府积极支持机器翻译的研发工作，１９７６年，加拿大蒙特利尔大学与加拿大联邦政府翻译局联合开发了提供天气预报服务的实用性机器翻译系统ＴＡＵＭ－ＭＥＴＥＯ，该系统的成功开发标志着机器翻译已经在某些领域达到了实用化的程度。进入２０世纪８０年代以来，由于计算机科学、语言学研究的发展，特别是计算机硬件技术的大幅度提高以及人工智能在自然语言处理上的应用，机器翻译在全世界范围内开始复苏，并在随后的９０年代取得了长足的进步。２０世纪９０年代以来的机器翻译技术的新进展１．机器翻译的分类进入２０世纪９０年代，机器翻译领域的的研究方法基本上可以分为两大类，即基于规则（Ｒｕｌｅ－Ｂａｓｅｄ）和基于语料库（Ｃｏｒｐｕｓ－Ｂａｓｅｄ）的方法。基于规则的方法又可以分为基于转换的方法和基于中间语言的方法，基于语料库的方法又可以分为基于统计的方法和基于实例的方法。传统的基于规则的方法又可以机器翻译的现状和发展趋势中国软件与技术服务股份有限公司岳涛／文 ◆　课外新知　◆

一个汉英机器翻译系统的设计与实现.doc

一个汉英机器翻译系统的计算模型与语言模型* 刘群+詹卫东++常宝宝++刘颖+ (+中国科学院计算技术研究所二室北京100080) (++北京大学计算语言学研究所北京100871) 摘要：本文介绍我们所设计并实现的一个汉英机器翻译系统。在概要介绍本系统的主要目标和设计原则的基础上，着重说明系统的计算模型和语言模型，最后给出实验结果和进一步的打算。关键词：自然语言处理机器翻译中文信息处理一、引言我国的机器翻译研究近年来取得了很大的发展。特别是英汉机器翻译系统的研制已经取得了较大的成功，达到了初步实用的阶段。相对而言，汉英机器翻译的研究却进展比较缓慢，离实用化还有相当的距离[1]。我们的目的是利用目前最新的计算机软件技术、相对成熟的机器翻译方法和先进的汉语语法理论，构造一个初步实用的汉英机器翻译系统。本文将对我们所开发的系统所采用的计算模型和语言模型作一个总体性的介绍，而不涉及过多的细节。下面我们简要介绍一下本系统的几个主要设计原则： ⑴采用成熟的技术我们的目的是构造一个真正实用的汉英机器翻译系统，因而在可供选择的若干技术路线面前，我们将尽量选用比较成熟的技术，而在现有技术难以解决问题时再尝试一些新技术。 ⑵开放的体系结构开放的体系结构主要体现在系统的实现上所采用的软件构件技术[8]。整个系统采用一些相对独立的软件构件组成，因而可以方便地对系统进行修改、维护和扩充。翻译的过程严格按照独立分析、独立生成的原则进行组织，每一阶段的算法相互独立，对其中一个阶段算法的修改不会对其他算法造成影响。 ⑶方便的调试环境本系统强调为语言工作者提供一个方便的调试环境。系统提供多窗口图形界面的知识库调试工具，支持课题组中多人同时通过网络对一个知识库进行操作。提供对翻译过程直观显示，用户可以清晰地看到翻译过程的每一步操作。提供翻译出错原因查找机制，用户 *本项目的研究受到863-306资助，合同号为863-306-03-06-2

机器翻译现状

机器翻译的现状与发展摘要：随着经济全球化的飞速发展以及人类命运共同体的提出，各国之间人民之间的交流必将日益频繁，各个国家语言之间转换需求也必定与日俱增，人为地学习千百种语言实在不易，机器翻译的作用也就越来越受到重视。它涉及计算机语言学、数学和语言学等各个学科，其中语言学为其提供了机译数据库和技术支撑。然而，目前机器翻译还存在许多不足，需要多方面深入研究。本文对机器翻译发展历程、研究方法、存在问题及其应对方法进行了综述，以期机器翻译更进一步发展。关键词：机器翻译；发展历程；研究方法；语言学理论；问题；应对方法机器翻译是通过计算机来实现不同自然语言之间的转换，也称为自动翻译，一般是指自然语言之间的部分句子或全文的翻译。它作为应用语言学的一个分支，是建立在语言学、数学和计算机科学基础上的跨学科研究。由于需要通过电脑数据库和翻译软件来完成操作，因此，机器翻译的发展与计算机科学、数学、人工智能、语言学等各学科的发展密不可分，可以说，机器翻译的推进需要这些学科的技术支撑和理论支持。人类进入21世纪以来，随着经济的发展，国际交流合作日益频繁，对机器翻译的需求日益增大。机器翻译是规避国家间交流障碍的有效手段，但作为综合性的学科，它的发展受到多方面牵制，因此需要相关研究人员和学者对其相关学科进行更深入的研究。 1机器翻译发展历史机器翻译的历史最早可以追溯到20世纪30年代相关学者提出其雏形，如今处于高速发展的阶段。然而在初期机器翻译受到过阻碍，一度陷入低潮期。直到移动互联网时代的到来，一方面，随着计算机网络技术快速发展，人们要求用计算机实现语言翻译的愿望越来越强烈。另一方面自1990年统计机器翻译模型提出以来，基于大规模语料库的统计翻译翻译方法迅速发展，机器翻译再次成为人们关注的热门研究课题，取得了一些令人瞩目的成果。但是，在机器翻译飞速发展的同时，也遇到了很多难题，在目前的技术条件下翻译的质量还不能够达到人们的期望的程度，想让机器让人类一样去理解和分析语言还远不能行。在当今信息大数据时代，机器翻译正发挥越来越重要的作用。机器翻译的发展可以归结为以下几个发展阶段： 1.1机器翻译人员的独立工作阶段 20世纪50年代初期，随着第一台计算机的问世，美国的科学家W.Weaver和英国工程师A.D. Booth就发表了翻译备忘录，提出了利用计算机进行翻译的设想。随后，通过不懈的努力和试验，美国的乔治伦敦大学和IBM公司合力推出了首个MT系统，为各国的机器翻译奠定了坚实的实践基础。但是由于受到计算机硬件局限性的限制，尤其是内存不足和存储速度慢，以及缺乏高级编程语言，研究人员无法完全依赖机器来完成大规模、高质量的翻译任务。同时，由于研究是在没有句法学家和语义学家的协助下独立进行的，翻译的质量难以保证。在这样的背景下，早期研究者意识到，无论开发出什么样的系统都只能产生出低质量的输出，因此专家建议，先发展对有控制的语言进行翻译，并限定于某些特定领域。 1.2进入高质量的翻译输出 20世纪60年代，受到改进了的计算机硬件和编程语言的鼓舞，研究人员对机器翻译产生了盲目的乐观。编程语言在句法分析上取得的长足进步让翻译人员感受到了技术革新的成果，他们相信机器翻译有巨大的前景，几年之内就可以达到高质量的输出，这一乐观论调很快传遍了全世界。研究人员还提出假设：机器翻译的目标是产出高质量翻译的全自动系统。研究的重点在于寻求完善的翻译理论和方法。 1.3翻译软件和工具的发展 20世纪70年代以来，随着科技发展和各国间频繁交流，大规模翻译需求日益增加，对计算机翻译的依赖更加突出，机器翻译进入了新的发展阶段。实用性翻译和软件系统如雨后春笋频频出现，如Weinder系统、EURPOTRA多国种翻译系统、TAUM-METEO系统等。80年代产生了大量连接网络和大容量存储的微型计算机，各种翻译工具也应运而生，如词典和术语资料库、多语文字处理、词汇和术语资源的管理、信息传递的

机器翻译技术的现状及发展(一)

机器翻译技术的现状及发展(一) 摘要:本文在分析机器翻译内涵的基础上，阐述了机器翻译的历史和现状，探讨了机器翻译所面临的问题及机器翻译的发展趋势。关键词:机器翻译；自然语言；发展趋势 1.引言《圣经.创世纪》中第十一章巴别塔：“耶和华说：看哪，他们成为一样的人民，都是一样的言语，如今既作起这事来，以后他们所要作的事就没有不成就的了。我们下去，在那里变乱他们的口音，使他们的言语彼此不通。于是耶和华使他们从那里分散在全地上；他们就停工，不造那城了。因为耶和华在那里变乱天下人的言语，使众人分散在全地上，所以那城名叫巴别（就是变乱的意思）1]。”这只是圣经故事，但告诉我们语言的不同确实是人们交流的极大障碍，因此人们一直在寻找打破语言障碍的途径和办法。翻译则能克服语言障碍，使得不同语言人们之间能相互交流。谭载喜在他的《西方翻译简史》一书中提到我国的翻译史时说：孔子周游列国，在各地言语发音不尽相同，彼此交流甚少的当时，也不得不通过象寄之才（即翻译人员）以“达其意，通其欲”。随着互联网的日益发展，网络信息的激增，国际社会交流愈加频繁，机器翻译已成为克服交流时所产生的语言障碍的重要手段之一。 2.机器翻译的定义计算机翻译通常叫机器翻译(MachineTranslation或MT)，即全自动高质量机器翻译(FullyAutomaticHighQualityMachineTranslation,简称FAHQMT或MT)，就是人类利用计算机进行自然语言间的相互翻译，利用软件实现从一种自然语言文本到另一种自然语言文本的翻译 2]。 3.机器翻译的历史与现状在古希腊时代就有人提出利用机械装置来进行语言翻译的想法，其中之一是如何用机械手段来分析自然语言。17世纪，人们首次提出使用机械字典克服语言障碍的设想。1903年，古图拉特(Couturat)和洛(Leau)在《通用语言的历史》一书中指出，德国学者里格(W.Rieger)首次使用了“机器翻译”(MachineTranslation)这个术语。1952年在美国麻省理工学院(MIT)召开了第一届国际机器翻译会议，标志着机器翻译正式迈出了第一步。1978年在中科院计算机所的一台64K容量的计算机上成功地进行了20个标题的机器翻译测试。1987年在日本箱根举行了第一届机器翻译峰会(MTSummit)，并决定以后每两年轮流在亚、欧、美定期举行。20世纪90年代后，随着微机的普及，相继出现了多种翻译软件，例如金山公司的词霸系列，实达铭泰的东方快车系列，Trados翻译软件等。到目前为止，由于计算机科学、语言学研究的发展，特别是计算机硬件技术的大幅度提高以及人工智能在自然语言处理上的应用，机器翻译已经取得了相当大的进步，不过，机器翻译的水平距理想的“全自动高质量（FAHQ）”的目标还有很远的距离3]。

机器翻译：现状与展望概述

机器翻译：现状与展望中国专利信息中心王丹李进机器翻译（Machine Translation），又称为自动翻译，是利用计算机把一种自然源语言转变为另一种自然目标语言的过程，它是自然语言处理（Natural Language Processing）的一个分支，与计算语言学（Computational Linguistics）、自然语言理解（Natural Language Understanding）之间存在着密不可分的关系。步入21世纪以来，随着国际互联网（Internet）的迅猛发展和世界经济一体化的加速，网络信息急剧膨胀，国际交流日益频繁，如何克服语言障碍已经成为国际社会共同面对的问题。由于人工翻译的方式远远不能满足需求，利用机器翻译技术协助人们快速获取信息，已经成为必然的趋势。一、机器翻译简史机器翻译的研究历史可以追溯到20世纪四五十年代。1946年，第一台现代电子计算机ENIAC诞生，随后不久，信息论的先驱、美国科学家W. Weaver和英国工程师A. D. Booth 在讨论电子计算机的应用范围时，提出了利用计算机进行语言自动翻译的想法。1949年，W. Weaver发表《翻译备忘录》，正式提出机器翻译的思想。走过六十年的风风雨雨，机器翻译经历了一条曲折而漫长的发展道路，学术界一般将其划分为如下四个阶段：1．开创期（1946-1964） 1954年，美国乔治敦大学（Georgetown University）在IBM公司协同下，用IBM-701计算机首次完成了英俄机器翻译试验，向公众和科学界展示了机器翻译的可行性，从而拉开了机器翻译研究的序幕。中国开始这项研究也并不晚，早在1956年，国家就把这项研究列入了全国科学工作发展规划，课题名称是“机器翻译、自然语言翻译规则的建设和自然语言的数学理论”。1957年，中国科学院语言研究所与计算技术研究所合作开展俄汉机器翻译试验，翻译了9种不同类型的较为复杂的句子。从20世纪50年代开始到20世纪60年代前半期，机器翻译研究呈不断上升的趋势。美国和前苏联两个超级大国出于军事、政治、经济目的，均对机器翻译项目提供了大量的资金支持，而欧洲国家由于地缘政治和经济的需要也对机器翻译研究给予了相当大的重视，机器翻译一时出现热潮。这个时期机器翻译虽然刚刚处于开创阶段，但已经进入了乐观的繁荣期。 2．受挫期（1964-1975） 1964年，为了对机器翻译的研究进展作出评价，美国科学院成立了语言自动处理咨询委员会(Automatic Language Processing Advisory Committee，简称ALPAC委员会)，开始了为期

机器翻译研究综述

机器翻译技术的现状及发展

机器翻译技术介绍

机器翻译

机器翻译质量的研究与探讨

机器翻译研究现状与展望1 Machine TranslationPast,Present,future

机器翻译研究综述

机器翻译技术的探讨

浅谈机器翻译存在的问题

机器翻译技术的现状及发展

机器翻译技术的研究和应用综述

机器翻译的现状和发展趋势_岳涛

一个汉英机器翻译系统的设计与实现.doc

机器翻译现状

机器翻译技术的现状及发展(一)

机器翻译：现状与展望概述

相关文档

最新文档