搜档网
当前位置:搜档网 › 机器翻译研究现状与展望

机器翻译研究现状与展望

机器翻译研究现状与展望
机器翻译研究现状与展望

机器翻译是建立在语言学、数学、信息学、计算机科学等学科基础上的多边缘学科。现代理论语言学的发展、计算机科学的进步以及概率统计学的引入, 对机器翻译的理论和方法都产生了深刻的影响。

Weaver机器翻译思想的提出, 开始了机器翻译的研究热潮。Chomsky在50年代后期提出的短语结构语法, 给出了“从规则生成句子”的原则。由于短语结构语法采用单一标记的短语结构来描述句子的构成, 描述粒度过粗, 因此存在约束能力弱、生成能力过强问题, 人们逐渐意识到仅依靠单一的短语结构信息, 不能充分判别短语类型和确认短语边界, 于是, 复杂特征集和词汇主义被引入自然语言语法系统, 广义短语结构语法、词汇功能语法、中心语驱动的短语结构语法等语言学理论也相应地产生。在这个发展过程中, 基于规则方法一直是机器翻译研究的主流。

在基于规则的方法中, 语言规则的产生需要大量的人力,而且大量的语言规则之间往往存在着不可避免的冲突。另外,规则方法在保证规则的完备性和适应性方面也存在着不足。而此时, 统计学方法在自然语言处理的语音识别领域取得了比较好的效果, 于是, 基于统计的机器翻译应运而生。随着双语语料的大量增加、计算机性能的提高, 基于实例的机器翻译方法被提出,并由此泛化产生了基于模板的机器翻译方法。

下面我们分别介绍几种典型的机器翻译方法:

(1)基于规则的机器翻译方法

从Chomsky提出转换生成文法后,基于规则的方法一直是机器翻译研究的主流,Chomsky认为一种语言无限的句子可以由有限的规则推导出来。

早期的机器翻译系统, 从体系结构上可以分为直译式、转换式和中间语言式, 它们的不同之处在于对源语言分析的深度, 它们的相同点是都需要大规模的双语词典、大量的源语言推导规则、语言转换规则和目标语言生成规则。其中, 转换式的基于规则方法对源语言分析得比较深, 它涉及到词汇结构分析、语法分析、语义分析, 并完成词汇、语法、语义三层结构从源语言到目标语言的转换, 而且转换式的方法又充分考虑了源语言和目标语言之间的特征联系, 它比中间语言方法更容易获得高质量的翻译结果。因此, 转换式的方法更多地被应用在早期的机器翻译系统中, 整个翻译过程被分为, 源语言分析部分, 转换部分和目标语生成部分。而早期的系统, 如德国西门子的METAL系统、美国的SYSTRAN系统、日本日立公司的ATHENE系统以及中国中软公司的HY-1汉英系统, 都是基于转换的机器翻译系统。

基于规则的机器翻译的优点在于, 规则可以很准确地描述出一种语言的语法构成, 并且可以很直观地表示出来。机器可以按照一组规则来理解它面对的自然语言, 这组规则包含了不同语言层次的规则, 包括用以对源语言进行描述的源语言分析规则、用以对源语言/目标语言之间的转换规则以及用于生成目标语的生成规则。

由此可见, 基于规则的机器翻译的核心问题是构造完备的或适应性较强的规则系统。但是, 规则库的建立需要花费大量的人力和物力, 即使如此, 规则的完备性仍然不能得到保证, 规则库很难覆盖所有的语言现象。随着规则数量的增加,规则之间的冲突很难避免;很难用系统化的规则分类体系、恰当的规则粒度去刻画语言特征。而且早期的规则系统采用的都是确定性规则, 即, 非此即彼的规则, 系统的适应性很差。

基于上述问题, 如何自动地获取语言规则、如何更好地表示规则以及如何更好地增强系统的适应能力成为研究人员关注的焦点。随着大量语料库的产生, 统计方法为我们提供了很好的从己有的语言资源中自动得到我们所需要的语言信息的工具。复杂特征集和合一运算的提出也使得我们能以更细的粒度、更加准确的知识表示形式来描述规则, 而词汇化的信息也更多地来自于标注语料库。针对确定性规则降低了系统的鲁棒性的弱点, 概率上下文无关文法川从全局最优的角度考虑, 产生最优的翻译结果, 为机器翻译系统的实用化奠定了基础。随着这些方法的引入, 传统的基于规则的机器翻译方法研究逐步发展成为对以规则为基础、语料库方法为辅助的高性能机器翻译方法的研究。

(2)基于统计的机器翻译方法

除了在某些特定的受限领域, 基于规则的机器翻译, 取得了比较好的效果之外, 在大部分的实验中, 基于规则的机器翻译远远没有达到人们的要求。而随着语料库语言学的发展和统计学、信息论在

自然语言处理领域的应用, 人们尝试着用统计的方法进行机器翻译的研究。对于机器翻译来说, 基于统计的方法可以从两个层面上来理解, 一种是指某些概率统计的方法在具体的机器翻译过程中的应用, 比如用概率统计的方法解决词性标注的问题、词义消歧的问题等;另一种较狭义的理解是指纯粹的基于统计的机器翻译,翻译所需的所有知识都来源于语料库本身。

(3)基于实例的机器翻译方法

基于实例的机器翻译思想最早是由Nagao提出,其基本思想是, 在已有的源语言实例句库中, 待翻译句子按照类比原理匹配出最相似的实例句, 取出实例句对应的目标语句子, 进行适当的改造, 最终得出待翻译句子所相应的目标语句子。整个翻译过程实际上是一个匹配过程。它的特点是不需要对源语言进行任何的分析, 仅仅是通过类比进行翻译。

从翻译过程来看, 句子一级对齐的双语语料库是基于实例的机器翻译系统的知识源, 在基于实例的机器翻译系统中,双语对齐语料库被称为翻译记忆库(Translation Memory)。

对于基于实例的系统, 首先, 待翻译句子需要从翻译记忆库中找出最相似的源语言句子, 一般根据词典或者语言的本体知识(Ontology), 根据句子中词汇或者词类之间的语义距离来计算句子的相似度。

基于实例的机器翻译系统的翻译质量取决于翻译记忆库的规模和覆盖率。因此如何构建大规模翻译记忆库成为基于实例的机器翻译研究的关键问题。

现阶段, 由于缺少大规模的双语对齐语料库, 基于实例的机器翻译方法匹配率并不是很高, 而基于实例的机器翻译如果匹配成功, 可以获得高质量的译文, 因此基于实例的机器翻译一般和基于规则的机器翻译结合使用。对于匹配命中率过低的问题, 我们试着做到短语级的双语对齐, 以提高匹配命中率, 通过短语结构的局部匹配, 组合相应的目标语句子框架, 完成句子的翻译, 这种方法进而泛化为基于模板(Template-based)的机器翻译, 通过大规模的双语语料, 自动抽取翻译模板, 翻译过程匹配模板库。这种方法增加了匹配的命中率, 模板库规模比实例库要小, 因此也提高了系统的效率。而模板的自动获取仍然是翻译的关键。

基于实例的机器翻译方法依然面临着很多的问题, 对于相似度计算, 如果计算词类或者短语级的相似度, 则需要首先对我们的翻译记忆库本身进行标注。而且很难定义一个相似度标准选出最合适的相似句, 此外随着翻译记忆库规模的扩大, 需要一个高速的查询匹配算法, 同时需要在增加翻译记忆库的规模、提高匹配率的同时, 保证翻译记忆库的冗余度。

在机器翻译研究的过程中, 各种机器翻译方法层出不穷,其它的还有基于模式的机器翻译、基于神经网络的机器翻译、基于对话的机器翻译、基于原则的机器翻译等等。

现有的各种机器翻译方法在现阶段的机器翻译研究中被广泛采用, 它们之间已经没有严格的界限。基于规则的机器翻译方法结合语料库的方法, 大量使用统计方法获取语言信息,而基于统计的机器翻译和基于实例的机器翻译更是相互渗透, 这两种方法统称为基于语料库的方法, 因为它们同样依靠双语语料库。

基于混合策略的机器翻译方法研究

根据上面对几种机器翻译方法的介绍, 可以看出, 不同的机器翻译方法有各自的优势和局限性, 基于规则的方法优势在于可以很准确地描述语言特征规律, 符合理性思维;而基于统计的方法可以缓解知识获取的瓶颈问题。因此如何发挥各种机器翻译方法的优势, 把各种方法有效地结合起来, 从而改善机器翻译系统的性能, 成为我们研究的重点。在现阶段, 把传统的基于规则的方法和基于语料库的方法相结合, 己经成为机器翻译研究的主流。在结合策略上, 一种策略是进行多引擎的机器翻译, 结合各种机器方法, 充分发挥各种机器翻译方法的优点, 生成高质量的译文。还有一种策略是在基于规则的机器翻译方法中, 利用语料库资源, 采用统计学和机器学习的技术解决机器翻译中的局部问题, 进而提高整体性能。

在基于单一方法的机器翻译中, 不管采用哪种方法, 总是不能取得理想的效果, 究其原因, 主要是因为各种方法固有的问题造成的, 例如基于统计的机器翻译方法采用的二元语法模型无法解决长距离依赖问题, 以及语料库的标注体系、语料库的数据稀疏等等问题,

而基于规则的方法很难覆盖所有的语言现象, 并且在对源语言和目标语言分析生成过程中的歧义问题解决得不够理想。

于是, 基于混合策略的机器翻译方法成为研究的焦点, 基于混合策略的方法充分利用各种机器翻译方法的优势, 避免各种方法的不足, 做到翻译结果的最优化, 从而达到提高翻译系统性能的目的。

Frederking首先提出了多引擎的机器翻译的思想, 并且利用多引擎机器翻译的思想设计了Pangloss Mark Ⅲ机器翻译系统, 该系统结合了基于规则的机器翻译方法、基于实例的机器翻译方法和基于词汇转换的机器翻译方法, 主要设计思想是, 接收输入句, 用多个翻译引擎并行翻译句子片断(短语和词), 将每个翻译单元存储在一个chart中, 并根据某种评分标准给每个翻译单元打分, 最后利用动态规划算法给出最优翻译结果。合适的评分标准关系到能否选择到最佳的翻译结果,Pangloss系统采用人工评估和启发式评估方法相结合对翻译结果进行评分, 其后Brown在多引擎的机器翻译系统中加入统计模型, 利用N-gram对候选结果进行选择,减少了Pangloss系统中的对翻译结果评估的人工参与,Nomoto则用预测统计模型指导评估选择多引擎翻译结果。

Satoshi的文章介绍了基于规则和基于实例相结合的日英机器翻译系统, 首先分析了基于规则和基于实例方法的优缺点, 提出了两种翻译方法结合的翻译方法, 其具体算法是, 首先查找与输入句相似的源语言候选句集, 如果句集为空, 则转向基于规则的翻译系统处理, 生成目标语;如果不为空, 则对候选句集中的句子按照和输入

句的相似度进行排序,排序后按照基于词汇共现的方法聚集出目标语候选句, 然后根据源语言句集和对应的目标语句集找出最优的双语句对;最后比较输入句和最优句对中源语言句进行比较, 用规则对目标语句子进行替代、重排序等操作, 最终生成目标语。以句对做指导, 生成目标语这个阶段主要是规则指导的。

在基于混合策略的机器翻译系统中, 基于规则的方法一般用于对源语言进行语言分析, 而统计和实例的方法则对语言资源进行自动获取以及如何利用语言资源处理方面起着重要的作用。

根据上文对基于混合策略机器翻译系统的介绍, 机器翻译面临着词性标注、句法分析、消歧、目标语生成、语言知识自动获取、标注语料的构造、双语语料对齐、模型参数估计、平滑数据稀疏等等问题, 对于中文, 还有分词的问题。在语言分析生成以及语言知识库构造过程中, 机器学习的技术正在被广泛运用, 并且对机器翻译提供了巨大的帮助。

统计以及机器学习的方法实质是利用统计数据和机器学习算法在知识源的指导下解决机器翻译中遇到的问题。而知识源来自各种标注语料库, 例如, 词性标注需要标注词性的语料库, 句法分析需要句库。构建大规模的标注语料库是统计机器学习方法研究的基础。当然, 现在人们也尝试着在小规模的标注语料库的指导下, 用某些机器学习方法解决问题, 例如Bootstrapping、Co-Training、CRF等等。

机器翻译技术的现状及发展

机器翻译技术的现状及发展 篇一:翻译技术领域的现状与展望 翻译技术领域的现状与展望 作者/王华伟闫栗丽 翻译技术在中国的发展起步相对较晚,但近年来随着中国在全球化进程中扮演着越来越重要的角色,催生了对翻译技术发展的强烈需求。中国翻译行业在借鉴国外同行经验的基础上,于2007~2008年间在翻译技术领域取得了一系列成就,也还存在一些亟需改进的方面,而这也势必对我国的翻译行业产生深远的影响。 1. 国家政策的扶持和行业协会的推动 翻译技术的发展直接关乎整个翻译行业的翻译质量及效率,具备巨大的行业经济效益。对此,科技部、财政部都给与了足够的重视并拨出专项资金进行扶持。在 2008年的科技型中小企业技术创新基金扶持计划中,中文及多语种处理软件及基于先进语言学理论的中文翻译软件等赫然在列。而中国译协也在 2008年的第 18届世界翻译大会上专门辟出了翻译工具、术语管理和翻译标准等分论坛,着力推动翻译技术的探讨与发展。 2. 词典型翻译软件百花齐放 词典是使用范围最广的工具,它以使用便利的优势,几乎占据了每个计算机的桌面,无论语言学习者还是专业翻译人员,几乎都是必备工具。词典的发展从最早的单机版本发展至今,已经有很多种产品

类型,我们可以见到的有:电子词典、在线词典、手机词典等。“金山词霸”的网络版本“爱词霸”在这两年获得了长足的发展,如爱词霸网络释义、谷歌金山词霸等一系列特色功能的相继推出,将词典型翻译软件的应用领域从传统的桌面计算机拓展到网络、手机等,并取得了显著的成功。另外,类似Google这样的搜索引擎,因为信息量大,检索便利而成为很多专业翻译人员查词的重要辅助工具。 值得一提的是,最新推出的基于用户发布词汇的词典编撰系统之前的词典都是以各大出版社公开发行的词典中的词条作为主要数据库来源,为用户提供查询上的便利。但是传统出版词典的方式存在发布周期长、词汇更新慢的缺陷。互联网的出现,加快了信息传播的速度,也提高了用户对新词更新的速度要求,为了方便新词汇的发布,词典编纂系统也就应运而生了。这是一种基于用户的词典发布系统,用户可自由发起词典编纂项目,自发组织人员参与项目,发起人可以按照需要给小组成员分配不同的权限,将词汇添加等基本工作和审核人员明确区分,既确保了词典的专业性,也实现了专业语料的适时更新和发布。 3. 机器翻译应用软件融入普通网民生活 谷歌语言工具的推出打破了互联网语言的藩篱,用户可以方便简捷地将目标语言的网页转化成自己的母语进行浏览。事实上,这也是机器翻译软件的一个应用领域,而国内的相关软件如金山快译等,专注于为普通网民提供更为友好的英中日网站浏览体验,并在亚洲语言的机器翻译应用方面积累了大量的经验。其他如华建等长期从事机器

酶学性质研究

1.6 酶学性质研究 (1)pH 的影响:分别测定粗酶液在pH3.0、4.0、5.0、6.0、7.0、8.0下的酶活力,确定其最适反应pH 值;将粗酶液用上述pH 缓冲液稀释后,45℃水浴保温4小时后,测定其剩余酶活力。 (2)温度的影响:分别在40~95℃下测定酶活力,确定其最适反应温度;将酶液在40~90℃范围内的不同温度下保温60 min 后,测定其剩余酶活力。 (3)金属离子的影响:在酶液中分别添加各种金属离子,使其浓度为4 mmol /L ,然后测定酶活力。 2.5 纤维素酶粗酶液酶学性质 2.5.1酶反应的最适pH 值和酶的pH 稳定性 粗酶液在不同pH 值下测得的酶活及在不同pH 值下处理4小时后测得的相对酶活示于图11。结果表明,CMCase 在pH 3.5~4.5有较高的酶活力,最适反应pH 值为4.0;β-Gluase 在pH 4.5~5.5酶活力较高,最适反应pH 值为5.0,同样方法测得FPA 最适反应pH 为5.0。可见,该菌株所产的各组分纤维素酶是酸性酶。 图11表明,该菌产CMCase 在pH3.0~6.0的范围内,β-Gluase 在pH3.5~5.5的范围内,酶活力均可保持在80%以上,说明该菌株所产酸性纤维素酶可在较宽的pH 值范围内保持其酶活力的稳定性。2.5.2 酶反应的最适温度和酶的热稳定性 在不同温度下直接进行酶促反应测得的酶活及在不同温度下热处理60 min 后于最适反应温度和最适pH 下测得的相对酶活(以4℃保存的酶液活力为100%)示于图12。结果表明,CMCase 、β-Gluase 及FPA 最适反应温度均为65℃。 c e l l u l a s e a c t i v i t y ( U .m l -1) pH r e l a t i v e y a c t i v i t y (%) c e l l u l a s e a c t i v i t y ( U .m l -1) temperature ( o C ) r e l a t i v e y a c t i v i t y (%) 图11 pH 值对酶活力及酶稳定性的影响 Fig.10 Effects of pH value on Cellulase activity and stability 图12 温度对酶活力及酶稳定性的影响 Fig.11 Effects of temperature on activity and stability of cellulase

二氧化碳驱油技术研究现状与发展趋势

二氧化碳驱油技术研究现状与发展趋势 随着世界经济的飞速发展,能源的生产与供求矛盾越发突出,石油作为工业发展的命脉,由于其储量的有限性,使得人们对它的研究和关注程度远胜于其它能源。寻找有效而廉价的采油新技术一直是专家们不断探索的问题。 针对目前世界上大部分油田采用注水开发面临着需要进一步提高采收率和水资源缺乏的问题国外近年来大力开展了二氧化碳驱油提高采收率(EOR)技术的研发和应用。这项技术不仅能满足油田开发的需求,还可以解决二氧化碳的封存问题,保护大气环境。该技术不仅适用于常规油藏,尤其对低渗、特低渗透油藏,可以明显提高原油采收率 (一)二氧化碳驱油技术机理 1、降粘作用 二氧化碳与原油有很好的互溶性,能显著降低原油粘度,可降低到原粘度的1/10左右。原油初始粘度越高,降低后的粘度差越大,粘度降低后原油流动能力增大,提高原油产量。 2、改善原油与水的流度比 二氧化碳溶于原油和水,使其碳酸化。原油碳酸化后,其粘度随之降低,同时也降低了水的流度,改善了油与水流度比,扩大了波及体积。 3、膨胀作用 二氧化碳注入油藏后,使原油体积大幅度膨胀,便可以增加地层的弹性能量,还有利于膨胀后的剩余油脱离地层水以及岩石表面的束缚,变成可动油,是驱油效率升高,提高原油采收率。 4、萃取和汽化原油中的轻烃 在一定压力下,二氧化碳混合物能萃取和汽化原油中不同组分的轻质烃,降低原油相对密度,从而提高采收率。二氧化碳首先萃取和汽化原油中的轻质烃,随后较重质烃被汽化产出,最后达到稳定。 5、混相效应 混相效应是指两种流体能相互溶解而不存在界面,消除了界面张力。二氧化碳与原油混合后,不仅能萃取和汽化原油中轻质烃,而且还能形成二氧化碳和轻质烃混合的油带。油带移动是最有效的驱油过程,可使采收率达到90%以上。 6、分子扩散作用 多数情况下,二氧化碳是通过分子的缓慢扩散作用溶于原油。分子的扩散过程很

兽用中草药研究开发展望

中兽医医药杂志J TCVM 2005年第4期 综述专论兽用中草药研究开发展望 梁剑平1,张应禄2,李滋睿2 (1.中国农业科学院兰州畜牧与兽药研究所农业部新兽药工程重点开放实验室,甘肃兰州730050;2.中国农业科学院) 中图分类号:S85311文献标识码:A文章编号:1000-6354(2005)04-0021-03 兽用中草药被广泛应用于预防和治疗畜禽疾病,或促进动物生长,提高饲料报酬。由于它无药物残留,对人类健康不构成危害,所以受到了广大消费者和畜禽养殖者的欢迎。有关专家认为,兽用中草药由于不会对食品安全构成威胁,将在很大程度上逐步取代化学药品,有广阔的发展前景,使其开发商机凸现。兽用中草药是我国兽医药学的宝贵遗产,长期以来对畜禽的繁殖和发展做出了不可磨灭的贡献。它不仅在中国得到了继承和发展,而且在国际上也产生了巨大的影响,亚洲的很多国家和地区把兽用中草药当成提高畜禽健康质量的重要手段,与西方现代兽医药共同用于临床。欧美各国在/回归大自然0的口号影响下,也越来越重视兽用中草药的研究,一些兽用中草药的治疗作用逐渐得到了临床的认可。 1畜牧业发展对兽用中草药开发及其技术需求分析近些年来,食品安全、药残与耐药性等问题日益受到重视,许多发达国家已经禁用了许多兽用药品饲料添加剂。美国基于人畜交叉抗药性的顾虑而撤销了恩诺沙星与沙拉沙星在禽类使用的注册标准,并且在可预见的未来也不再审批任何氟喹诺酮类作为兽药。2000年7月23日,世界卫生组织在日内瓦召开会议,提出了限制对家畜使用化学抗菌药新建议。近年来发现化药、抗生素类具有毒副作用及其残留,严重地影响人类健康,甚至引起/三致0和损害免疫功能。自1987年以来,英国和法国植物药的购买力分别上升了70%和50%,而美国市场每年亦以高于20%的速度增长。日本的汉方制剂从90年代开始,每年都以15%以上的速度增长。国际植物药市场份额每年已达270亿美元。 标准化是我国传统医药进入国际市场的突破口,是兽用中草药现代化发展的必要条件。我国物种丰富,药物种植面积大,品种齐全,但所占市场份额还不足5%。其中最大的制约因素是我国中药标准化程度低,生产工艺较落后,缺乏科学规范的质量标准和质量控制手段。这是中兽药界的难点问题,同时也是制约中兽药走出国门,走向世界的/瓶颈0。因此,必须要建立健全中药材的质量规范标准,在现行的《中华人民共和国兽药典》所列的药材的基础上进一步完善。 2国内外科技发展水平比较分析 国外由于受到中药资源的限制,中兽药的发展起步较晚,主要是通过微生物发酵制备多糖、寡糖。多糖能提高动 收稿日期:2004-12-27 项目来源:/十五0国家攻关计划资助 作者简介:梁剑平(1963-),男,研究员,博士,主要从事兽药研究。物免疫力,其中消化道免疫占动物免疫系统的很大部分,因而能对消化道起到很好的保护作用,另外,肠道黏膜内的IgA 抗体还可通过其自身产生的抗体细胞毒素直接杀灭细菌。寡糖为1~9个单糖所组成,由于其能促进猪、鸡肠道内有益菌群优势形成,其中主要是拟杆菌、双歧杆菌及乳酸杆菌等,能有效地降低病原菌的致病力,结合吸收外源性病原菌及调节机体免疫系统,提高动物免疫力等功能,成为研究的热点。在国外寡糖是最有希望替代化药与抗生素的天然物质。其研究主要通过完成了菌种鉴定与系统发育分析、酶的生产条件、酶的纯化与特性、酶基因的克隆表达与序列分析、酶的高产菌株选育、寡糖的组分、结构及生理功能分析,以及酶和寡糖的工业生产试验等涉及多学科的系统工程,结合极端菌及极端酶的特性,以新的方法解决了酶的碱、盐、热稳定性、酶活力、寡糖生成率等,实现了极端B-聚糖酶以及寡糖的生产及应用。国内在多糖、寡糖研究方面也进行了诸多的研究,已通过对酵母菌培养,成功的生产出甘露寡糖。除多糖、寡糖研究外,中兽药主要是围绕我国丰富的中药资源进行了中药的方剂学,有效单体的提取、合成及结构修饰,与中兽药的稳定性方面进行了一系列的研究,因为在新兽药创制中,重要的环节是要保证有高质量的、稳定可控的中药材原料。 2.1中药资源开发取得新的进展 我国现有的中药资源种类已达12807种,其中药用植物11146种,药用动物1581种,药用矿物80种。仅对320种常用植物类药材的统计,总蕴藏量就达850万吨。全国药材种植面积超过580万亩,药材生产基地600多个,常年栽培的药材达200余种。野生变家种取得了积极成果,许多已成为主流商品。对珍稀濒危野生动植物品种开展了人工种植、养殖和人工替代品研究,对进口药材的引种也取得了可喜的成就,形成了一定的生产能力,药材进口的数量明显减少。云南西双版纳分布的植物锡生藤已合成新药/傣肌松0,与进口的/氯化箭毒碱0有相似的肌肉松弛作用。从进口药材的国产近缘植物中寻找代用品的实例还有很多,如以国产安息香代进口安息香;以国产马钱子代进口马钱子;以西藏胡黄连代进口胡黄连;以白木香代沉香等等,应用有效成分为指标,从近缘科、属中扩大药源,这方面中国已做了大量比较系统和深入的研究工作,已进行研究的主要种类有小檗属、薯蓣属、鼠尾草属、葛属、黄连属、大黄属、甘草属、石蒜属、丹参属、金银花属、莨菪类、蒿类、柴胡属、淫羊藿属、苦参属等植物。 2.2科研开发形成新的局面 2.2.1提取和合成制药在提取和合成制药的研究及生产 21

机器翻译

机器翻译 1 概述 机器翻译(machine translation),又称为自动翻译,是利用计算机把一种自然源语言转变为另一种自然目标语言的过程,一般指自然语言之间句子和全文的翻译。它是自然语言处理(Natural Language Processing)的一个分支,与计算语言学(Computational Linguistics )、自然语言理解( Natural Language Understanding)之间存在着密不可分的关系。 2 国内外现状 机器翻译思想的萌芽关于用机器来进行语言翻译的想法,远在古希腊时代就有人提出过了。在17世纪,一些有识之士提出了采用机器词典来克服语言障碍的想法。笛卡(Descartes)和莱布尼兹(Leibniz)都试图在统一的数字代码的基础上来编写词典。在17世纪中叶,贝克(Cave Beck)、基尔施(Athanasius Kircher)和贝希尔(Johann JoachimBecher)等人都出版过这类的词典。由此开展了关于“普遍语言”的运动。维尔金斯(JohnWilkins)在《关于真实符号和哲学语言的论文》(An Essay towards a Real Character andPhilosophical Language, 1668)中提出的中介语(Interlingua)是这方面最著名的成果,这种中介语的设计试图将世界上所有的概念和实体都加以分类和编码,有规则地列出并描述所有的概念和实体,并根据它们各自的特点和性质,给予不同的记号和名称。本世纪三十年代之初,亚美尼亚裔的法国工程师阿尔楚尼(G.B. Artsouni)提出了用机器来进行语言翻译的想法,并在1933年7月22日获得了一项“翻译机”的专利,叫做“机械脑”(mechanical brain)。这种机械脑的存储装置可以容纳数千个字元,通过键盘后面的宽纸带,进行资料的检索。阿尔楚尼认为它可以应用来记录火车时刻表和银行的帐户,尤其适合于作机器词典。在宽纸带上面,每一行记录了源语言的一个词项以及这个词项在多种目标语言中的对应词项,在另外一条纸带上对应的每个词项处,记录着相应的代码,这些代码以打孔来表示。机械脑于1937年正式展出,引起了法国邮政、电信部门的兴趣。但是,由于不久爆发了第二次世界大战,阿尔楚尼的机械脑无法安装使用。1903年,古图拉特(Couturat)和洛(Leau)在《通用语言的历史》一书中指出,德国学者里格(W. Rieger) 曾经提出过一种数字语(Zifferngrammatik),这种语法加上词典的辅助,可以利用机械将一种语言翻译成其他多种语言,首次使用了“机器翻译” (德文是ein mechanisches Uebersetzen)这个术语。 真正对机器翻译进行研究应该说是从布恩和韦弗开始的。他们研究的是自动词典万, 从1954年1月7日公开展示的IBM701型计算机开始, 机器翻译进人一个繁荣发展的时期。从那时起, 很多国家都投人了大量的人力、物力从事这方面的研究和开发。随着 Internet 的普遍应用,世界经济一体化进程的加速以及国际社会交流的日渐频繁,传统的人工作业的方式已经远远不能满足迅猛增长的翻译需求,人们对于机器翻译的需求空前增长,机器翻译迎来了一个新的发展机遇。国际性的关于机器翻译研究的会议频繁召开,中国也取得了前所未有的成就,相继推出了一系列机器翻译软件,例如“译星” 、“雅信” 、“通译” 、“华建”等。在市场需求的推动下,商用机器翻译系统迈入了实用化阶段,走进了市场,来到了用户面前。 中国机器翻译研究起步于1957年,是世界上第4个开始搞机器翻译的国家,60年代中期以后一度中断,70年代中期以来有了进一步的发展。现在,中国社会科学院语言研究所、中国科学技术情报研究所、中国科学院计算技术研究所、黑龙江大学、哈尔滨工业大学等单位都

重油加氢技术特点和发展趋势

113重油加氢技术特点和发展趋势 卜蔚达 (中国石油大学(北京)化学科学与工程学院,北京 102249) 摘要:本文针对重油加氢技术的重要性和应用情况,从工艺和催化剂角度分别介绍了固定床、悬浮 床、沸腾床、移动床加氢技术的特点和发展现状,通过对四个工艺优缺点的分析提出了重油加氢的研 究方向和发展趋势。 关键词:重油加氢;固定床;悬浮床;沸腾床 引言 随着原油的变重、变稠以及轻质油品的需求量不断增大,重油加工成为现代炼厂面临的主要问题。目前重油加工主要有延迟焦化、减粘裂化、重油催化裂化和重油加氢4个工艺过程[1]。延迟焦化和减粘裂化属于热加工过程,其特点是可以处理各种渣油,但是液体产物的质量差、焦炭产率高。重油催化裂化对原料的要求较高,无法处理劣质的渣油。重油加氢一方面可以处理高硫、高残炭、高金属的劣质渣油,另一方面可以提高液收率和液体产物的质量。同时可以和其它工艺进行组合,特别是重油加氢和催化裂化组合工艺。我国在重油加氢方面和国外存在着较大的差距,但是随着国内环保机制的日益严格化,对油品的质量提出了更高的要求,提高重油加氢技术显得尤为迫切。 1 重油加氢技术 1.1 固定床加氢技术 固定床渣油加氢技术的应用最为广泛,工业化过程也最多。我国引进和自行设计开发的渣油固定床加氢工艺如下[2,3]: 1.1.1 VRDS工艺 我国第一套渣油固定床加氢工艺,于20世纪90年代初由齐鲁石油化工公司从美国Chevoron公司引进。最初的设计以孤岛减压渣油为原料,以生产低硫燃料油为目的,后来发展成VRDS-RFCC组合工艺,即减压渣油经固定床加氢处理后给重油催化裂化提供原料。采用组合工艺后,其渣油能够全部转化,加工深度高,轻质油收率高。 1.1.2 ARDS工艺 我国从UOP公司引进的中东含硫原油常压渣油加氢脱硫装置。对常压渣油进行加氢脱硫、脱氮、脱金属、脱残炭等使加氢后的重馏分可在催化裂化等装置中进一步轻质化。 1.1.3 S-RHT工艺 茂名石油化工公司渣油固定床加氢脱硫装置是我国自行设计开发的固定床加氢处理技术,洛阳石油化工工程公司承担此项目的工程开发、工程设计,设计原料为中东含硫原油的减压渣油及部分减压蜡油混合料,主要产品为少量石脑油、柴油和大量的脱硫改质催化裂化进料。 固定床重油加氢的优点是工艺成熟,产品收率高,精致深度高,脱硫率可以达到90%[4]以上,工艺和设备结构简单,易操作。缺点是无法及时更新催化剂,在处理高金属和高沥青质、高胶质含量的原料时,催化剂减活和结焦较快,床层也易被焦炭和金属有机物堵塞。只能加工金属<200μg/g,残炭<15%的渣油[4],因此对原料的适应性较差。固定床反应器是非等温反应器,对于放热的加氢反应容易产生飞温现象。另外,固定床加氢工艺单程转化率低(20%-50%)[4],需要有较大的重油催化裂化、柴油加氢精制装置进行配套,产品中柴汽比较低。1.2 悬浮床加氢技术 我国悬浮床加氢工艺还处于研究和开发阶段,目前主要有两种工艺过程,即[1]。 1.2.1 FRIPP的悬浮床工艺 该工艺采用空筒式反应器和高活性水溶性多金属分散催化剂、现场乳化分散、硫化剂直接加入到原料中,在加热过程中催化剂进行预硫化的方式操作,催化剂具有较强的抑焦功能,可实现长周期连续运转。催化剂水溶液被乳化分散在原料油中直接通过反应器,流程简单、操作方便,克服了早期的悬浮床工艺尾油中含有大量固体颗粒从而难以 2010年第3期2010年3月 化学工程与装备 Chemical Engineering & Equipment

尘肺病临床治疗研究概况

实、叙述的写作手法来记录检查的情况,切忌在笔录中作评论、推断。现场笔录应该是执法人员在现场所看、所听的实录,而不应是询问笔录。2.2 贴近案情 可以采取“由大到小”、“由粗到细”的方法,首先简要描述大环境、方位地点,再收缩到具体需要重点检查的位置;从物品总体摆放、堆码再聚焦到具体商品数量,包装标签及现场痕迹等等。同时,对现场从业人员在从事何种活动,也要作好记录。对与具体案情关联不大的内容,可以简写,而对于与案情关联紧密的商品、标识、人员作业情况、工具、原料、广告、检查过程,甚至能证明案件事实的地面污水痕迹、废弃损毁物品的状况都应详记,并尽可能地加以固定、提取。2.3 抓住重点 现场检查中,往往可以意外地发现一些对定案十分关键的证据,要注意策略,可以采取以虚掩实、迂回反抄的方法将这些证据予以固定、提取。3 制作要点 3.1 当事人在被检查场所开展经营活动的由来或 当事人与被检查场所的关系。3.2 场所的概况。情况复杂的场所应交代方位,必 要时绘图说明。 3.3 与违法行为有关的物品、工具、设施的名称、规格、数量、状况、摆放位置、使用情况及相关的书证、物证。3.4 与违法行为有关的人员的活动情况,包括当事人及其职工、帮工以及顾问、消费者的情况。3.5 检查人员检查的活动及结果。3.6 当事人在检查活动中的异常表现及其行为。3.7 交代现场询问当事人、旁证人员,现场摄影、录像、绘图,当事人主动提交的证据的情况。3.8 交代抽样取证、强制措施的情况。情况复杂、 规模较大的场所,可以按照分工,由检查人员按照各自的检查任务,分别制作笔录,但最后应制作汇总笔录,总结整个检查情况。3.9 《现场检查笔录》应在现场检查时当场制作,不能今天检查,第二天才完成笔录。3.10 笔录写好后要交给当事人阅读或向其宣读,并由当事人签章(逐页)。当事人拒绝签名或不能签名的应当注明原因,并且由2名以上执法人员在笔录上签字。有其他人在场时,可由其他人签名。法律、法规和规章对现场检查笔录的制作形式另有规定的,从其规定。 ?综 述? 尘肺病临床治疗研究概况 崔 萍,侯 强 (山东省职业卫生与职业病防治研究院,山东 济南 250002) [收稿日期]2007204230 山东省医药卫生计划科技项目 项目号:(2003-133) [摘要] 我国尘肺病是危害人数最多的职业病,发病率约占所有职业病的80%,建国以来,政府对尘肺病的防治一直十分重视,开展了大量的研究工作,作者回顾了近50年尘肺病临床治疗的几个主要阶段,从基础治疗(营养、运动)、西药、中药、肺灌洗几个方面,分别概述了与其相关的药物成分、作用机制、临床研究和疗效。提倡目前依病人的病情进行肺灌洗、抗纤维化、减轻非特异性炎性反应、调节免疫功能、抗脂质过氧化、对症支持等综合治疗措施。提出霜桑叶有望成为疗效高、无毒副作用、价格低廉、依从性好治疗尘肺病的新药。 [关键词] 尘肺病;治疗方法;药物疗法;中医中药;肺灌洗 [中图分类号]R13512 [文献标识码]A [文章编号]1007-6131(2007)0320226204 尘肺病是由于在职业活动中长期吸入生产性粉尘并在肺内潴留而引起的以肺组织弥漫性纤维化为 主的全身性疾病。尘肺病被称为中国头号职业病,卫生部称截至2005年,中国尘肺累积病例607570

机器翻译研究现状与展望1 Machine TranslationPast,Present,future

机器翻译研究现状与展望1 戴新宇,尹存燕,陈家骏,郑国梁 (南京大学计算机软件新技术国家重点实验室,南京 210093) (南京大学计算机科学与技术系,南京 210093) 摘要:本文回顾机器翻译研究的历史,介绍典型的机器翻译方法,包括:基于规则、基于统计以及基于实例的机器翻译方法;针对机器翻译的研究现状,详细介绍和分析了基于混合策略的机器翻译方法,对统计以及机器学习方法在机器翻译中的应用进行了描述;论文还介绍了当前机器翻译评测技术;最后对机器翻译进行总结和展望。 关键字:机器翻译,基于规则,基于统计,基于实例,混合策略,机器学习 Machine Translation:Past,Present,future Dai Xinyu, Yin Cunyan, Chen Jiajun and Zheng Guoliang (State Key Laboratory for Novel Software Technology, Department of Computer Science & Technology Nanjing University, Nanjing 210093) Abstract:This paper firstly presents the history of machine translation, and introduces some classical paradigms of machine translation: RBMT, SBMT and EBMT. Secondly, we introduce the recent research on machine translation, and describe the hybrid strategies on machine translation in detail, and discuss the applications of machine learning for machine translation. We also analyze the current techniques about evaluation on machine translation. Finally, we draw a conclusion and prospect on the research of machine translation. Keywords:Machine Translation, RBMT, SBMT,EBMT, HSBMT, Machine Learning. 1本论文工作得到863课题资助(编号:2001AA114102, 2002AA117010-04) 戴新宇博士生,主要研究自然语言处理;尹存燕助教,主要研究自然语言处理;陈家骏教授,博士生导师,主要研究自然语言处理、软件工程;郑国梁教授,博士生导师,主要研究软件工程。

含油污泥的处理现状及展望

含油污泥的处理现状和展望 摘要 含油污泥会对环境造成二次污染,必须进行无害化处理和资源化利用。针对含油污泥处理现状,分析了国内外处理含油污泥方法上存在的问题,综述了国内外含油污泥的处理技术现状、及含油污泥处理技术的研究进展。资源化利用将成为含油污泥处理技术的发展趋势。关键词:含油污泥;资源化;除油;综述 Abstract: Oily sludge may do harm to the production and the environment and must be treated harmlessly and be utilized comprehensively.n view of the present situation of oily sludge treatment, the problems existing in oily sludge treatment at home and abroad are analyzed.This article summarized the present situation about domestic and foreign oily sludge treatment, and forecast the development direction about technology of oily sludge treatment. Resources utilization of oily sludge will be the dominant technique for oily sludge treatment in the future. Key Words: oily sludge、comprehensive utilization、oil removal、detoxification 1含油污泥的危害和来源 含油污泥是石油生产的伴随品,是石油生产的主要污染源之一,也是影响油田及周边环境质量的一大难题。含油污泥中大量的有机物和丰富的氮、磷、硫等营养物质,不加稳定处理的污泥任意排入水体,污泥中的有机物和氨氮将大量消耗水体中的氧,导致水体水质恶化,严重影响水生物的生存,营养物质又会使水体富营养化,在沿海海域造成赤潮和绿潮。除此,不同成分的含油污泥对环境和人类造成的危害是不同的。 1.1含油污泥的危害 油田含油污泥的组成成份极其复杂,是一种极其稳定的悬浮乳状液体系,含有大量老化原油、蜡质、沥青质、胶体、固体悬浮物、细菌、盐类、酸性气体、腐蚀产物等,还包括生产过程中投加的大量凝聚剂、缓蚀剂、阻垢剂、杀菌剂等水处理剂[1]。并因其体积庞大,排放后不但占用大量耕地,而且对周围土壤、水体、空气都将造成污染。我国现已对含油污泥的排放加强了重视[2],目前明确规定,肆意排放未经处理的含油污泥将处以1 000元/ m3·d 的罚款。这样虽然限制了部分污染物的排放,但仍然不能从根本上解决问题。所以含油污泥

机器翻译研究综述

机器翻译综述 1.引言 1.1机器翻译的历史 现代机器翻译的研究应该是从20世纪50年代开始,但是早在这以前很多人已经提出了相应的想法,甚至是远在古希腊时期就有人提出要用机器来进行语言翻译的想法。 在1946年,美国宾夕法尼亚大学的两位科学家设计并制造了世界上第一台电子计算机。与此同时,英国工程师同美国洛克菲勒基金会副总裁韦弗在讨论计算机的应用范围时,就提出了利用计算机实现语言的自动翻译的想法。在1949年,韦弗发表了一份名为《翻译》的备忘录,正式提出了机器翻译问题。他提出了两个主要观点: 第一,他认为翻译类似于解读密码的过程。 第二,他认为原文与译文“说的是同样的事情”,因此,当把语言A翻译为语言B时,就意味着从语言A出发,经过某一“通用语言”或“中 间语言”,可以假定是全人类共同的。 在这一段时间由于学者的热心倡导,实业界的大力支持,美国的机器翻译研究一时兴盛起来。 1964年,美国科学院成立语言自动处理咨询委员会,调查机器翻译的研究情况,给出了“在目前给机器翻译以大力支持还没有多少理由”的结论,随后机器翻译的研究就陷入了低潮期。直到70年代以后机器翻译的研究才重新进入了一个复苏期,随后机器翻译的发展又迎来了繁荣期 1.2机器翻译的主要内容 经过50多年的发展,在机器翻译领域中出现了很多的研究方法,总结如下:●直接翻译方法 ●句法转换方法 ●中间语言方法 ●基于规则的方法 ●基于语料库的方法 基于实例的方法(含模板、翻译记忆方法) 基于统计的方法 在当前的研究中,更多的是基于统计的方法进行的,因为基于统计的方法可以充分的利用计算机的计算能力,并且并不需要过多的语言学知识作为支撑,可以让更多的计算机科学家投入到实用系统的研究中,极大的促进了统计机器翻译的发展。 下面对各个方法逐一的进行介绍。

提高采收率研究的现状及近期发展方向

?油气开发总论? 提高采收率研究的现状及近期发展方向 杨普华 (中国石油天然气集团公司石油勘探开发科学研究院) 摘要 介绍了国外提高油气采收率(EOR )方法的应用现状、应用规模、增油量及其在总产量中的比例;介绍了美国能源部支持的三次采油基础研究情况;分析了EOR 方法与油价的关系;分析了我国在聚合物驱、复合驱、注气、微生物采油等方面的技术状况和应用规模,对近期的发展思路提出了建议。 主题词 提高采收率 方法 研究 分析 1 国外提高采收率技术现状 据1998年美国《油气杂志》 (O il &Gas J ou rnal A p r .20,1998)资料,在1998年初,全世界来自提高采收率(EOR )和重油项目的石油产量大约为213×106b d ,比1996年初的212×106b d 稍有增长,这个数量相当于世界石油产量的315%。美国EOR 产量比两年前增加5%,达到760000b d ,为美国石油年产量的12%。其他各国的EOR 和重油产量为:加拿大,400000b d ;中国,280000b d ;前苏联,200000b d ;其他国家,700000b d 。 111 热采 热采(蒸汽,地下燃烧)仍是最主要的方法。美国EOR 产量中约60%来自热采,其他绝大多数来自注气(轻烃、二氧化碳和氮气)。化学驱主要在我国得到发展,其他国家基本处于停滞状态。热采,尽管实施的项目数有所减少,但自1986年以来产量一直保持稳定,在EOR 产量中始终保持在60%以上。 图1 美国EOR 产量 112 注二氧化碳 近年来,在低油价下,各种提高采收率方 法实施的项目都在减少,只有二氧化碳混相驱 项目一直在稳定增加(见图1)。一方面是由于 美国有十分丰富的天然二氧化碳气源,并在高 油价下已修好了三条输送二氧化碳的管道,可 以把二氧化碳从产地直接输送到二氧化碳的 用地T exas 州;另一方面,二氧化碳驱的技术 得到很快的发展,其成本大幅下降,使一些较 小的项目也有利可图,从而促进了二氧化碳驱 收稿日期:1999207201 改回日期:1999208223 杨普华,教授级高工,博导,享受政府特殊津贴,长期从事油层物理和提高采收率科研工作,石油勘探开发科学研究院副总工程师兼采收率研究所所长。1第6卷 第4期 油气采收率技术

浅谈机器翻译存在的问题

机器翻译及其问题浅析 摘要:由于信息技术高速发展,国际交流日益频繁,如何克服语言障碍已经成为国际社会共同面对的问题,而人工翻译的方式已经远远不能满足需求。利用机器翻译协助人们快速获取信息已成为必然趋势,但机器翻译仍存在一些影响译文可读性和准确性的问题。本文将简单介绍机器翻译并对常见问题进行浅析。 关键词:机器翻译问题语法应用 一、引言 机器翻译(Machine Tanslation,简称MT),又称自动翻译,是利用计算机来进行不用的自然语言之间的翻译,它是自然语言处理(Natural Language Processing)的一个分支,与计算语言学(Computational Linguistics )、自然语言理解(Natural Language Understanding)之间存在着密不可分的关系。它是横跨语言学、数学、计算机科学、翻译学及人工智能等的综合学科,也是信息时代语言应用的一个重要领域。 二、机器翻译的简介 (一)机器翻译简史 人类在近代就萌发了机器翻译的梦想,但是真正把设想付诸现实还是因为计算机的诞生和计算机技术的发展。机器翻译的研究历史课追溯到20世纪四五十年代。1946年第一台现代电子计算机ENIAC诞生,同一年,美国科学家韦弗(W. Weaver)和英国工程师布斯(A. D. Booth)在讨论电子计算机的应用范围时,提出了利用计算机进行语言自动翻译的想法。1949年,韦弗(W. Weaver)发表《翻译备忘录》,正式提出机器翻译的思想。经过六十年的曲折发展,到目前互联网的普遍应用,以及人们对翻译需求的迅猛增长,给机器翻译带来新的发展机遇。我国相继推出了一系列的机器翻译软件如“译星”、“雅信”、“通译”、“华建”等。在市场需求的推动下,商用机器翻译系统迈入了实用化阶段,走进了市场,来到了用户面前。 (二)机器翻译的主要方法 机器翻译的过程一般可简化为三个阶段:原文分析、原文译文转化和译文生成。表象上,机器翻译的核心问题是翻译的准确性;实质上,体现在技术层面则是机器翻译系统采用的方法论问题。在方法论层面,机器翻译系统可分为基于规则(Rule-Based )和基于语料库(Corpus-Based)两大类。 基于规则(Rule-Based )就是由词典和语法规则库构成翻译知识库。尽管语言学家经过长期努力创建了含有成千上万条规则的规则库,覆盖了相当大范围的语言现象,但却难以

酶学研究中的诺贝尔奖

酶学研究中的诺贝尔奖 标签:教育酶学研究诺贝尔奖分类:生物学史与学家 酶学研究中的诺贝尔奖 学习感悟:科学家对酶的研究也经历了很长时间,教材中也有简单的酶的发现过程,学习过程中也涉及到很多酶,今天看到生物学通报中完整的诺贝尔奖中对酶的研究达到了10次,现摘录如下以供学习。 酶在生命体的新陈代谢过程中占有重要地位,几乎所有细胞的生命活动都需要酶的参与。19世纪30年代德国化学家Liebig和他的同事Wohler从苦杏仁汁中发现了一种催化物质,后被命名为苦杏仁酶(emulsion),这是最早发现的酶之一。随后又有许多酶被相继发现,酶学研究也进入飞速发展时期。 从1907年比希纳获得酶学研究史上的首个诺贝尔奖开始,在酶学领域中先后有多次诺贝尔奖获奖记录。 1.1907年诺贝尔化学奖获奖者爱德华·比希纳(德国)获奖理由发现无细胞发酵现象 20世纪初德国科学家爱德华·比希纳利用细沙和酵母菌作为实验材料,混合并加以研磨,随后加上矽藻土,用水力压榨机制备酵母榨出液,利用这种液体为浓蔗糖溶液防腐,经过反复实验发现酵母榨出液引起了蔗糖的发酵。但此榨出液中没有活的酵母细胞。随后,为确保实验结果的准确性,他又利用乙醇和丙酮杀死活的酵母细胞,仍然引起了蔗糖的发酵。1897年他发表题为《无细胞的发酵》论文,引起了学术界的轰动。论文否定了发酵作用是“生命现象”的概念,建立了微生物的生命活动和酶化学之间的联系。 爱德华·比希纳的研究推动了生物化学、微生物学、发酵生理学和酶化学的发展,并获得了1907年的诺贝尔化学奖,这在酶学研究史上是一次巨大的飞跃,开创了微生物生化研究的新篇章。 2.1929年诺贝尔化学奖获奖者亚瑟·哈登(英国)和汉斯.冯·奥伊勒-凯尔平(瑞典)获奖理由阐述了糖发酵过程中酶的作用 亚瑟·哈登(Harden Sir Arthur)是英国生物化学家。1904年他将酵母提取物放入半渗透薄膜袋内进行渗析时发现,酵母酶的活性消失,它不再使糖发酵。然而,如果将渗析至袋外的水加入袋内的物料中,则酵母酶活性又会恢复。同时观察到渗析开始时,酵母提取物迅速将葡萄糖分解并产生二氧化碳,但是随着时间的推移,其活性逐渐降低。他推测酵母酶是由2部分组成的,一部分是小分子,另一部分则是大分子。两者单独作用都不会使糖发酵。只有共同作用才有发酵的效果。如果将袋内的物料煮沸,则活性消失,即使袋内加入了袋外的水也是如此。实验证明大分子是蛋白质,小分子经受住了煮沸,因而多半不是蛋白质。这种小分子是“辅酶”发现的首个实例,它是一种非蛋白质结构的小分子,这种小分子对于酶的作用是不可或缺的。 汉斯.冯·奥伊勒一凯尔平是杰出的瑞典生物化学家。他在访问比希纳的实验室后对发酵产生了浓厚兴趣。由于哈登发现了发酵过程需要酶和辅酶共同发挥作用,因此经过10年潜心

机器翻译技术的现状及发展

机器翻译技术的现状及发展 摘要:本文在分析机器翻译内涵的基础上,阐述了机器翻译的历史和现状,探讨了机器翻译所面临的问题及机器翻译的发展趋势。 关键词:机器翻译;自然语言;发展趋势 1.引言 《圣经.创世纪》中第十一章巴别塔:“耶和华说:看哪,他们成为一样的人民,都是一样的言语,如今既作起这事来,以后他们所要作的事就没有不成就的了。我们下去,在那里变乱他们的口音,使他们的言语彼此不通。于是耶和华使他们从那里分散在全地上;他们就停工,不造那城了。因为耶和华在那里变乱天下人的言语,使众人分散在全地上,所以那城名叫巴别(就是变乱的意思)[1]。”这只是圣经故事,但告诉我们语言的不同确实是人们交流的极大障碍,因此人们一直在寻找打破语言障碍的途径和办法。翻译则能克服语言障碍,使得不同语言人们之间能相互交流。谭载喜在他的《西方翻译简史》一书中提到我国的翻译史时说:孔子周游列国,在各地言语发音不尽相同,彼此交流甚少的当时,也不得不通过象寄之才(即翻译人员)以“达其意,通其欲”。随着互联网的日益发展,网络信息的激增,国际社会交流愈加频繁,机器翻译已成为克服交流时所产生的语言障碍的重要手段之一。

2.机器翻译的定义 计算机翻译通常叫机器翻译(Machine Translation或MT),即全自动高质量机器翻译(Fully Automatic High Quality Machine Translation,简称FAHQMT或MT),就是人类利用计算机进行自然语言间的相互翻译,利用软件实现从一种自然语言文本到另一种自然语言文本的翻译[2]。 3.机器翻译的历史与现状 在古希腊时代就有人提出利用机械装置来进行语言翻译的想法,其中之一是如何用机械手段来分析自然语言。17世纪,人们首次提出使用机械字典克服语言障碍的设想。1903年,古图拉特(Couturat)和洛(Leau)在《通用语言的历史》一书中指出,德国学者里格(W.Rieger)首次使用了“机器翻译”(Machine Translation)这个术语。1952年在美国麻省理工学院(MIT)召开了第一届国际机器翻译会议,标志着机器翻译正式迈出了第一步。1978年在中科院计算机所的一台64K容量的计算机上成功地进行了20个标题的机器翻译测试。1987年在日本箱根举行了第一届机器翻译峰会(MT Summit),并决定以后每两年轮流在亚、欧、美定期举行。20世纪90年代后,随着微机的普及,相继出现了多种翻译软件,例如金山公司的词霸系列,实达铭泰的东方快车系列,Trados 翻译软件等。到目前为止,由于计算机科学、语言学研究的发展,特别是计算机硬件技术的大幅度提高以及人工智能在自然语言处理上的应用,机器翻译已经取得了相当大的进步,不过,机器翻译的水平距理想的“全自动高质量(FAHQ)”的目标还有很远的距离[3]。4.机器翻译面临的问题 4.1影响机器翻译质量的核心是歧义的处理。在词汇的层面上,词汇的歧义主要是一词多义,如英语单词“note”可以指“笔记”、“短信”、“注释”、“纸币”等。以下是词汇歧义的例子: 原文:Thank-you notes are heart-warming. 机器译文:感谢笔记温暖人心。人工译文:感谢信温暖人心。 在结构层面上,常见的结构歧义有and(和)结构,如nice girls and boys, 它既可表示“好女孩和男孩”,也可表示“好女孩和好男孩”,这种歧义只有人工翻译才能消除,计算机无法识别此歧义,可见歧义的处理是影响机器翻译质量的关键。 4.2人类翻译目标集中于目标语言,如果有必要的话,译者会采用灵活的方式以使翻译传情达意,有的时候会使用意译的方法,这是机器翻译所无法达到的。 以文学翻译为例,文学翻译是“传达作者的全部意图,即作者对在读者思想感情上产生艺术作用的全部意图……”。即使对于专业翻译工作者来说,文学翻译也不是件容易的事,更何况是对于没有任何认知能力的机器。笔者曾让机器翻译了下面几句:以下是美国19世纪著名作家爱默森长篇散文Beauty中的原句。 原文:"But this beauty of Nature which is seen and felt as beauty, is the least part." —Beauty Ralph Waldo Emerson 机器译文:但是这哪个看见并且作为美丽感到的自然的美丽,是最小部分。 夏济安译文:可是凡是耳目所能辨认出来的美,只是自然之美的最低部分。 以下是美国著名作家马克.吐温早期创作的一则优秀短篇小说《竞选州长》中的原句。原文:"I hauled down my colors and surrendered." —Running For Governor Mark Twain 机器译文:我沿着我的颜色拖并且投降。 张有松译文:我偃旗息鼓,甘拜下风。 以上机器译文荒唐可笑。由于机器没有思维、推理、判断能力,缺乏人工译者的综合知识和长期积淀下来的文化知识等,无法对原文产生全面的了解,做的只是机械转码,无法突破思维障碍。要获得地道完整的译文,必须对机器译文进行人工

相关主题