搜档网
当前位置:搜档网 › 国内主要语料库总汇

国内主要语料库总汇

国内主要语料库总汇
国内主要语料库总汇

了解振动试验的目的和振动台技术参数

了解振动试验的目的和必要性 现今世界经济潮流,已从过去地域性的经济模式而走向全球性的经济贸易。无论是地域性市场或进军全球市场,高质量的表现是不容讳言的。而振动测试更是协助您产品跃入高质量行列中不可缺乏的利器。 产品达到用户手中,在此过程中将有不同状态之振动产生,造成产品不同程度的损坏。而对于产品有任何损坏都不是厂商及客户所愿意见到的,然而运送过程所发生的振动却是难以避免,若一味的提高包装成本,必将带来严重而不必要的浪费,反之脆弱的包装却造成产品的高成本,并丧失了产品形象及市场,这些都不是我们所愿见到的。 振动测试约在四、五十年前开始萌芽,理论建立时,并无助于人们相信它的重要性,直到二次大战时,许多的飞行器、舰艇、车辆及器材在使用后,意外的发现机件失零的比例相当高,经研究的结果发现,大都由于其结构无法承受其本身所产生的长时间共振,或搭载物品承受运送共振所引起之,组件松脱、崩裂,而致机件失零甚而造成巨大损失。当这项结果公布后,振动测试才受到各界重视,纷纷投入大笔经费、人力去研究。尔后,对于振动量测分析以至模拟分析的近代理论建立后,对振动测试的方法及逻辑亦不断改进。尤其现今货物的流通频繁,使振动测试更显重要。 然而振动测试的目的,是在于实验中作一连串可控制的振动模拟,测试产品在寿命周期中,是否能承受运送或振动环境因素的考验,也能确定产品设计及功能的要求标准。据统计的数据显示提升3%的设计水平,将增加20%的回收及减少18%的各项不必要支出。振动模拟依据不同的目的也有不同的方法如共振搜寻、共振驻留、循环扫描、随机振动及应力筛检等,而振动的效应计有:一、结构的强度。二、结合物的松脱。三、保护材料的磨损。四、零组件的破损。五、电子组件之接触不良。六、电路短路及断续不稳。七、各件之标准值偏移。 八、提早将不良件筛检出。九、找寻零件、结构、包装与运送过程间之共振关系,改良其共振因素。而振动测试的程序,须评估订定试验规格,夹具设计之真实性,测试过程中之功能检查及最后试件之评估、检讨和建议。 振动测试的要义在于确认产品的可靠度以及提前将不良品在出厂前筛检出,并评估其不良品的失效分析以期成为一个高水平、高信赖度的产品。 欢迎您与我们连络,我们提供给予您的不只是一部高质量的振动测试机,更是提升贵公司产品水平及形象的最佳利器,拥有它您的产品将无往不利。 一、产品用途: 振动试验机模拟产品在制造,组装运输及使用过程中所遭遇的各种环境,用以鉴定产品是否忍受环境振动的能力,适用于电子、机电、光电、汽机车、玩具……等各行各业的研究、开发、品管、制造。振动试验机能让我们提早知道产品或产品中的部件的耐振寿命,从而确定产品设计及功能的要求标准。 二、检测范围: 1、产品结构的强度。 2、结合物的松脱。 3、保护材料的磨损。 4、零部件的破损。 5、电子组件的接触不良。 6、电路短路及断续不稳。 7、各零件之标准值偏移。 8、提早将不良件筛检。 9、找寻零件、结构、包装与运送过程间之共振关系。

语料库与语料库建设

语料库和语料库建设 一、什么叫语料库 1、定义 语料库,通俗意义上指的是语言材料库。严格意义上的语料库(corpus)是指按照一定的 语言学原则,运用随机抽样方法,收集自然出现的连续的语言运用文本或话语片断而建成的具有一定容量的大型电子文本库。 目前,语言学家对于语料库的定义不尽相同,如辛克莱(Sinclair)认为语料库是“按照明确的语言学标准选择并排序的语言运用材料汇集,旨在用作语言的样本”。阿特金斯等(Atkins & Clear)认为语料库是“按照明确的设计标准,为某一具体目的而集成的大型文本库”。赫努(Renouf)认为语料库是“由大量收集的书面语或口头语构成,并通过计算机储存和处理,用于语言学研究的文本库”。我们看到,以上关于语料库的几种定义相同之处在于都谈到语料库是语言材料的汇集;不同之处在于前两个定义指出语料库的设计是有明确的设计标准的,赫努的定义明确指出语料库“通过计算机储存和处理”这一特点。 语料库不同于电子文档,语料库的建设有特定的研究目的和具体用途,因此在语料抽样范围和文类覆盖方面都力求取得平衡,在收集语料时需要考虑到每一文类、体裁、语域、主题类型等的抽样比例。而大型文档目标在于搜集任何可获得的语言材料或所限定的数种文类语料,其语言材料之间的关系较为松散。 语料库具有以下特征:1、语料库的设计与建设有系统的语言学理论指导,语料库的开发具有明确而又具体的目的;如,布朗语料库用于对20世纪60年代的美国英语的研究,LOB是与布朗语料库对齐的同时期的英国英语语料库,可用以对英国英语进行研究,也可与布朗语料库加以对比进行美国英语和英国英语的对比研究。2、语料库的语料是按照明确的语言学原则采用随机抽样的方法得到的语言运用的自然语料,不是随意的语言材料的堆积,更不是由某个个人杜撰出来的。语料库的容量和语料采用随机抽样方式都保证了语料具有代表性,由此保证基于语料库的语言研究的科学性、客观性。3、语料文本是连续的文本或话语片断,而不是孤立的句子或词汇,可以借以获得语法关系、用法、词语搭配以及语篇信息。4、语料库以当代先进的计算机技术为技术手段,语料库语料通过电子文本形式储存并且是通过计算机处理的,具有资源优势和处理速度优势。5、基于语料库的研究以量化研究为基石,以概率统计为手段,以数据驱动为基本理念。6、语料库既是一种研究方法,又代表着一种新的研究思维。 二、语料库产生的背景及发展历史 对真实语言材料的搜集与研究是语言学研究的优秀传统。尤其是在20世纪50年代中期, 在语言研究中占主导地位的是重语言材料的经验主义。这种学术氛围无疑促进了对语料的重视。1959年夸克(R.Quirk)等人着手进行的“英语用法调查”(Survey of English Usage)通过系统的调查建立了第一个现代英语语料库,在此基础上完成的《现代英语语法》( A Grammar of Contemporary English)和《英语语法大全》(A Comprehensive Grammar of the English Language)对现代英语进行了系统全面的描写,在英语语言学界产生了广泛的影响。但在当时这项浩大的工程是通过手工的方式完成的。

语料库术语中英对照

Aboutness 所言之事 Absolute frequency 绝对频数 Alignment (of parallel texts) (平行或对应)语料的对齐 Alphanumeric 字母数字类的 Annotate 标注(动词) Annotation 标注(名词) Annotation scheme 标注方案 ANSI/American National Standards Institute 美国国家标准学会 ASCII/American Standard Code for Information Exchange 美国信息交换标准码Associate (of keywords) (主题词的)联想词 AWL/Academic word list 学术词表 Balanced corpus 平衡语料库 Base list 底表、基础词表 Bigram 二元组、二元序列、二元结构 Bi-hapax 两次词 Bilingual corpus 双语语料库 CA/Contrastive Analysis 对比分析 Case-sensitive 大小写敏感、区分大小写 Chi-square (χ2) test 卡方检验 Chunk 词块 CIA/Contrastive Interlanguage Analysis 中介语对比分析 CLAWS/Constituent Likelihood Automatic Word-tagging System CLAWS词性赋码系统Clean text policy 干净文本原则 Cluster 词簇、词丛 Colligation 类联接、类连接、类联结 Collocate n./v. 搭配词;搭配 Collocability 搭配强度、搭配力 Collocation 搭配、词语搭配 Collocational strength 搭配强度 Collocational framework/frame 搭配框架 Comparable corpora 类比语料库、可比语料库 ConcGram 同现词列、框合结构 Concordance (line) 索引(行) Concordance plot (索引)词图 Concordancer 索引工具 Concordancing 索引生成、索引分析 Context 语境、上下文 Context word 语境词 Contingency table 连列表、联列表、列连表、列联表 Co-occurrence/Co-occurring 共现 Corpora 语料库(复数) Corpus Linguistics 语料库语言学 Corpus 语料库 Corpus-based 基于语料库的

哪里有可以免费使用的大型英语语料库资源-外语教学与研究出版社

语料库相关资源 David Lee语料库研究书签 Bookmarks for Corpus-based Linguists (David Lee) https://www.sodocs.net/doc/c110898252.html,.au/~dlee/CBLLinks.htm (https://www.sodocs.net/doc/c110898252.html,/corpora) 常用语料库资源链接汇集(语料天涯) https://www.sodocs.net/doc/c110898252.html,/corpus/ 互动平台 https://www.sodocs.net/doc/c110898252.html,/forum/ 入门读物 专著 梁茂成、李文中、许家金,2010,《语料库应用教程》。北京:外语教学与研究出版社。Hunston, Susan. 2002. Corpora in Applied Linguistics. Cambridge: Cambridge. University Press. (世界图书出版社引进) Kennedy, Graeme. 1998. An Introduction to Corpus Linguistics. London: Longman. (外研社引进) 期刊论文 中国期刊网 EBSCO英文期刊数据库 书店可以买到的语料库相关书籍 Aijmer, K. & B. Altenberg (Eds.). 2004. Advances in Corpus Linguistics. Papers from the 23rd International Conference on English Language Research on Computerized Corpora (ICAME 23). Amsterdam: Rodopi. (世界图书出版社引进) Austermühl, F. 2001. Electronic Tools for Translators《译者的电子工具》. Manchester: St. Jerome Publishing. (外研社引进) Biber, Douglas, Stig Johansson, Geoffrey Leech, Susan Conrad & Edward Finegan. 1999. Longman Grammar of Spoken and Written English. Longman Publications Group. (外研社引进) Biber, Douglas, Susan Conrad & Randi Reppen. 1998. Corpus Linguistics. Cambridge: Cambridge University Press. (外研社引进) Connor, U & T. Upton (Eds.). 2004. Applied Corpus Linguistics: A Multidimensional Perspective. Amsterdam: Rodopi. (世界图书出版社引进)

国内外振动台与振动试验的研究现状

1.国内外振动台与振动试验的研究现状 1.1国内外振动台研究现状 一、各类振动台的优缺点 用于振动试验的振动台系统从其激振方式上可分为三类:机械式振动台、电液式振动台和电动式振动台。从振动台的激振方向,即工作台面的运动轨迹来分,可分为单向(单自由度)和多向(多自由度)振动台系统。从振动台的功能来分,可分为单一的正弦振动试验台和可以完成正弦、随机、正弦加随机等振动试验和冲击试验的振动台系统。 1.机械式振动台 机械式振动台可分为不平衡重块式和凸轮式两类。不平衡重块式是以不平衡重块旋转时产生的离心力来激振振动台台面,激振力与不平衡力矩和转速的平方成正比。这种振动台可以产生正弦振动,其结构简单,成本低、但只能在约50Hz~100Hz的频率范围工作,最大位移为6mm峰一峰值,最大加速度约10g,不能进行随机振动。 凸轮式振动台运动部分的位移取决于凸轮的偏心量和曲轴的臂长,激振力随运动部分的质量而变化。这种振动台在低领域内,激振力大时,可以实现很大的位移(如100mm)。但这种振动台工作频率仅限于低频,上限额率为20Hz左右。最大加速度为3g左右,加速度波形失真很大。 对于所应用的机械式振动试验台具有几个共同的优点:结构简单、容易安装、造价较低、运用及维修简单可以、可以进行较长时间的试验。但也有共同的缺点:试验范围小、波形失真度大、不能采用反馈控制、很难实现随机振动及几个机械式振动台同步运行。 2.电液式振动台 电液式振动台的工作方式是用小的电动振动台驱动可控制的伺服阀,通过油压使传动装置产生振动。在实际应用中主要有力马达滑阀式电液振动台和喷嘴一挡板式电液振动台。这类振动台的主要优点是:能产生很大的激振力和位移(如激振力可以达104N,位移可达2.5m)、工作频率下限可以达到零赫兹、可以采用反馈控制、能实现随机振动及几个电液振动台进行同步运行。同时电液振动台的缺点是:难于在高频区工作,适用于在低频区及中频区进行振动试验。液压系统的性能容易受温度的影响,对油液要求高、造价贵、维修复杂。由于油泵的压力脉动,油液压缩性引起的共振、液压密封件的摩擦等,使得波形失真比电动振动台大。 这种振动台因其大推力、大位移可以弥补电动振动台的不足,在未来的振动试验中仍将发挥作用,尤其是在船舶和汽车行业会有一定市场。 3.电动式振动台 电动式振动台是根据电磁感应原理设计的,当通电导体处在恒定磁场中将受到力的作用,当导体中通以交变电流时将产生振动。振动台的驱动线圈正式处在一个高磁感应强度的空隙中,当需要的振动信号从信号发生器或振动控制仪产生并经功率放大器放大后通到驱动线圈上,这时振动台就会产生需要的振动波形。 电动式振动台是振动环境试验中广泛使用的一种振动设备,与其它振动设备相比,它主要的优点具有:工作频率范围宽、波形失真度小、频率稳定、控制方便、可以采用反馈控制。特别是它的高频特性,一般能工作到3kHz。对于几公斤推力的电动式振动台工作频率上限甚至可以扩展到10kHz以上,所以被广泛应用于航空、航天、护电器、仪器仪表、建筑、水利、交通运输和家电等各个领域。电动振动台的缺点是单台的激振力及振幅不够大,台面有漏磁场的影响,价格贵,维修复杂。 二、国内外振动台发展状况 1.国内振动台的研究现状 中国航天第702所拥有完整的振动环境试验手段和丰富的振动环境经验,按照GB2423、GBJ150、MIL-STD-810等各项标准进行产品的振动环境试验,建立了推力从7.5kN、10kN、

关于汉语中介语语料库建设研究报告

汉语中介语语料库建设研究 沈锐1,黄薇2 (1.红河学院教育技术系2.红河学院国际合作与交流处XX蒙自661100) 【摘要】本文探讨母语非汉语学习者的汉语中介语语料库建设的主要思路以及具体实现方法,重点介绍了汉语中介语语料的加工方法以及语料数据库的设计思路,并阐明了该语料库在对外汉语教学和研究中的应用价值。 【关键词】语料库;中介语;汉语教学 语料库是指按一定的语言学原则收集的语言文本或话语片断而建立的电子资料库。本文所述汉语中介语料库是基于语言学中中介语理论设计与实施的。中介语是心理语言学中第二语言习得的一种研究模式,其将语言学习者置于观察中心,去研究他们如何有意识地向目的语的正确形式迁移的各种动态表现。中介语理论自20世纪60年代末出现并发展至今,虽然时间并不长,但越来越受到语言学家以及一线教师的关注。无论是进行中介语研究还是使用中介语理论进行第二语言教学都需要收集分析大量的语料,因而通过信息化手段收集和整理语料变得十分迫切。在对外汉语教学中,通过建设和使用母语非汉语学习者的汉语中介语语料数据库,可以收集不同背景和不同学习阶段外国学生及少数民族学生的汉语书面语和用文字转写的口语语料,并对语料属性、词汇、语法等单位进行计算机处理,以实现对各种条件和要求下的语料数据进行便捷的机器检索和提取,可以为研究母语非汉语学生学习和习得汉语的规律提供大量的各种单项的或综合的资料和信息。因此,我们提出了建设汉语中介语语料库的课题,由于语料库建设是一项浩大的工程,限于人力物力条件,本文讨论的是中

小规模的语料库。 一、需求分析和框架设计 语料库建设不能盲目进行,首先要进行调研,对语料库的应用需求进行分析。半自动化的语料库构建是目前语料库建设的主流技术,目的是在确保语料库质量的前提下,减少人工参与的比例,增加自动化程度,目标是在较短时间内建设一个有一定规模,质量可靠、可扩充、成本低,能够全面、细致地记录母语非汉语学习者在汉语学习过程中的语言表征和研究他们汉语习得过程的语料库。依照软件工程的方法,建立数据库首先需要进行需求分析,在需求分析过程中要注意汉语中介语语料库主要是服务于对外汉语教学的一线教师,以及辅助母语非汉语学生自学,因此主要注重以上二类服务对象的应用需求,确保建成的语料库能够对第二语言教学、研究以及教材的编写提供持续支持。基于以上要求,在对中介语语料库的建设思路及框架做了总体考虑,基本归纳为以下三个方面: 1、中介语语料库为专门用途语料库,主要目的为研究母语非汉语的学生在学习汉语过程中的中介语现象而设计制作的。 2、中介语现象存在于母语非汉语的学生在学习汉语过程中的书面语料及口语语料中,由于口语语料的收集、分析和标注都较为困难,因此在建库的第一阶段只考虑收录书面语料,这有利于语料库的快速建设与使用。 3、语料标注的加工标准使用中科院计算所汉语词性标记集V3.0。 二、语料收集与加工

旅游汉英双语平行语料库的建设与应用

第33卷第10期湖南科技学院学报 V ol.33 No.10 2012年10月 Journal of Hunan University of Science and Engineering Oct.2012 旅游汉英双语平行语料库的建设与应用 肖庚生 陈欣 (南华大学 外国语学院,湖南 衡阳 421001) 摘 要:文章在综述现有旅游语料库的基础上,介绍了自建的衡阳旅游汉英平行语料库的建库步骤,即语料的取样、英译、标注与对齐,并阐述了该库在旅游文本语言特征、旅游翻译、旅游英语及旅游翻译教学研究中的应用价值。该库的建设与应用既能充分满足研究需要,亦能促进导游、翻译等英语人才的培养,进而推动当地旅游产业的发展及跨文化传播。 关键词:旅游语料库;双语平行语料库;旅游英语 中图分类号:H030文献标识码:A 文章编号:1673-2219(2012)10-0163-03 近30年来,语料库及语料库语言学从无到有、蓬勃发展。基于语料库的语言学及应用语言学研究应运而生,语料库这一研究工具与方法业已广泛应用于词汇、句法、语义、语言对比、词典编撰、二语习得、翻译等领域的研究之中, 并取得了累累硕果。[1]为了研究或应用的需要,国内外先后创建了跨学科、多语言、内容迥异、库容不一的众多语料库。近年来,双语平行语料库由于其独特的优势备受关注,其建设与应用正如火如荼地进行。不过,迄今为止,国内外高校与研究机构所研制的平行语料库主要是通用型的双语平行语料库以及文学翻译类型的平行语料库,以某一专门用途为导向的平行语料库仍较为鲜见。此外,基于平行语料库的相关研究主要侧重于对个别语言或翻译现象的探讨。鉴于这一研究现状,我们拟以课题研究为契机,建设衡阳旅游汉英双语平行语料库,在此基础上,力图摸索其在汉语与英语的旅游文本语言特征、旅游汉英翻译、旅游英语与旅游翻译教学研究中的应用。 一双语语料库与旅游语料库综述 双语语料库最早创建于上世纪90年代中后期,迄今为 收稿日期:2012-08-26 基金项目:衡阳市社科基金项目“顺应论视阈下衡阳旅游汉英双语平行语料库的建设与应用研究”(项目编号2011C011);全国教育科学规划课题“基于语料库的大学英语教学平台建设与研究”(项目编号GPA105029)阶段性成果。 作者简介:肖庚生(1980-),男,湖南衡阳人,讲师,应用语言学博士生,主要研究方向为语料库语言学。陈欣(1983-),女,湖南郴州人,讲师,语言学硕士,主要研究方向为翻译理论与实践。止国内外业已建立多种类型的双语平行语料库。早在1995年,曼彻斯特大学研制了世界上首个翻译语料库,主要收集从各国语言翻译成为英文的文本,如今库容已达千万词。但是它并非严格意义上的双语平行语料库,因为它并没有实现双语对齐,只能称其为对比语料库。目前国际上比较知名的平行语料库有挪威的“英语-挪威语平行语料库”、英国的“德语-英语文学文本平行语料库”等等。而由北京外国语大学中国外语教育研究中心于2004年启动创建的“新型双语对应语料库”(含汉英、汉日两个双语平行语料库),库容为3000万词次。其中,汉英双语平行语料库的文本类型主要涵盖人文类、社科类和科技类。该语料库的建设得到了国家社科基金重大规划课题的资助,目前正为1亿词次的超大库容做进一步的扩容努力。此外,国内比较知名的双语平行语料库还包括:李德俊以汉英词典研编为主要目的,主持建设2000万词次的英汉平行语料库;卫乃兴以研究探讨英汉对等表达为目的,主持建设900万词次的英汉平行语料库;哈尔滨工业大学所创建的库容为40万对的英汉双语平行语料库;绍兴文理学院创建的中国古典文学英译双语平行语料库等等。上述双语平行语料库多数以文学文本为主,抑或以收集百科文本(含文学与非文学作品)为特色,而针对某一特定文类或某一地域特色而专门建构的专门用途双语平行语料库仍较为鲜见。 近年来,随着交通与通讯技术的日新月异,世界各地人们之间的科技、文化、商务交流、合作与往来日益频繁。更为重要的是,各国人们纷纷走出国门,畅游世界,体验世界各地的异域风情,许多国家的旅游产业获得了飞速发展。为更好地发展旅游产业、传播旅游资讯、吸引外国游客,同时亦为了满足语言学及应用语言学研究需要,旅游专门语料库应运而生。 163

浅谈语料库语言学在的应用以及在中国的发展趋势

浅谈语料库语言学在的应用以及在中国 的发展趋势 一、语料库语言学的兴起与发展 语料库语言学是基于大量真实的语言资料,从调查语言信息的分布频率入手来研究语言在现实使用中的规律和模式。自20世纪中后期,电脑被大量使用在语料的存储上,兴起了专门针对大规模储存于计算机里的语料库所进行的研究,自此语料库语言学进入了现代语料库语言学时期。由于电脑语料库容量大、语料真实、检索快捷,它在现代语言学研究和语言教育中正发挥着越来越重要的作用。 在我国,从20世纪20年代开始,有学者为制定基础汉字字表开始建立文本语料库;70年代末以来,汉语现代文学作品语料库(1979年)、现代汉语语料库(1983年)等机器可读语料库开始建设。90年代后,以《人民日报》光盘数据库、北大语料库为代表的大型汉语语料库日益发展,语料库成为研究中文信息处理的基本语言资源。在英语语料库建设方面,杨惠中教授80年代主持建成的上海交通大学科技英语语料库(JDEST),是当时世界上第一个同类语料库,也是国内最大最完备的英语语料库之一。1996年广州外国语学院开始建立中国学生交际英语语料库。此外由广东外语外贸大学桂诗春教授和上海交通大学杨惠中教授牵头开发的“中国学习者语料库”(CLEC)于1999年建成,该语料库广泛收集了包括我国中学生、大学生在内的一百多万词的各种书面语资料,并对所有的语料进行语法标注和言语失误标注,对研究中国学习者的英语特点具有开创性意义。

二、语料库语言学发展趋势 语料库语言学研究的发展总是以语料库的建设为基础的。没有语料库的建设,语料库语言学所进行的研究只能是纸上谈兵。近十多年来,国内语料库的建设取得了一定的成就,主要建设的语料库有英语学习者语料库、平行语料库、特殊英语语料库、汉语语料库四种类型。 (一)英语学习者语料库。其中包括书面语和口语。有广东外语外贸大学和上海交通大学合作建设的中国学习者英语语料库CLEC,100万词次;上海交通大学建设的大学英语学习者口语语料库COLSEC,5万词次;香港科技大学建设的香港科技大学学习者语料库HKUST Learner Corpus;南京大学建设的中国英语专业语料库CEMC,148万词次;南京大学建设的中国英语学习者口语语料库SECCL,100万词次;华中科技大学建设的硕士 写作语料库MWC,12万词次。 (二)平行语料库。有北京外国语大学建设的汉英平行语料库PCCE;南京大学建设的南大———国关平行语料库;外语 教学与研究出版社建设的英汉文学作品语料库,冯友兰《中国哲学史》汉英对照语料库,李约瑟(Joself Needham)《中国科学技术史》英汉对照语料库;北京大学计算语言学研究所建设的双语语料库,5万多对;香港城市理工大学建设的对比语料库LIVAC;台湾建设的平衡语料库Sinica Corpus和树图语料库Sinica Treebank;国家语言文字工作委员会应用研究所建设的计算机专业的双语语料库,柏拉图(Plato)哲学名著《理想国》的双语语料库;中国科学院软件研究所建设的英汉双语语料库,15万对;中国科学院自动化研究所建设的英汉双语语料库,包含LDC香港新闻硬汉双语对齐语料36 294段以及香港法律英汉双语对齐

《英语语言学》术语(英汉对照)表

语言学术语(英-汉对照)表 Glossary and Index (备注:因教材改版,部分章节标注等内容有出入。) A abbreviation 缩写词,略语3.3.1 Abercrombie 10.3.2 ablative 夺格,离格4.1.1 abstractness 抽象性1.3.2 accent 重音(符)2.4.4;2.4.5 accuracy 正确性11.6.4 accusative 宾格4.1.1 achievement test 成绩测试11.6.3 acoustic phonetics 声学语音学1.7.1;2.1 acquisition 习得6.1.2 acronym 缩略语3.3.1 action process 动作过程12.2.3 actor 动作者4.4.2;12.2.3 addition 添加3.3.2 address form 称呼形式7.2.3 addressee 受话人1.4;9.4.1 addresser 发话人1.4;9.4.1 adjective 形容词3.1.2;4.1.1;5.5.2 adjunct 修饰成分;附加语12.2.3 adverb 副词3.1.2 affix 词缀3.2.1 affix hopping 词缀跳跃4.3.1 affixation词缀附加法7.1.4 affricate 塞擦音2.4.3;2.4.5;2.9.1 agreement 一致关系4.1.3 airstream 气流2 alliteration 头韵9.3.2;9.3.6 allomorph 词/语素变体3.2.4;4.3.1 allophone 音位变体2.8 allophonic variation 音位变体2.8.3

最常用的英语动词(根据美国语料库整理 word 可打印)

be turn walk wear lie have start win support occur do might offer end accept say show remember hit identify go hear love base determine can play consider produce prepare get run appear eat argue would move buy teach recognize make like wait face indicate know live serve cover wonder will believe die describe lay think hold send catch fail take bring expect draw arrive see happen build choose name come must stay cause present could write fall point answer want provide cut listen compare look sit reach realize miss use stand kill place act find lose remain close state give pay suggest involve discuss tell meet raise increase force work include pass seek check may continue sell deal laugh should set require fight guess call learn report throw study try change decide fill prove ask lead pull represent hang need understand return focus design feel watch explain drop forget become follow hope plan claim leave stop develop push remove put create carry reduce sound mean speak drive note enjoy keep read break enter form let allow thank share establish begin add receive rise visit seem spend join shoot care help grow agree save avoid talk open pick protect imagine

中国英汉平行语料库的设计与研制

中国英汉平行语料库的设计与研制 王克非北京外国语大学中国外语教育研究中心提要:本文论述超大型双语平行语料库的设计与研制问题。在综合述介国内外双语语料库建设情况之后,作者着重论述了中国英汉平行语料库这一超大型双语平行语料库的设计特点(主要有分类架构、历时处理、语料平衡以及通用的和各种专门语料的采集)和研制方法(主要讲述语料的加工标注、检索平台以及各个专门语料库、历时语料库和口译语料库的构建)。其设计与研制对于其他大型语料库的建设具有借鉴意义。 关键词:中国英汉平行语料库;设计;研制 Abstract:The paper deals with the design and construction of asuper-large-scale bilingual parallel corpus.After an overview of parallelcorpora constructions and applications both in China and abroad, the designfeatures(including classification and composition,diachronical arrangement,balance of textual materials,and collection of texts for general or specificpurposes)and the construction methods (including tagging,concordanceplatform,and the construction of specialized corpora,diachronical corpora andinterpreting corpora)of the super-large-scale China English-Chinese ParallelCorpus(CECPC)are focused on.The design and construction discussed areapplicable to the compiling of other large-scale corpora. Keywords:China English-Chinese Parallel Corpus (CECPC);design;construction 1、中国英汉平行语料库的研制意义 在全球化、信息化的当今世界,翻译已成为了解全球信息、扩大对外宣传、获取国际资源的重要手段。同计算机技术结合而兴起的双语平行语料库建设,则为语言研究、翻译研究、外语教学、词典编纂和跨语言信息检索等提供了最好的平台,同时还可用来考察和验证基于单语语料库或者基于直觉提出的假设,具有广阔的应用前景。

振动台试验方案设计实例

一、振动台试验方案 1试验方案 1.1工程概况 本工程塔楼结构体系为“三维巨型空间框架-钢筋混凝土核心筒”结构体系,主要由4个核心筒、钢骨混凝土(SRC)外框架、3个避难层联系桁架三部分构成,图1-2、图1-3分别是B塔结构体系构成示意图和建筑效果图。特别指出的是本工程在14、24楼层的联系桁架的腹杆以及32、48楼层的斜撑为防屈曲支撑(UBB)构件。设计指标为小震不屈服,大震屈服耗能。具体位置示意见图1-4。 本工程的自振周期约为 6.44秒,超过了《建筑抗震设计规范》(GB-50011-2001)设计反应谱长为6秒的规定。本工程存在5个一般不规则和2个特别不规则类型,5个一般不规则类型分别是扭转不规则、凹凸不规则、刚度突变、构件间断和承载力突变。2个特别不规则是高位转换和复杂连接。 1.2 模拟方案 1、模拟方案选择 动力试验用的结构模型必须根据相似律进行设计,模型动力相似律的建立以结构运动方程为基础,选择若干主要控制参数作为模拟控制的对象,依据Buckingham的π定理,经无量纲分析导出控制参数的无量纲积,据此确定各控制参数的相似比率。 结构动力试验的相似模型大致分为四种: (1)弹塑性模型理论上可以重现结构反应的时间过程,使模型和原型的应力分布一致,并可模拟结构的破坏。由于要严格考虑重力加速度对应力反应的影响,必须满足S a=S g=1(S a=模型加速度/原型加速度,S g为重力加速度相似系数,各相似系数之间的关系见表1),即模型加速度反应与原型加速度反应一致,这一要求大大限制模型材料的选择。因为在缩尺模型中,几何比(S l)很小,在Sa=Sg=1的条件下,要满足Sa=S E/S l Sρ=1,即S l=S E/Sρ,必须使模型材料的弹模

语料库与语料库建设

语料库与语料库建设 语料库和语料库建设 一、什么叫语料库 1、定义 语料库,通俗意义上指的是语言材料库。严格意义上的语料库(corpus)是 指按照一定的 语言学原则,运用随机抽样方法,收集自然出现的连续的语言运用文本或话语片断而建成的具有一定容量的大型电子文本库。 口前,语言学家对于语料库的定义不尽相同,如辛克莱(Sinclair)认为语料库是“按照明确的语言学标准选择并排序的语言运用材料汇集,旨在用作语言的样本”。阿特金斯等(Atkins & Clear)认为语料库是“按照明确的设计标准,为某一具体目的而集成的大型文本库”。赫努(Renouf)认为语料库是“由大量收集的书面语或口头语构成,并通过计算机储存和处理,用于语言学研究的文本库”。我们看到,以上关于语料库的儿种定义相同之处在于都谈到语料库是语言材料的汇集;不同之处在于前两个定义指出语料库的设讣是有明确的设计标准的,赫努的定义明确指出语料库“通过计算机储存和处理”这一特点。语料库不同于电子文档,语料库的建设有特定的研究LI 的和具体用途,因此在语料抽样范围和文类覆盖方面都力求取得平衡,在收集语料时需要考虑到每一文类、体裁、语域、主题类型等的抽样比例。而大型文档U标在于搜集任何可获得的语言材料或所限定的数种文类语料,其语言材料之间的关系较为松散。 语料库具有以下特征:1、语料库的设讣与建设有系统的语言学理论指导,语料库的开发具有明确而乂具体的U的;如,布朗语料库用于对20世纪60年代的美国英语的研究,LOB是与布朗语料库对齐的同时期的英国英语语料库,可用以对英国英语进行

研究,也可与布朗语料库加以对比进行美国英语和英国英语的对比研究。 2、语料库的语料是按照明确的语言学原则采用随机抽样的方法得到的语言运用的自然语料,不是随意的语言材料的堆积,更不是由某个个人杜撰出来的。语料库的容量和语料采用随机抽样方式都保证了语料具有代表性,山此保证基于语料库的语言研究的科学性、客观性。 3、语料文本是连续的文本或话语片断,而不是孤立的句子或词汇,可以借以获得语法关系、用法、词语搭配以及语篇信息。 4、语料库以当代先进的计算机技术为技术手段,语料库语料通过电子文本形式储存并且是通过讣算机处理的,具有资源优势和处理速度优势。5>基于语料库的研究以量化研究为基石,以概率统汁为手段,以数据驱动为基本理念。6、语料库既是一种研究方法,乂代表着一种新的研究思维。 二、语料库产生的背景及发展历史 对真实语言材料的搜集与研究是语言学研究的优秀传统。尤其是在20世纪 50年代中期, 在语言研究中占主导地位的是重语言材料的经验主义。这种学术氛圉无疑促进了对语料的重视。1939年夸克(R. Quirk)等人着手进行的“英语用法调查” (Survey of English Usage)通过系统的调查建立了笫一个现代英语语料库,在此基础上完成的《现代英语语法》(A Grammar of Contemporary English )和《英语语法大全》(A Comprehensive Grammar of the English Language)对现代英语进行了系统全面的描写,在英语语言学界产生了广泛的影响。但在当时这项浩大的工程是通过手工的方式完成的。 20世纪六十年代后,语言学研究主流从经验主义转向理性主义,乔姆斯基的语言能力说被广泛接受,转换生成语法学派批评语料库研究方法,认为,1、基于语料库的方法有误。乔姆斯基等认为语言学应当以人脑的语言机制即语言能力为研究对象,语料库收集的只是人们的语言运用,语言运用会因超语言因素的影响而发生变化,它并

一对四_英汉双语对应语料库的建设及应用_任小华

2013年9月第3期外语艺术教育研究 Educational Research on Foreign Languages &Arts Sep.2013No.3 收稿日期:2013-04-10 基金项目:2012年洛阳市社会科学规划项目“英汉双语对应语料库的建设及应用”(2012B233)。 作者简介:任小华(1978-),男,陕西汉中人,洛阳师范学院公共外语教研部讲师、硕士,主要研究方向为应用语言学、语料库语言学、对比语言学。 “一对四”英汉双语对应语料库的建设及应用 任小华 (洛阳师范学院 公共外语教研部,河南 洛阳471022) 摘要:双语对应语料库对对比语言学和翻译研究的重要性不言而喻,国内外大多双语对应语语料库不 对外公开或提供的检索数据很有限,而已建成或在建的“一对多”双语对应语料库并不多见。以美国总统就职演说词及四个汉语译文为语料开发的“一对四”型的英汉双语对应语料库,库容为76万词/字。其对整理后的语料进行分词、词性标注,也对未分词标注的语料进行了句子对齐,并实现了“一对四”双语语料的检索。 关键词:双语语料库;美国总统就职演说词;分词;标注;对齐;检索 中图分类号:H 319 文献标识码:A 文章编号:粤内登字O -10339(2013)03-0020-07 一、引言 由于现代计算机和网络技术的有力支持,语料库语言学得到了飞速的发展,现已成为语言学的一个重要分支。随着语料库语言学的发展,语料库的研制类型也呈现多样化,双语甚至多语的平行对应语料库成为语料库语言学的一个亮点。平行语料库开发具有较高的理论及应用价值。Ai-jmer 和Altenberg 指出,平行语料库对翻译和语言对比研究特别有用,并扩展了研究问题的范围。 [10]12 它有助于通过对比深入了解所对比的语 言,而这往往在研究单语种语料库时被忽略,通过比较,它能揭示语言的共性以及某语种所特有的、语言类型与文化上的差异,还可以揭示原文与译文、母语与非母语之间的差异等。 双语对应语料库最初侧重于英语与其亲属语言之间,上世纪90年代中期才逐渐扩展到英语与欧洲之外的一些语言之间,现在已几乎覆盖世界上所有主要的语言之间。在国外,挪威、荷兰、英国、美国、加拿大等国家都建立了涉及不同语种、不同规模的平行语料库。 [1]18-19 比较著名 的平行语料库有:Hansard 对应语料库 [11]169-176 ,英语-挪威语双语对应语料库(ENPC ) [12]87-112 ,ITU 英语-法语-西班牙语三语对应语料库 [13]219-226 ,英语-法语-丹麦语-芬兰语-希 腊语-拉丁语-瑞典语-西班牙语-越南语等九种语言的Bible 对应语料库 [14]129-153 。 近年来港台学者和海外华人学者也建立了一些双语对应语料库,主要是和汉语对应的平行语料库,如吴德凯等人在香港科技大学建立的HKUST 中英对应语料库[15]80-87,台湾的中英对应 语料库(Sinica Corpus ) [1]18 ,Bermingham 中英对应语料库[1]18 ,英国兰卡斯特大学的中英对应语 料库 [1]19 ,以及巴比伦英汉平行语料库[1]19,等 等。大陆学者也建了一些英汉平行语料库,包括:北京大学计算语言学研究所的新闻机助类平行语料库Babel ,北京外国语大学中国外语教育研究中心的通用汉英平行语料库(PCCE ),南京国际关系学院的英汉平行语料库(PECC ),上海交通大学外国语学院的英汉平行语料库、莎士比亚戏剧英汉平行语料库和汉英会议口译平行语料库,绍兴文理学院的毛泽东选集汉英平行语料库、鲁迅小说汉英平行语料库、邓小平文选汉英平行语料库和中国法律法规汉英平行语料库,燕

英汉双语平行语料库人工对齐方法说明

英汉双语平行语料库人工对齐方法说明 1.概述 半自动英汉双语平行语料库的对齐分为两个过程: 第一个过程是先将两种语言的文本分成句子,每个句子占一行。句子定义为:以句号、问号、感叹号、分号结尾的一串字符,或以句号+引号、问号+引号、感叹号+引号等结尾的一串字符。“行”的概念是一串以回车换行符结尾的字符。这个过程可以采用任何一种具有“查找”和“替换”功能的文字处理软件来完成,也可以编程由计算机自动完成。 第二个过程是在第一个过程产生的结果的基础上以手工方式将两种语言的文本在句子水平上对齐。这一过程要采用UltraEdit软件来辅助完成。 在句子水平上对齐两种语言的文本,除了要注意以上对“句子”和“行”的定义以外,还应遵循一个重要的原则,即:如果两种语言的文本在句子的切分上有差异,应尽量保持原文句子不动,调整译文以适应原文。 为了能从双语平行语料库中获取更多的信息,还需要在对齐过程中插入少量的标记,例如:分译标记、合译标记、混译标记和移动标记等。此外,为了便于以后的检索,对于过长的句子还要在适当的地方将长句截短成两个或更多的小句。 2.人工对齐的方法 2.1打开文件 先用UltraEdit软件将两个已经分为句子的文本文件打开,在该软件的工具栏的“窗口”下拉菜单中点“水平平铺”选项,使两个打开的文本同时显示在屏幕上。为了操作方便,一般把原文放在上半屏,把译文放在下半屏。(见图1) 2.2 上下移动文本 为了能够对齐两种语言的文本,在操作过程中需要不断地上下移动文本。移动文本可以用鼠标移动窗口右边的滑块来完成。也可以将光标放在某一行,然后用鼠标的中间滚轮来上下移动。 2.3 同步移动上下两个窗口中的文本 在“窗口”下拉菜单中选“同步”选项,就可以同步移动上下两个窗口中文本,极大地方便人工对齐的操作。

相关主题