搜档网
当前位置:搜档网 › 火云术语术语库使用方法

火云术语术语库使用方法

火云术语术语库使用方法
火云术语术语库使用方法

专业词汇术语库使用说明

火云术语是免费的术语类翻译辅助工具,可用作专业词汇查词、术语表管理、术语批注和术语检查。同时由于该软件为云端产品,有大量云端术语库可自由收藏及使用。

使用方法:

专业查词

在云端术语库收藏你所需要的专业词汇术语库(可根据行业关键词搜索),或上传你自己的术语表文件到该工具,即可在查词结果中看到相应术语库中的专业词汇翻译结果。

效果展示:

术语批注/术语检查

火云术语支持术语批注,即根据术语库自动批注Word文档中的术语翻译,省去了术语翻译查找的麻烦和术语翻译不统一的问题,提高翻译准确度和效率。

效果展示:

对于已经翻译好的文件,火云术语还能做译后检查,自动审校术语翻译。

云端术语库

火云术语的云端术语库完全基于用户的自主分享,现已聚集300多个行业领域的20,000,000条术语,为目前国内最大最全的多语术语库。

语料库术语中英对照

Aboutness 所言之事 Absolute frequency 绝对频数 Alignment (of parallel texts) (平行或对应)语料的对齐 Alphanumeric 字母数字类的 Annotate 标注(动词) Annotation 标注(名词) Annotation scheme 标注方案 ANSI/American National Standards Institute 美国国家标准学会 ASCII/American Standard Code for Information Exchange 美国信息交换标准码Associate (of keywords) (主题词的)联想词 AWL/Academic word list 学术词表 Balanced corpus 平衡语料库 Base list 底表、基础词表 Bigram 二元组、二元序列、二元结构 Bi-hapax 两次词 Bilingual corpus 双语语料库 CA/Contrastive Analysis 对比分析 Case-sensitive 大小写敏感、区分大小写 Chi-square (χ2) test 卡方检验 Chunk 词块 CIA/Contrastive Interlanguage Analysis 中介语对比分析 CLAWS/Constituent Likelihood Automatic Word-tagging System CLAWS词性赋码系统Clean text policy 干净文本原则 Cluster 词簇、词丛 Colligation 类联接、类连接、类联结 Collocate n./v. 搭配词;搭配 Collocability 搭配强度、搭配力 Collocation 搭配、词语搭配 Collocational strength 搭配强度 Collocational framework/frame 搭配框架 Comparable corpora 类比语料库、可比语料库 ConcGram 同现词列、框合结构 Concordance (line) 索引(行) Concordance plot (索引)词图 Concordancer 索引工具 Concordancing 索引生成、索引分析 Context 语境、上下文 Context word 语境词 Contingency table 连列表、联列表、列连表、列联表 Co-occurrence/Co-occurring 共现 Corpora 语料库(复数) Corpus Linguistics 语料库语言学 Corpus 语料库 Corpus-based 基于语料库的

SMT常用术语解读

SMT常用术语解读(之六) 长江三角洲SMT专家协作组曾胜之 131.电烙铁/Iron 一种通过接触传导方式,同时加热锡料与被焊件(如焊盘、元器件引脚/焊端、导线等),使之达到焊接所需温度的工具。 同义词:焊笔。 *电烙铁是电子产品手I焊接/拆焊的主要工具。它常被用来完成各种线路实验、试制样品、返工/返修以及小批量生产。电烙铁若按其烙铁头加热方式,可分为直热式(如感应式、电阻式等)与间热式(如外热式与内热式);若按其是否能控温,可分为温控烙铁(如调压/传感器/居里点控温等)与非控温烙铁。 132.热风嘴/Hot Air Reflowig Noozle 一种通过吹热风同时加热锡料与被焊件(如焊盘、元器件引脚/焊端)使之达到焊接所需温度的装置。 同义词:热风枪、热风拆焊台。 *热风嘴在SMT手工焊接中主要用于焊/拆QFP、BGA、CSP等器件。

133.吸铡器/Tin Extractor 能吸除通孔内或焊盘、焊端上的多余熔融焊料的一种解焊工具。它通常由吸锡咀、能产生负压吸力的装置以及手持操作部分所组成。 同义词:除锡枪/Controlled Desoldering Gun。 *常见有手动吸锡器与带有负压泵电动除锡枪两种前者与电烙铁配合使用,后者本身带有加热烙铁头。 134.吸锡带/Soldering Wick 一种利用毛细管作用能吸取熔融焊料的金属丝编织带。 同义词:吸锡绳、吸锡线。 135.焊后检验/Post-Soldering lnspection 指对已焊接完毕的印制板组件或产品进行检查与测试。 *是装焊检验质量体系中最重要检查关卡,应给予特别的关注。有目视检验与机视检验两种。 136.目视检验/Visual Inspection 通过人的眼睛或借助于放大镜、显微镜等的观察,对组装件质量进行检查的方法。 同义词:人工检验、目检。

词语搭配抽取的统计方法及计算机实现

词语搭配抽取的统计方法及计算机实现 邓耀臣王同顺 (上海交通大学外国语学院,上海200240 ) 摘要:计算机语料库的发展为词语搭配研究提供了新的方法。然而,也同样受到资源共享困难和语料分析工具不足的困惑。本文在简要介绍词语搭配抽取中常用的三种统计方法的基础上,重点提出一种将免费检索软件Wconcord和语言研究者较为熟悉的Visual Foxpro (VFP)编程技术相结合,计算词语搭配统计量,实现词语搭配自动抽取的方法并对这种方法的可行性和结果的可靠性进行了评估。 关键词:词语搭配;统计方法;计算机实现 Statistics in Collocation Extraction and Computer Implementation DENG Yaochen, WANG Tongshun (College of Foreign Studies, Shanghai Jiao Tong University, Shanghai 200240, China) Abstract: The development of computer corpora provides a new approach for collocation study. However, the corpus-based collocation study is restricted by difficulties in resource share and inefficiency of current analysis tools. This paper, on the basis of the introduction to three commonly-used statistics in collocation extraction, proposes a method to calculate the collocation measures and to extract collocations automatically by combining a free concordance software and Visual Foxpro. An evaluation test confirms its practicability and reliability. Key words: collocation, statistics, computer implementation 语料库语言学的发展为语言研究开辟了一个新的领域,词语搭配以其在语言产生、语言理解和语言学习中的重要作用无疑处于该领域的中心地位。然而,基于语料库的词语搭配研究也同样受到资源共享困难和语料分析工具不足的困惑。目前词语搭配研究中较为权威可靠的工具要么属于商业性软件,如WordSmith,Sara等,价格昂贵,不是一般的研究人员所能拥有;要么功能不全,如TACT仅提供Z-值并且对语料库的大小有严格限制,WordSmith 仅提供MI-值,只能抽取出显著性最高的10个搭配词。由此可见,现有工具远不能满足语料库深入研究的需要。本文在简要介绍词语搭配抽取中常用的三种统计方法的基础上,重点提出一种将免费检索软件Wconcord和语言研究者较为熟悉的Visual Foxpro(VFP)编程技术相结合,计算词语搭配统计量,实现词语搭配自动抽取的方法。通过与TACT和WordSmith 抽取结果的对比,对这种方法的可行性和结果的可靠性进行了评估。 1 词语搭配抽取的统计方法 词语搭配指的是词与词的结伴使用这种语言现象,是词语间的典型共现行为(Firth 作者简介:邓耀臣(1967—),男,汉,博士研究生。研究方向:语料库语言学与二语习得。 王同顺(1955—),男,汉,教授,博士生导师。研究方向:二语习得,大纲设计。

最新淘宝之常用专业术语名词解释

淘宝常用名词解释 【基础统计类】 1、浏览量(PV):店铺各页面被查看的次数。用户多次打开或刷新同一个页面,该指标值累加。 2、访客数(UV):全店各页面的访问人数。所选时间段内,同一访客多次访问会进行去重计算。 3、收藏量:用户访问店铺页面过程中,添加收藏的总次数(包括首页、分类页和宝贝页的收藏次数)。 4、浏览回头客:指前6天内访问过店铺当日又来访问的用户数,所选时间段内会进行去重计算。 5、浏览回头率:浏览回头客占店铺总访客数的百分比。 6、平均访问深度:访问深度,是指用户一次连续访问的店铺页面数(即每次会话浏览的页面数),平均访问深度即用户平均每次连续访问浏览的店铺页面数。【月报-店铺经营概况】中,该指标是所选月份日数据的平均值。 7、跳失率:表示顾客通过相应入口进入,只访问了一个页面就离开的访问次数占该入口总访问次数的比例。 8、人均店内停留时间(秒):所有访客的访问过程中,平均每次连续访问店铺的停留时间。 9、宝贝页浏览量:店铺宝贝页面被查看的次数,用户每打开或刷新一个宝贝页面,该指标就会增加。 10、宝贝页访客数:店铺宝贝页面的访问人数。所选时间段内,同一访客多次访问会进行去重计算。 11、宝贝页收藏量:用户访问宝贝页面添加收藏的总次数。 12、入店页面:单个用户每次浏览您的店铺时查看的第一个页面为入店页面。 出店页面:单个用户每次浏览您店铺时所查看的最后一个页面为出店页面。 13、入店人次:指从该页面进入店铺的人次。 14、出店人次:指从该页面离开店铺的人次。 15、进店时间:用户打开该页面的时间点,如果用户刷新页面,也会记录下来。 16、停留时间:用户打开本店最后一个页面的时间点减去打开本店第一个页面的时间点(只访问一页的顾客停留时间暂无法获取,这种情况不统计在内,显示为“—”)。 17、到达页浏览量:到达店铺的入口页面的浏览量。 18、平均访问时间:打开该宝贝页面到打开下一个宝贝页面的平均时间间隔。(用户访问该宝贝页后,未点击该页其他链接的情况不统计在内,显示为“—”) 19、全店宝贝查看总人次:指全部宝贝的查看人次之和。 20、搜索次数:在店内搜索关键词或价格区间的次数。 【销售分析类】 1、拍下件数:宝贝被拍下的总件数。 2、拍下笔数:宝贝被拍下的总次数(一次拍下多件宝贝,算拍下一笔)。 3、拍下总金额:宝贝被拍下的总金额。 4、成交用户数:成功拍下并完成支付宝付款的人数。所选时间段内同一用户发生多笔成交会进行去重计算。 5、成交回头客:曾在店铺发生过交易,再次发生交易的用户称为成交回头客。所选时间段内会进行去重计算。 6、支付宝成交件数:通过支付宝付款的宝贝总件数。 7、支付宝成交笔数:通过支付宝付款的交易总次数(一次交易多件宝贝,算成交一笔)。 8、支付宝成交金额:通过支付宝付款的金额。 9、人均成交件数:平均每用户购买的宝贝件数,即人均成交件数 = 支付宝成交件数 / 成交用户数。 10、人均成交笔数:平均每用户购买的交易次数,即人均成交笔数 = 支付宝成交笔数 / 成交用户数。 11、当日拍下-付款件数:当日拍下、且当日通过支付宝付款的宝贝件数。 12、当日拍下-付款笔数:当日拍下、且当日通过支付宝付款的交易次数。 13、当日拍下-付款金额:当日拍下、且当日通过支付宝付款的金额。 14、客单价:客单价=支付宝成交金额/成交用户数。单日“客单价” 指单日每成交用户产生的成交金额。 15、客单价均值:指所选择的某个时间段,客单价日数据的平均值。如【月报】中,客单价均值=该月多天客单价之和/ 该月天数。 16、支付率:支付宝成交笔数占拍下笔数的百分比,即支付率 = 支付宝成交笔数 / 拍下笔数。 17、成交回头率:成交回头客占成交用户数的百分比。即成交回头率 = 成交回头客 / 成交用户数。 18、全店成交转化率:全店成交转化率=成交用户数/访客数。单日“全店成交转化率” 指单日成交用户数占访客数的百分比。 19、全店转化率均值,指所选择的某个时间段,全店成交转化率日数据的平均值。如【月报】中,全店转化率均值=该月多天转化率之和 / 该月天数。 20、促销成交用户数:参与宝贝促销活动的成交用户数。 21、宝贝页(促销)成交转化率:参与宝贝促销活动的成交用户数占宝贝页访客数的百分比。“按月”、“按周”查看报表时,该指标是所选时间段内日数据的平均值。 22、支付宝(促销)成交件数:买家参与宝贝促销活动产生的支付宝成交件数。 23、支付宝(促销)成交笔数:买家参与宝贝促销活动产生的支付宝成交笔数。 24、支付宝(促销)成交金额:买家参与宝贝促销活动产生的支付宝成交金额。 25、非促销成交用户数:未参与宝贝促销活动的成交用户数。 26、支付宝(非促销)成交件数:买家未参与宝贝促销活动产生的支付宝成交件数。 27、支付宝(非促销)成交笔数:买家未参与宝贝促销活动产生的支付宝成交笔数。 28、支付宝(非促销)成交金额::买家未参与宝贝促销活动产生的支付宝成交金额。 【直通车数据类】 字段名称简称含义 展现量pv 广告被展现的次数 点击量click/uv 广告被点击的次数 点击率ctr 点击量/展现量 消耗REV 直通车点击产生费

语料库常用术语

语料库常用术语 Type 类符 Tokens 形符 例如“I see a cat and a dog”类符6个,形符7个 Type/token ratio =TTR TTR 是衡量文本中词汇密度的常用方法,可以辅助说明文本的词汇难度。但是,文本中有大量功能词出现,文本每增加一个词,形符就会增加一个,但类符却未必随之增加。这样文本越长,功能词重复次数越多,TTR会越低。因此用TTR衡量词汇密度不合理,于是,出现了标准化类符/形符比,即STTR。例如,计算每个文本1000词的TTR,均值处理,得出STTR。Frequency(频率) 例如每百万词、十万词中,某单词出现次数。常常将某个单词在两个语料库中出现的频率参照两个语料库的容量,用卡方检验或对数似然率进行对比,来确定两个库中该单词的使用是否有差异。 Wordlist词表 根据单词或词组在语篇中出现的频率大小而排列形成的列表。 Ranks Lemma词目,词元 比如go是lemma,对应各种屈折变化形式(inflections),go,goes,went,going,gone共5种屈折变化形式。在分析语言时,需要将它们全部归到go名下,这个过程叫词形还原。Keywords关键词、主题词positive keywords 正关键词negative keywords 负关键词 Concordance 索引(KWIC 语境中的关键词key words in context) 运用索引软件在语料库中查询某词或短语的使用实例,然后将所有符合条件的语言使用实例及其语境以清单的形式列出。通过前后语境,可以分析“collocation词汇搭配”“colligation 类连接、语法搭配”“semantic preference语义倾向”“semantic prosody语义韵”Collocation词汇搭配 搭配强度MI,T-score ,Z-score Colligation类连接、语法搭配 semantic prosody语义韵 词汇的语义韵大体可分为积极语义韵、中性语义韵、消极语义韵。 POS tagging 词性赋码 Regular expression regex 正则表达式

基于语料库同义词辨析的一般方法

收稿日期:2005-3-28 作者简介:1.张继东(1965-),男,安徽安庆人,东华大学外语学院讲师,研究方向为语料库语言学;2.刘 萍 (1965-),女,安徽芜湖人,上海交通大学技术学院副教授,研究方向为语料库语言学与英语教学法。 基于语料库同义词辨析的一般方法 张继东1 ,刘 萍 2 (1.东华大学外语学院,上海200051;2.上海交通大学技术学院,上海200231) 摘 要:基于语料库的同义词辨析方法包括:(1)统计出同义词在语料库的不同语域中的词频分布差异;(2)以节点词的跨距为参照,统计同义词的显著搭配词,并计算同义词与其搭配词相互信息值(M I 值)以及Z 值;(3)通过观察检 索行中所呈现的同义词搭配特征,揭示出它们的类联结、搭配关系和语义韵等语言特征。 关键词:同义词;语料库;语域;搭配;语义韵 中图分类号:H31312 文献标识码:A 文章编号:10022722X (2005)0620049204 Corpus 2ba sed Approaches to the D i fferen ti a ti on of English Synony m s Z HANG J i 2dong 1 ,L I U Ping 2 (1.College of Foreign Languages,Donghua University,Shanghai,200051,China;2.Technical School,Shanghai J iao Tong University,Shanghai,200231,China ) Abstract:W ithin cor pus 2based app r oaches,synony m s can be differentiated with reference t o:1)their distributi ons a mong different registers;2)their significant coll ocates,and the M I value and Z score bet w een synony m s and their coll ocates;3)their coll ocati onal behavi ors and se mantic p r os odies with regard t o certain colligati onal fra me works .Synony m s thus differentiated will have significant pedagogical i m p licati ons . Key W ords:synony m;cor pora;register;coll ocati on;semantic p r os ody 0.引言 英语是世界上使用最广泛的语言之一,其词汇量极其庞大,其中同义词占有很大比例,是语言学习的难点。据统计,英语语言中同义词、近义词的数量约占总词汇量的60%以上(贺晓东,2003),它们通过词形、词义、结构或用法等方方面面的相同或相近构成了庞大的英语词汇体系,切实学懂、用熟同义词是突破英语词汇的重要环节,更是提高英语写作、阅读、会话等技能的关键。 传统的同义词辨析方法,多依赖于直觉经验,采用内省的定性方法,对同义词的词目意义条分缕析,然而,一般的语言学习者在实际的运用中似乎仍然难得要领。本文拟从语料库语言学的角度,通过对相关的语料库进行检索统计,发现同义词在不同语域中的词频分布差异,计算出词语搭配的不同相互信息值,通过观察检索行中所呈现的同义词搭配特征,揭示出它们不同的类联结、搭配关系和语义韵等语言特征。 1.基于英语语料库的同义词辨析111同义词在不同语域中词频分布差异 语域是人们在实际的语言活动中,出于交际的需要,或因其所从事的职业和兴趣相异,亦或因其话语发生的情景、说话的对象、地点和话题的不同而产生的一种言语变体,体现为语言中的不同语体风格、用语格调等。同义词由于其内在意义的差异,在不同的语域中往往会呈现出不同的分布特征,所以统计它们不同语域中的频率差异,有助于将它们区分开来。 为了说明同义词在不同语域中的分布频率对同义词的辨析具有宏观指导作用,本文选取了一组同义形容词:big 、great 、large,对《朗文英语口语和书面语语料库》(简称LGS W E )所提供的数据进行搜集,按会话、小说、新闻、学术文章四个语域进行分类。 big 、great 、large 之间的词义差异,学习者似乎能够直接从词典类工具书中就可以查询出来,但是 第28卷 第6期2005年11月解放军外国语学院学报 Journal of P LA University of Foreign Languages Vol .28 No .6Nov 12005

语料库简单dye 第二讲

2008/7/31 语料库简单DIY 第二讲语料库软件初探-- 语料库软件初探--MonoConcPro 2.2 本软件是Athelstan开发小组https://www.sodocs.net/doc/5d8227742.html,/ ,于1996年开发的语料库比较检索工具。目前,我的服务器上提供学术性下载,下载地址: http://vu.flare.hiroshima-u.ac.jp/whistle/corpus/MoconcPro2. 2.rar (本软件为学术交流使用,所有权归本软件开发小组所有,一切商务性盈利目的的违法使用,所带来的连带责任关系与本人及本论坛无关。请慎重下载,小心使用!!!) 功能介绍: 软件主界 面 基本功能: MonoConc Pro 2.2 的软件界面比较简单。适合语料库初学者和初级研究人员使用。 本软件据作者的研究,其内部主核使用UTF-8编码,基本支持欧洲几种主要语言。当然,其主要的应用领域还是针对英语。本软件主要处理的文本素材是以TXT结尾的记事本文件,当然,本软件还可以导入RTF文档和其他格式的操作系统默认文档格式。不过,从DIY的角度来说,我们自己收集到的语料,为了免除格式,字体,行距等等文本要求,最好全部使用TXT文档,方便,省

事!用了都说好!(谁用谁知道) 我们按照自己的研究目的,研究方向,收集我们所需要的语料素材,具体的收集方法因人而异。可以从报纸杂志的电子文文档上直接下载,也可以从网站上直接下载整理好的TXT版本的小说,资料素材等,还可以直接从各大语料库中检索需要的语用素材,然后拷贝粘贴到TXT文本中。由于MonoConc Pro 强大的跨文档处理系统,一次可以同时导入多个TXT文档进行比较处理,所以我们可以把文章或者资料按照自己喜好的分类标准进行分类,然后存成不同的TXT文件名。检索的时候,只需要同时导入这些文件就可以了。(异常强大~)下载好软件,解压缩,然后打开MP22.EXE文件,你就可以看到上图那个简单的主界面了。 之后,选择File→Lord Corpus File(s),找到你需要导入处理的TXT文档,一个或者多个都可以,然后选择[打开]。指定的TXT文件就被全部导入进MonoConc Pro中了。 如果导入了过多的TXT文档,比如您导入了莎士比亚全集+马克思选+恩格斯选+列宁选+毛泽东选+邓小平选.....(不能否认,真的有这样的朋友存在)。那么,为了方便您查询检索结果所出现的文章,你可以选择File→View Corpus File/URL,这样就能看到查询结果所在的文章,还可以删除不需要的文章,或者添加新的文章,非常简单。 *这里的URL,指的是在HTTP或者FTP上,可以直接打开的文字页面的链接。一般朋友们DIY的语料库都是存在本地硬盘上的,所以基本上可以无视这个选项。不过,将来我们的个人语料库要实现点对点,点对多的平台连接。连接后,我们就可以相互查询对方个人语料库中的资料,此时在导入对方语料库中的文档的时候,就要用这个了。(这个目前还很遥远,大家还是踏踏实实做自己的DIY语料库吧!) 当我们要删除所有的文章的时候,这个时候仅仅关闭文章的窗口,是不能实

语料库语言学术语汇编Aglossaryofcorpuslinguistics.docx

语料库语言学术语汇编 ( V2.0 ) Last updated 2012-10-08 by许家金 Aboutness所言之事 Absolute frequency绝对频数 Alignment (of parallel texts)(平行或对应)语料的对齐Alphanumeric字母数字构成的 Annotate标注(动词) Annotated text/corpus标注文本 /语料库、赋码文本/语料库Annotation标注(名词) Annotation scheme标注方案 ANSI/American National Standards Institute美国国家标准学会 ASCII/American Standard Code for Information美国信息交换标准码 Exchange Associates (of keywords)(主题词的)联想词 AWL/academic word list学术词表 Balanced corpus平衡语料库 Base list/baselist底表、基础词表 Bigram二元组、二元序列、二元结构 Bi-text/bitext双语合并文本、双语分行对齐文本 (一句源语一句目标语对齐后的文 本) Bi-hapax两次词 Bilingual corpus双语语料库 Bootcamp debate/discourse/discussion(新手)训练营大辩论 /话语 /大探讨CA/Contrastive Analysis对比分析 Case-sensitive/case sensitivity大小写敏感、区分大小写 Category-based approach基于类(范畴)的方法 Chi-square test/ 2χ卡方检验 Chunk词块 CIA/Contrastive Interlanguage Analysis中介语对比分析 CLAWS/Constituent Likelihood Automatic Word-CLAWS 词性赋码系统 tagging System Clean text policy干净文本原则 Cluster词簇、词丛 Colligation类联接、类连接、类联结 Collocate n./v.搭配词;搭配 Collocability搭配强度、搭配力 Collocation搭配、词语搭配 Collocational strength搭配强度 Collocational framework/frame搭配框架 Collocational profile搭配概貌

语料库常用统计方法

3.5语料库常用统计方法 第3章前几节对语料库应用中的几种主要技术做了介绍。通过语料检索、词表和主题词表的生成,可以得到一定数量的句子、词汇或结构。为能更好说明所得到的结果的真正意义,常常需要对它们加以统计学分析。本章主要介绍语料分析中的一些常用统计方法。 3.5.1 语料库与统计方法 介绍相关统计方法之前,首先需要了解为什么语料库应用中需要运用统计方法。在2.1节讲到文本采集时,我们知道文本或会话构成了最终的语料库样本。这些样本是通过一定的抽样方法获得的。研究中,我们需要描述这些样本的出现和分布情况。此外,我们还经常需要观察不同语言项目之间在一定语境中共同出现(简称共现)的概率;以及观察某个(些)语言项目在不同文本之间出现多少的差异性。这些需要借助统计学知识来加以描写和分析。 理论上说,几乎所有统计方法都可以用于语料库分析。本章只择其中一些常用方法做一介绍。我们更注重相关统计方法的实际应用,不过多探讨其统计学原理。这一章我们主要介绍语料分析中的频数标准化(normalization )、频数差异检验和搭配强度的计算方法。 3.5.2 频数标准化 基本原理 通常语料检索、词表生成结果中都会报告频数(frequency, freq 或raw frequency )。那么某词(如many )在某语料库中出现频数为100次说明什么呢?这个词在另一个语料库中出现频数为105次,是否可以说many 在第二个语料库中更常用呢?显然,不能因为105大于100,就认定many 在第二个语料库中更常用。这里大家很容易想到,两个语料库的大小未必相同。按照通常的思维,我们可以算出many 在两个语料库中的出现百分比,这样就可比了。这种情况下,我们是将many 在两个语料库中的出现频数归到一个共同基数100之上,即每100词中出现多少个many 。这里通过百分比得到的频率即是一种标准化频率。有些文献中标准化频率也称归一频率或标称频率,即基于一个统一基准得出的频率。 实例及操作 频数标准化,首先需要用某个(些)检索项的实际观察频数(原始频数,raw frequency )除以总体频数(通常为文本或语料库的总词数),这样得到每一个单词里会出现该检索项多少次。在频数标准化操作中,我们通常会在此基础上乘以1千(1万、1百万)得到平均每千(万、百万)词的出现频率。即: 1000?=总体频数 观测频数标准化频率(每千词) (注:观测频数即检索词项实际出现的次数;总体频数即语料库的大小或总形符数。) 例如,more 在中国学生的作文里出现251次,在英语母语者语料中出现475次。两个语料库的大小分别为37,655词次和174,676词次。我们可以根据上面的公式很容易计算出251和475对应的标准化频率。另外,我们还可以利用Excel 或SPSS 等工具来计算标准化频率。比如,可以将实际观察频数和语料库大小如图3.5.1输入相应的单元格,然后在C1单元格里输入=(A1/B1)*1000即可得到中国学生每千词使用more 约为6.67次。要得到母语

印刷部分常见名词解释

印刷部分常见名词解释 词语含义 出血印刷品设计制作和印刷过程中的一个特有名词,即制作时需要保留,但最终成品要被裁切掉的部分,称为出血 成品尺寸指最终印刷完毕(或者装订完毕),裁切后的尺寸大小,也称为净尺寸 主页如果一个出版物中许多页面都有相同的元素(如页眉和页脚等),要是逐一插入这些元素到每一页中将非常麻烦。使用主页可以将主页上的元素快速显示到其所应用的所有页面上 样式将字体、字号、行距、制表符和缩排等组合在一起,使它能最快且最容易地改变文本的格式 预检打印文档或将文档提交给客户之前,可以对此文档进行品质检查。预检是此过程的行业标准术语。预检程序会警告可能影响文档或书籍不能正确成像的问题,例如,缺失文件或字体。它还提供了有关文档或书籍的帮助信息,例如,使用的链接、显示字体的第一个页面和打印设置 分辨率分辨率是一个非常重要的概念,图像扫描输入、编辑和分色输出都与分辨率有关。分辨率是衡量图像细节表现力的技术参数。 分辨率的种类很多,其含义也各不相同。本书分辨率主要是指图像分辨率。 图像分辨率表达了图像中存储的信息量。这种分辨率有多种衡量方法,典型的是以每英寸的像素数(PPI,Pixels Per Inch)来衡量。由于数字图像的像素是一系列“小点”,故PPI也被写成DPI(Dots Per Inch),这种写法被广泛采用 黑色底在排版软件中,设置底色为黑色,称为黑色底 黑色图背景为黑颜色的图 四色黑在设置颜色时,K=100,CMY也取大于0的数值时,称为四色黑。例如,C=30、M=50、Y=25、K=100 满铺在设定背景颜色时,背景颜色铺满整个页面 菲林也称为胶片。一套彩色的胶印版至少包括4张菲林片,分别代表C、M、Y、K四个颜色 过背由于印刷时墨量过大,纸张在堆放时容易发生相互蹭脏的情况 丝网印刷也称孔版印刷,是使用誊写版、镂空版、丝网版等印版的印刷方式,大多采用直接印刷。丝网印刷的成品,印刷油墨特别浓厚,有隆起的效果,用放大镜观察时,隐约可见有规律的网纹 网点网点是印刷工艺中表现图像阶调与颜色的最基本单元,印刷品中所有连续调和半色调图像都是通过网点来表现的 (续表) 词语含义 数码打样指以数字出版印刷系统为基础,在出版印刷生产过程中按照出版印刷生产标准与规范处理好页面图文信息,直接输出彩色样稿的新型打样技术 拼版拼版是在印刷前,将各单独的页面拼接成符合印刷机大小、符合装订要求的一个较大的印版 电分电分即电子分色。在传统意义上,利用电子分色机将图像分为C、M、Y、K独立的四色,通常称为电分 像素像素是组成点阵图像的基本元素,也是点阵图像构成的最小单位,像素越多,图像呈

广告业常用术语名词解释

AE——Account Executive——客户代表,或客户执行。代表广告公司接受广告主各种业务,并负责整体执行的人。 Account Group——业务小组。广告公司内负责某特定客户之工作小组。以AE为中心,成员包括行销企划、创意、媒体等工作人员,替客户执行广告企划设定、广告表现制作、媒体安排等业务。 Appeal Point——诉求点。广告讯息中,最能打动消费者心理,并引起行动的重点。 Brain Storming——动脑会议。可自由发想,不受限制的讨论会议。 Brand Image——品牌形象。消费者对商品品牌之印象。 CF——Commercial Film——乃广告影片是也,可不是电视广告脚本哦,Commerc ial Script是电视广告脚本。 Competitive Presentation——比稿。有的广告主不会将广告计划立即委托一家广告公司,而是让多家广告公司彼此竞争,再从中选择最优秀、最满意的广告公司。 Copywriter——文案(撰文人员)。负责广告文案的专门写作。 CI——Corporate Identity——企业识别。以统一性的标志表示企业的理念、文化以及经营的任务。 Creative Boutique——创意工作室。“Boutique”为法语中商店的意思,指专门零售店,特别是指贩卖流行物品、装饰品的商店。以这种语意为背景,由少数人组成、专门制作广告的公司,便称为小型制作专业广告公司。 Direct Response Advertising——直效广告。需要从潜在客户处得到简单回应的广告。例如邮购、直接信函、电讯行销,及有线电视购物频道。直效广告必须是双向沟通的。 Director——指导。在整个广告作业中,担任指导之专业职务。依照其经验不同,指导可分为资深指导(Senior Director)、指导(Director)和助理指导(Assistant Director)。 指导有以下各专业职位: Account Director(业务指导) Creative Director(创意指导)Arts Director(美术指导) Copy Director(文案指导) Media Director(媒体指导) Planning Director(企划指导)

商务英语语料库的建设及应用

商务英语语料库的建设及应用初探 【摘要】语料库语言学作为一门新兴的语言学分支,其影响已遍及语言学研究的各领域。将语料库的方法应用于商务英语词汇教学中,发挥其语料真实丰富、计算机程序强大的重新组织语言数据的能力,既能提高学生商务词汇学习的效率和积极性,也能提高商务英语教学质量。本文从商务英语语料库的建设及其应用价值入手,以期语料库语言学为商务英语教学带来更多成果。 【关键词】商务英语语料库地方课程 商务英语(business english)是指商务场景下所应用到的英语,作为特殊目的英语(english for specific purpose)具有很强的专业性。商务英语跟普通英语(english for general purpose)最大区别之一就是专业词汇的大量使用,因此,词汇教学在商务英语教学中的作用不容忽视。语料库(corpus)是语言素材的集合体,能快速准确地提供诸如构词、搭配、语境等多方面的语料及信息。在外语学习中,语料库能够缩小课堂语言与真实语言的差距、培养学习者的语感和学习能力及研究能力,所以用语料库的方法来学习商务英语词汇既可以刺激学生的学习积极性,也可以更加准确、更加有效地掌握商务英语中专业特点较强的词汇。 1 语料库及其发展 语料库可以概述为运用随机抽样的方法,收集自然出现的连续的语言,运用文本或话语片断,并按照一定的语言学原则建成的具有

一定容量的语料体系。 语料库的发展大致经历了三个阶段:第一代语料库以20世纪60年代的brown corpus以及lob corpus为代表,由于是语料库发展的最初时期,所以规模都比较小,这个时期的语料库只能用来考查常用语言现象的频率,无法展现语言的全貌。第二阶段以20世纪80年代的birmingham collection of english language text以及longman/lancaster english为代表,这一时期的语料库建设以电子语料库的兴起为主要特征,语料库的容量不断扩大,种类不断增多。第三阶段从20世纪90年代至今,是语料库建设、研究与应用的迅猛发展阶段,功能更为强大的计算机系统软件的开发与应用致使第二代超大型计算机语料库开始出现,语料库进入了发展的黄金年代。 2 商务英语词汇及其特征 商务英语源于普通英语,并基于普通英语的基本语法、句法结构和词汇语,有普通英语的一些语言学特征。与此同时,作为应用在商务场合的英语,商务英语又是英语语言知识和商务专业知识的综合,因而又具有独有的专业特征。 2.1 在文体风格上,商务英语词汇属于庄重文体(frozen style)。庄重文体,即各体英语中正式程度最高的一种。这种“正式”一是为了在表达上追求准确、专业、标准化的效果,二是为了在思维上追求清晰和条理。许多商务词汇都表现出这一特性。

50个常用名词解释

十八大以来常用的50个名词及解释 1.五位一体”总体布局 答:经济建设、政治建设、文化建设、社会建设、生态文明建设。 2“四个全面”战略布局 答:全面建成小康社会、全面深化改革、全面依法治国、全面从严治党。 3“两个一百年”奋斗目标 答:在中国共产党成立一百年时全面建成小康社会,在新中国成立一百年时建成富强民主文明和谐的社会主义现代化国家。 4五大发展理念 答:创新、协调、绿色、开放、共享。 5五种重要的思维方式 答:战略思维、历史思维、辩证思维、创新思维和底线思维。 6十八大报告提出的到2020年实现两个"翻一番”是什么? 答:国内生产总值比2010年翻一番;城乡居民人均收入比2010年翻一番。 7十八大报告提出的“两个倍增”、“两个同步” 答:“两个倍增”,一个就是国内生产总值的倍增,一个就是城乡居民收入的倍增。两个同步,一个就是城乡居民收入水平要和经济增长同步,另一个就是劳动者报酬要和生产率提高同步。 8一带一路 答:一带一路是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称。 9互联网+ 答:通俗来说,“互联网+”就是“互联网+各个传统行业”,但这并不是简单的两者相加,

而是利用信息通信技术以及互联网平台,让互联网与传统行业进行深度融合,创造新的发展生态。 10供给侧结构性改革 答:就是从提高供给质量出发,用改革的办法推进结构调整,矫正要素配置扭曲,扩大有效供给,提高供给结构对需求变化的适应性和灵活性,提高全要素生产率,更好满足广大人民群众的需要,促进经济社会持续健康发展。供给侧结构性改革的根本目的是提高社会生产力水平,落实好以人民为中心的发展思想。 11两学一做 答:“学党章党规、学系列讲话,做合格党员”学习教育。 12合格党员的“四讲四有” 答:讲政治、有信念,讲规矩、有纪律,讲道德、有品行,讲奉献、有作为。 13四个自信 答:道路自信、理论自信、制度自信、文化自信。 14党面临的“四大危险” 答:精神懈怠危险、能力不足危险、脱离群众危险、消极腐败危险。 15党面临的“四大考验” 答:执政考验、改革开放考验、市场经济考验、外部环境考验。 16八项规定 答:是中共中央政治局关于改进工作作风密切联系群众的规定,强调要改进调查研究、精简会议活动、精简文件简报、规范出访活动、改进警卫工作、改进新闻报道、严格文稿发表、厉行勤俭节约。 17中央政治局强调的“四种意识” 答:政治意识、大局意识、核心意识、看齐意识。

语言学常用术语

语言学常用术语

A List of Commonly-used Linguistic Terminology 语言学常用术语表 Part I General Terms 通用术语 Acquisition 习得 Agglutinative language 粘着语Anthropology 人类学 Applied linguistics 应用语言学Arbitrariness 任意性 Artificial intelligence (AI)人工智能Behaviorism 行为主义Behaviorist psychology 行为主义心理学 Bilingualism 双语现象 Cognition 认知 Cognitive linguistics 认知语言学Cognitive science 认知科学Comparative linguistics 比较语言学Computational linguistics 计算语言学 Corpus-linguistics 语料库语言学Creole 克里奥耳语;混合语 Culture 文化 Descriptive linguistics 描写语言学Design features 识别特征Developmental psycholinguistics 发展心理语言学 Diachronic/historical linguistics历时语言学 Dialect 方言 Dialectology 方言学 Displacement 不受时空限制的特性Dualism 二元论 Duality 二重性 Epistemology认识论 Etymology 辞源学 Experimental psycholinguistics 实验心理语言学 Formalization 形式化 Formal linguistics 形式语言学Forensic linguistics 法律语言学Functionalism 功能主义General linguistics 普通语言学Grammaticality 符合语法性Ideography 表意法 Inflectional language 屈折语 Inter-disciplinary 交叉性学科的Isolating language 孤立语 Langue 语言 Macro-sociolinguistics 宏观社会语言学 Mentalism 心智主义 Micro-sociolinguistics 微观社会语言学 Montague grammar蒙太古语法Neuro-linguistics 神经语言学Orthography 正字法 Orthoepic 正音法的 Paradigmatic 聚合关系 Parole 言语 Pedagogy 教育学;教授法Philology 语文学 Philosophy 哲学 Phonography 表音法 Pidgin 皮钦语;洋泾浜语Polysynthetic language 多式综合语Prescriptive linguistics 规定语言学Psycholinguistics心理语言学Psychology 心理学 Semeiology 符号学 Sociology 社会学 Speech 言语 Sociolinguistics社会语言学Structuralism 结构主义 Synchronic linguistics 共时语言学Syntagmatic 组合关系 Theoretic linguistics 理论语言学Universal grammar 普遍语法Universality 普遍性 Part II Phonology 音位学 Ablaut 元音变化 Acoustic phonetics 声学语音学Affricate 塞擦音 Allophone 音位变体

相关主题