搜档网
当前位置:搜档网 › 全球汉语学习者语料库建设方案

全球汉语学习者语料库建设方案

全球汉语学习者语料库建设方案
全球汉语学习者语料库建设方案

2011年5月

第2期语言文字应用Applied Linguistics May ,2011No.2[收稿日期]2010-12-27

[作者简介]崔希亮,北京语言大学教授,博士,博导,主要研究方向为语言学及应用语言学;张宝林,北京语言大学汉语水平考试中心研究员,研究方向为语言学及应用语言学。

*本研究得到北京市教育委员会共建项目专项资助。

全球汉语学习者语料库建设方案

*崔希亮

张宝林(北京语言大学北京100083)

[摘要]本文在对汉语中介语语料库建设情况进行较为全面、深入的考察的基础

上,提出“全球汉语学习者语料库”的建设构想,具体介绍了该语料库的内容、建设原

则、

建库方式与步骤和主要特点。文章倡议学界共同努力,建设一个最大最好的汉语中介语语料库,实现最充分的资源共享,为全球的汉语教学与研究服务。

[关键词]外国汉语学习者;汉语中介语语料库;建设方案;资源共享

[中图分类号]H195[文献标识码]A [文章编号]

1003-5397(2011)02-0100-09The Principles for Building the

“International Corpus of Learner Chinese ”

CUI Xiliang ,ZHANG Baolin

Abstract :In this paper ,the design principles of “International Corpus of Learner

Chinese ”is proposed based on an overall and thorough investigation of the situation of

Chinese interlanguage corpus development.This paper introduces the contents ,principles ,methods ,steps of the construction of the corpus and its main characteristics.

With the purpose of serving for the global Chinese teaching and research ,this paper also is

an initiative to call for joint efforts of academic circle for the construction of the biggest and

the best Chinese interlanguage corpus ,and the realization of adequate sharing of

resources.

Keywords :foreign learners of Chinese ;Chinese interlanguage corpora ;construction

framework ;resources sharing

2011年第2期崔希亮张宝林:全球汉语学习者语料库建设方案·101·

一汉语中介语语料库建设现状

(一)汉语中介语语料库建设概观

汉语中介语语料库的建设始于20世纪90年代,第一个语料库即北京语言学院于1995年建成的汉语中介语语料库检索系统。此后有南京师范大学的外国学生汉语中介语偏误信息语料库、中山大学的留学生中介语语料库、暨南大学华文学院的留学生汉语中介语语料库、北京语言大学的HSK动态作文语料库问世。目前还有一些语料库在建设中,例如北京语言大学的首都外国留学生汉语文本语料库。

这些语料库在对外汉语教学的相关研究中发挥了巨大作用。研究者通过这些语料库发现了前人未曾发现的一些语言现象,并把定性研究与定量研究相结合,使研究结论具有较强的客观性、普遍性和稳定性,极大地提高了对外汉语教学研究的水平。例如赵金铭教授主持的“基于中介语语料库的汉语句法研究”、张博教授主持的“基于中介语语料库的汉语词汇专题研究”、肖奚强教授主持的“外国学生汉语句式学习难度及分级排序研究”,都是基于语料库的具有代表性的研究成果。

(二)语料库建设中存在的主要问题

1.数量较少,规模较小,语料不够全面。

与国内外众多的母语语料库相比,汉语中介语语料库数量很少,中国大陆已经建成并可以实际使用且有一定影响的汉语中介语文本语料库屈指可数。一般来说,这些语料库收集的学习者样本不多,语料规模较小:熟语料在几十万字至四百多万字之间。汉语中介语口语语料库则只有北京语言大学的汉语学习者口语语料库。

语料不全面包括两种情况:一是有的语料库只有某个或某些学习阶段学习者的语料,而缺少另外某些学习阶段的学习者的语料。例如HSK动态作文语料库只收入了参加高等考试的考生作文(初中等没有写作考试)。基于这样的语料库,只能对某个阶段学习者的习得情况进行考察,而无法对学习者的整个学习过程进行全面研究。(张宝林,2008)二是语料库中收集的语料以韩国、日本、东南亚一些国家汉语学习者的语料居多,欧美学习者的语料很少,不利于对欧美学习者的汉语习得情况进行全面、具体、深入的考察与研究。

2.语料库建设没有统一标准,建库实践带有很强的随意性。

汉语中介语语料库的建设目的是明确的,那就是为汉语教学及相关研究提供一个基础平台,使汉语中介语研究、作为第二语言的汉语习得研究、对外汉语教学理论研究、对外汉语教材研究、汉语水平考试研究、汉外语言对比研究等建立在更为扎实的基础上,并为汉语本体研究提供参考,使研究结论具有更广泛的普遍性和更充分的科学性。(张宝林、崔希亮、任杰,2004)但是,汉语中介语语料库应怎样建设?建库的基本原则是什么?语料库整体结构应该是怎样的?应收集什么样的语料?语料规模应多大?应标注哪些内容?应采用什么样的标注方式?如何保证标注的质量与一致性?应该收集语料的哪些背景信息?怎样收集?语料库是否向公众开放?怎样开放?如何实现资源共享?这些问题至今尚未展开充分的讨论,更没有一个为大家普遍接受的标准。

因此,在建设语料库的过程中就呈现出一种随意状态,不同的语料库建设者基本上是依据自己的主观认识与想法各行其是。其具体表现是:有的语料库语料规模为几十万字,有的则达几百万字;有的语料是学生平时的写作练习,有的是作文考试答卷;有的语料库除计算机录入

·102·语言文字应用2011年第2期

的学习者语料之外,还有语料的原始图片,大部分语料库则没有原始图片;有的只经过断句、分词和词性标注等加工处理(陈小荷,1996);有的只标出错别字,或部分偏误句;有的则从字、词、句、篇、标点符号等角度对全部语料中存在的偏误现象进行了穷尽性标注,如HSK动态作文语料库(张宝林,2006;2009);而对语料中正确的语言表现,则皆未标注;有的语料库带有的学习者背景信息多达十几项,有的语料库则只有很少的背景信息,等等。

3.功能不够完善,有些中介语现象检索不便,甚至无法检索。

有的语料库没有电子扫描的原始语料,也没有字处理和语篇处理,因而无法考察学习者在汉字和语篇方面的习得情况。有的语料库只对语料中的各种偏误现象进行了标注,而未标注正确的语言表现,因而要全面考察学习者的语言习得情况会受到相当大的限制。(张宝林,2008)由于语料处理方法的缺陷,对有些研究无法提供语料支持。例如在研究外国学生对汉语“得”字补语句的习得情况时,就无法检索并提取那些该用“得”而未用的补语句。(孙德金,2002)有的语料库查询结果无法输出,有的语料库缺乏统计信息。

这些问题给基于语料库的相关研究造成了诸多困难。

4.语料标注效率不高,标注质量存在一定问题。

目前汉语中介语语料库除分词和词性标注采用机标人助的方式外,字、词、句、篇、标点符号的偏误识别及标注均采取手工方式进行。相对于机器自动处理而言,这种标注方式的准确性较高,但标注速度很慢,标注的一致性较差。虽然可以通过标注工具的帮助,在一定程度上减少标注一致性的差错,但问题依然存在。

手工标注带来的另一个重要问题是标注的质量,如果标注人员没有全面、扎实的语言文字功底,标注中的错误就在所难免。标注后的审核步骤可以纠正一部分错标,但无法完全避免。例如HSK动态作文语料库(1.0版)对存现句的判定有多处错误,在1.1版中才得到纠正。

5.语料库资源尚不能充分共享。

建设语料库的最终目的是供各界用户使用,其价值与使用人数成正比例关系:使用者越多,则其价值越大;如果无人使用,那么也就毫无价值。从目前的实际情况看,多数语料库没有上网,也未向公众开放,一般人无法见到,更无法使用。例如,汉语学习者口语语料库完成后即束之高阁,“躲在深闺人未识”,发挥的作用不大。语料库资源不能充分共享,语料库的价值无法得到最大程度的发挥,令人遗憾。在这方面,HSK动态作文语料库(1.1版)已经上网,任何人都可以免费使用,今年6月又进一步开放了用户权限和语料下载。但由于其语料方面的先天不足,尚不能完全满足研究的需要。(张宝林,2010)

(三)建设新语料库的设想

目前,汉语中介语语料库的建设已经为汉语的教学与研究带来了明显效益,引起了学界的广泛关注。但总体来看,汉语中介语语料库的建设还处于初创阶段,尚不能满足汉语教学与研究中的多种需要。

因此,我们试图建设一个语料样本多、规模大、来源广、阶段全、背景信息完备、标注内容全面、标注质量优异、设计周密、功能完善、检索便捷、向各界用户开放、能够反映各类汉语学习者的汉语学习过程与特征、可以满足任何研究需求的汉语中介语语料库,即“全球汉语学习者语料库”,以弥补现有语料库的不足,更好地为汉语教学与研究服务。

2011年第2期崔希亮张宝林:全球汉语学习者语料库建设方案·103·

二全球汉语学习者语料库的基本内容

(一)关于语料:样本多、规模大、来源广、阶段全

1.样本多:指语料作者众多,预期达到数万人。

2.规模大:指语料数量大,预计规模为5000万字。其中书面表达生语料2500万字,熟语料2000万字,合计4500万字;口头表达生语料500万字,其中熟语料200万字,生语料300万字。在后续建设中,将逐渐把全部语料都加工为熟语料。

3.来源广:指语料类型广泛。从地域角度看,有中国大陆的外国汉语学习者所写的语料,也有在其本国或其他国家和地区学习汉语的学习者的语料。从学生类别角度看,有汉语言专业或中文专业的学生写的语料,也有其他专业的学生写的语料;有本科生的语料,也有长期进修生、短期进修生的语料;有华侨华裔学习者的语料,也有非华侨华裔学习者的语料。从文体角度看,有记叙文、议论文、说明文。从语料性质看,有平时的作业,有成绩考试试卷,有汉语水平考试的作文,也有回答问题时的成段表达。

语料样本多、规模大、来源广,给研究带来的直接效益是:可以使研究及其结论具有很强的客观性、普遍性与稳定性,所得到的结论不会因语料的变化而产生变异。由于“比较大的样本可以减低样本统计量的变异”(戴维·S·穆尔,2003:162),因而可以保证结论的可靠性。

4.阶段全:指包括汉语学习的整个过程,即有初级、中级、高级等各个学习阶段的学习者的语料。因而既可以对各个阶段的学习者的学习情况进行横向的断面考察,也可以对学习的整个过程进行全面研究或对各个学习阶段进行对比分析。

为了和母语者的汉语使用情况进行对比分析,还将收入部分母语者小学生、初中生、高中生的作文语料。

(二)关于背景信息

背景信息包括学生及语料的相关信息。

1.学生信息包括:姓名(以代码形式显示)、性别、国籍、是否华裔、母语或第一语言、掌握的其他语言及程度,专业、年级、汉语学习时间、学习地点、学习目的;是否参加过HSK考试、参加次数、作文考试分数、考试总分、是否获得水平证书、证书等级。

2.语料信息包括:标题、文体、字数下限、写作时间、写作地点(课上、课下、考场等)、得分。

(三)关于标注

标注模式为偏误标注和基础标注相结合。

1.偏误标注:指对字、词、短语、句、篇、标点符号的各种偏误的标注。

(1)汉字偏误标注,包括:错字、别字、漏字、多字、繁体字、异体字、拼音字。

(2)词语偏误标注,包括:错序词、错用词、词语重叠偏误、离合词偏误、生造词、外文词、多词、缺词。

(3)短语偏误标注,包括:词类搭配偏误、音节搭配偏误、用法搭配偏误。

(4)句子偏误标注,包括:各种句类、句型、句式、句子成分偏误、语序偏误、句式杂糅、未完句。

(5)语篇偏误标注,包括:形式连接偏误、语义连接偏误。

(6)标点符号偏误标注,包括:标点错误、标点空缺、标点多余。

2.基础标注:指对语料中正确的语言现象的标注。

·104·语言文字应用2011年第2期

(1)分词及词类序列标注。

(2)句子成分序列标注。

(3)句类、句型、句式类别标注。

句类标注包括陈述句、疑问句、祈使句、感叹句。陈述句标注包括:双重否定句,而肯定句、否定句则不标;疑问句包括:是非问句、特指问句、选择问句、正反问句、反问句。

句型标注包括:形容词谓语句、名词谓语句、主谓谓语句,动词主语句、形容词主语句,名词非主谓句、动词非主谓句、形容词非主谓句、叹词非主谓句、象声词非主谓句;而主谓句、动词谓语句则不标。

句式标注包括:把字句、被字句、比字句、有字句、是字句、“是……的”句(一)、“是……的”句(二)、双宾语句、连字句、连动句、兼语句、存现句、重动句、供用句。

(4)语体标注:口语词、书面语词,口语句、书面语句。

(5)句标记标注:标示单句,据此可以得到全库句数。其直接效益是,在基于语料库的相关研究中可以在全部句子中得出偏误句所占的比例,从而避免了基于全库字数统计偏误句比例的不科学的做法。

标注方式包括以下两个方面:

(1)手工标注:根据目前标注的实际水平,在建库前期这将是主要的标注方式。

(2)尝试进行自动标注:

总结概括现有汉语中介语语料库中熟语料的偏误种类,建立偏误模型,先在小规模语料中试标并修改完善,然后进入对大规模语料的实际标注。机器所做的各种标注还需经过人工校对与修改。

采用数字墨水技术进行标注。其优越性是可以直接在扫描版语料中勾画存在偏误的字、词、句、篇,并可以与录入版语料建立联系,使各种偏误可以在两版语料上同时体现,直接定位。这将为用户检索各类偏误带来极大的方便。(张宝林,2010)

(四)关于统计

1.字信息统计:字量及字频、错字数量、别字数量、繁体字数量、异体字数量、拼音字数量。

2.词信息统计:词量及词频统计、词类统计、各类熟语的数量统计、词的各类偏误统计。

3.句信息统计:句量及句频统计、句类统计、句型统计、句式统计、各类偏误句统计。

4.语篇信息统计:形式连接偏误统计、语义连接偏误统计。

5.标点符号信息统计:各种标点符号的用量统计,各种标点符号的偏误统计。

(五)关于库结构

1.语料库包括5个子库:生语料库、熟语料库、统计信息库、相关信息库、母语者中小学生语料库。

生语料库:存放未经任何标注的语料,但信息完备,可以按相关信息库提供的各种信息进行检索与输出。

熟语料库:存放经过各种标注加工的语料。

统计信息库:存放各种统计数据;

相关信息库:存放学生信息和语料相关信息。

母语者中小学生语料库:存放母语者中小学生的作文语料。

2.生语料库有2个子库:文本语料库、声音语料库。

2011年第2期崔希亮张宝林:全球汉语学习者语料库建设方案·105·

文本语料库:存放书面表达形式的语料,即写作语料。其中部分语料有电子扫描版,可以直接呈现语料原貌,特别是可以为汉字研究提供原始素材。

声音语料库:存放口头表达形式的语料,即口语语料。

3.熟语料库有2个子库:偏误标注库、基础标注库。

偏误标注库:存放从字、词、短语、句、篇、标点符号等角度进行偏误标注的语料。

基础标注库:存放以句子为单位、经过分词及词类序列标注、句子成分序列标注、句类句型句式类别标注、语体信息标注、句子正误性质标注的语料。

(六)关于成果形式

1.网络版语料库:放在专用网站上,用户注册后即可登录使用。

2.单机版语料库:以光盘形式出版发行,供用户在网下使用。

三建库的基本原则

(一)注重语料的真实性

语料录入采取“实录”原则,语料标注也要忠实原作,最大限度地保持语料原貌。录入时对语料不做任何修改订正,字、词、短语、句、篇、标点符号等方面的错误和书写格式均原样录入,以全面反映学生的实际语言表现。标注时除字、词方面的偏误需要“既标且改”以保证分词和标注词性的正确之外,短语、句、篇等方面的偏误均“只标不改”。

(二)注重语料的平衡性

不同类型的语料在分布上应尽可能均匀,也要根据实际情况有所区别。从学习阶段和年级角度看,初级、中级、高级三个学习阶段、四个年级的语料数量应完全相同。从国别角度看,有些国家的学生很少,语料要全部收入;有些国家的学生很多,语料必须有所删减。从文体角度看,叙述性语料占40%,议论性语料占40%,说明性语料占20%。

(三)注重语料的系统性

各类语料完整,且能一一对应,相关信息完备。

注重收集同一名学生/同一个学生群体在不同学习阶段/不同年级的语料。这部分语料能够反映学生的整个学习过程,在研究上有重要意义,也是本语料库的一大特色。

(四)注重语料的动态性

语料可以按学期或学年不断充实与更新。

(五)注重语料库使用的便捷性

语料库结构清晰,界面简洁,响应迅捷,使用方便。

用户可以从国别/母语、年级/学习时间、华裔/非华裔、字、词、短语、句、篇、标点符号、语料性质、语体等各种角度,对语料中存在的各种偏误和正确表现进行检索查询。语料输出时还可以带有写作时间、地点、标题、文体、分数、HSK证书等级,以及语料作者的相关信息。

四建库的方式与步骤

(一)建设方式:多方合作,互利共赢

建库目标是通过学界的共同努力,建设一个最大最好的汉语中介语语料库,以提高汉语教学与研究的效率和水平。显而易见,目前汉语中介语语料库建设普遍采用的“独家建设、自给自足”的个体生产方式与这一目标是不相适应的。因为一家的研究成果、实践经验和语料总

·106·语言文字应用2011年第2期

是有限的,所建设的语料库也难免有所不足,很难使语料库建设达到一个很高的水平。因此,语料库建设应打开大门,与国内外汉语教学单位真诚合作,共襄盛举,互利共赢,实现最充分的资源共享。

语料是语料库建设的基础,合作应从语料开始。应广泛收集汉语中介语语料,包括国内外、特别是欧美汉语学习者的语料。这样就可以改变汉语中介语语料库规模较小、语料不全的缺陷,建成一个面向全球、语料充足、可以满足一切相关研究需要的语料库。

合作方式可以多种多样。例如可以单纯提供语料,不同单位也可以根据自身条件各负责语料库建设的一个方面,已经建好的语料库还可以搭建语料库网,为用户提供最好最全的研究资源。

合作的前提是平等自愿、互利共赢。不论何种教学单位,不论以何种方式进行合作,不论做了何种具体工作,都是实际参加语料库建设的共建单位,都应在语料库的相关说明中予以公开标示;共建单位的任何人都可以高级用户身份无偿地使用语料库;如果需要,提供语料的单位可以获得一个用自己提供的语料建成的小型语料库,用来研究自己单位的教学情况,研究自己学生的汉语习得情况。

我们设想成立一个面向国内外的全球汉语学习者语料库建设委员会,负责领导、设计、安排语料库建设的具体事宜。在学界同仁的支持与配合下,建设委员会经过周密策划,精心施工,一定可以实现既定的目标,建成一个最理想的汉语中介语语料库。

(二)建设步骤

1.成立全球汉语学习者语料库建设委员会。

2.制定全球汉语学习者语料库建设实施计划。

3.研究确定语料库整体结构。

4.收集语料。

5.研制语料标注规范,并实施语料标注。

6.研制开发语料库管理软件和检索系统。

7.语料库集成。

8.语料库上网试运行,并进行相应的改进。

9.发布通告,向全球用户开放语料库。

五语料库的主要特点

(一)语料规模空前

语料来源广,规模大,书面语、口语并存,5000万字的规模在汉语中介语语料库中将是空前的,可以满足对外汉语教学与研究的任何需求.

(二)用途广泛

如此规模的语料库可以多方面反映外国汉语学习者的学习情况,可供开展多方面的研究。例如可以对外国汉语学习者在初级、中级、高级等各个阶段的汉语习得情况进行横向的断面考察,也可以对他们从初级阶段到高级阶段的整个学习过程进行全面研究;可以考察非华人华裔学习者的汉语习得过程及特点,也可以研究海外华人华裔的汉语学习及使用情况。这样就可以对汉语学习者的习得情况有一个全面、真实、具体、准确的认识,进而全面揭示学生的汉语学习规律,极大地提高对外汉语教学的效率与水平。

2011年第2期崔希亮张宝林:全球汉语学习者语料库建设方案·107·

(三)标注方式具有前沿性

汉语中介语语料库的语料标注一向采用手工方式或人标机助方式进行,全球汉语学习者语料库则将以现有语料库为训练语料尝试自动标注,一方面可以提高语料库的建设速度与水平,另一方面也将为汉语信息处理提供参考,起到一定的促进作用。

(四)采用“偏误标注+基础标注”的标注模式

张宝林(2008)提出“偏误标注+基础标注”这一语料标注的新模式,在“首都外国留学生文本语料库”的建设中,我们采用了这一标注模式。实践证明,这一标注模式是可行的。这样标注语料将可以使研究者在考察各种语言偏误现象的同时,还可以看到学习者正确的语言表现,可以从各种角度对学生的汉语习得情况进行全方位的对比、考察与研究,彻底避免在以往的研究中存在的一些尴尬现象。例如查到了学生的偏误,却查不到学生相应的正确语言表现;查到了带有标志词的病句(例如“把”字句、“得”字补语句),却查不到回避了标志词的病句。该语料库的标注新模式能使研究更全面,结论更可靠,从而提高汉语教学与研究的水平。

(五)语料库免费开放

本语料库建设周期预计为8年,每年入库625万字生语料,300余万字熟语料;随建设随开放,供各界用户研究使用(限于非商业目的)。语料库的最终目标是服务社会,服务于国家的汉语国际推广事业。

六建库的可行性

1.基于大规模真实文本的、定量分析与定性分析相结合的研究方法正在逐渐成为汉语教学与习得研究的主要方法之一。汉语中介语语料库的建设符合研究方法的这种转变与实际需要,因此,我们的建库设想得到了部分院校的大力支持。例如我们已得到北京语言大学、北京大学、中国人民大学、对外经贸大学、苏州大学、西北师范大学、哈佛大学等国内外高校的语料支持,并与中山大学、暨南大学华文学院等高校达成了合作意向。学界同道的支持是我们建成语料库的根本保证。

2.汉语中介语语料库经过十多年的建设,已经积累了比较丰富的实践经验。

例如,在语料标注方面,HSK动态作文语料库和首都外国留学生汉语文本语料库共有500多万字的偏误标注语料和约100万字的基础标注语料,已经积累了比较丰富的标注经验和比较充足的熟语料,完全可以尝试进行计算机自动标注。

鉴于汉语篇章研究的不充分,外国汉语学习者汉语表达的不规范,以及自然赋码的实际水平(杨惠中,2002:30),在语料库的标注过程中由计算机自动标注的内容并不多,除分词与词性标注可以由机器自动完成之外(仍需人工校正),大部分标注任务需要由人工完成。例如语误附码目前尚需手工进行,极为费时费力。(王建新,2005:70 71)但自动标注是方向,也是建设大规模语料库的客观需要。应该积极尝试,不断改进,以获取最终的成功。

3.计算机软硬件技术的发展为语料库建设提供了必要的技术支持。例如计算机存储与运算技术所达到的水平使我们无需考虑语料库的容量大小,汉字自动识别与数字墨水技术为语料自动标注提供了技术保障。

4.汉语中介语语料库的建设得到了国家相关机构的高度重视。例如,《2008年度国家社会科学基金项目/课题指南》共有3处提到语料库,尤其是在“对外汉语教学研究”部分提出:“今后应以教学模式研究为突破口,取得教材的创新;以汉字研究为突破口,加强书面语的教

·108·语言文字应用2011年第2期

学;以语料库建设和多媒体、网络教学等现代教育技术研究和运用为突破口,指导和带动教学理论、学习理论的研究。”这为汉语中介语语料库的建设提供了重要的政策支持。

综上所述,全球汉语学习者语料库已经充分具备了建库的主客观条件,完全具有实施建设的现实可行性。

七结语

汉语中介语语料库在汉语教学与研究中发挥着越来越重要的作用,其价值正为越来越多的人所认识。正如冯志伟(2006:14)所说:“语料库是语言知识的宝库,是最重要的语言资源。”“语料库同时也是语言学家有力的研究工具。语料库的使用,为语言学的研究提供了一种新的思维角度,辅助人们的语言‘直觉’和‘内省’判断,从而克服研究者本人的主观性和片面性,逐渐成为语言学研究的主流方法。……从某种意义上说,语料库的使用,是语言学研究的一次革命性的进步。”

鉴于汉语中介语语料库建设的现状,我们提出了全球汉语学习者语料库的建设构想,试图建设一个最大最好的汉语中介语语料库。我们真诚欢迎有志于汉语中介语语料库建设的同道参与我们的语料库建设,同心协力,共同奋斗,争取尽早建成我们共同的全球汉语学习者语料库,实现最充分的资源共享,为全球的汉语教学与研究服务。

[参考文献]

[1]陈小荷.“汉语中介语语料库系统”介绍[A].第五届国际汉语教学讨论会论文选[C].北京:北京大学出版社,1996.

[2]戴维·S·穆尔.统计学的世界(第5版)[M].北京:中信出版社,2003.

[3]冯志伟.《应用语言学中的语料库》导读[Z].北京:世界图书出版公司,2006.

[4]孙德金.外国留学生汉语“得”字补语句习得情况考察[J].语言教学与研究,2002,(6).

[5]王建新.计算机语料库的建设与应用[M].北京:清华大学出版社,2005.

[6]杨惠中.语料库语言学导论[M].上海:上海外语教育出版社,2002.

[7]张宝林,崔希亮,任杰.关于“HSK动态作文语料库”建设构想[A].第三界全国语言文字应用学术研讨会论文集[C].香港:香港科技联合出版社,2004.

[8]张宝林.“HSK动态作文语料库”的标注问题[A].数字化汉语教学的研究与应用[C].北京:语文出版社,2006.

[9]张宝林.“外国留学生汉语学习过程语料库”总体设计[A].数字化汉语教学进展与深化[C].北京:清华大学出版社,2008.

[10]张宝林.HSK动态作文语料库的特色与功能[J].汉语国际教育,2009,(4).

[11]张宝林.汉语中介语语料库建设的现状与对策[J].语言文字应用,2010,(3).

对外汉语课堂案例分析

课堂案例分析2 参照视频内容,经小组讨论,就该课堂的教学背景方面从视频中的课堂内容及授课方式可以推出以下几点:

一、教学总体流程概述 1.课堂引入 在本堂课上课前,教师提醒学生这次的课堂需要录像,希望学生回答问题的时候可以大声一点,并且与学生讨论了录像的原因及使用方法。由对话过程可以看出教师与同学之间互动良好,加之教师对录像的原因解释为传播中国文化,对学生的问题回答的角度也从较为轻松的一面出发,让同学们放下录像的紧张感,使得之后的课堂氛围也较为轻松,没有刻意准备、不自然的痕迹存在。 教师开始上课,并没有强制性地要求学生安静下来,而是提高声调与同学们问好,“同学好!”学生条件反射性地回答“老师好!”很自然地就让学生安静下来,把注意力转移到课堂上。接着,教师提问个别学生,“Tom,你好吗?”“你忙吗?”“她是谁?”“她来自哪里”“你喝咖啡吗?”等典型问句,继续吸引同学注意的同时也复习了上节课的内容,包括见面问好、询问国籍等,而且这些内容和本堂课所要教授的内容有内在的衔接之处,对学生在课

堂上积极思考起到了热身作用。 教师接着对学生介绍了本节课将要学习的内容,包括三个声母、三个韵母、如何礼貌地询问对方的姓名及如何请求某人的允许的表达法,是典型的功能型教学法的范例。 2. 3.课文讲解教学 在教授完本课的声母及韵母之后,教师开始正式进入课文的教授环节。教师先用汉语说一遍“请打开书本。”再说一遍“Please open your book.”之后又重复了一遍汉语,并用英语再解释了一遍英文义,以此来刺激学生听觉,加深学生对汉语的熟悉度,也逐渐培养一种老师和学生之间的固定课堂用语默契,一旦学生听得多了再下一次就知道什么意思了,增加了学生的汉语知识的同时也为今后的教学省去了许多麻烦。而且效果也很明显,有学生已经对这句老师重复了两遍的话感兴趣了,并且在下边跟着开始学习这种表达法。 教师先朗读了一遍课文,让学生多了一次熟悉课文的机会。接着开始逐字逐句地解释分析,在这里说几个老师讲解课文的重点及讲课的细节。 1、教师讲解课文的特点之一是逐字逐句地对每一句话进行中英文对照的翻译,对词汇句子进行语素拆分教学:可以进来吗?教师的解释为:可以means CAN or MAY,进来means come in. So this is to say, May I come in?这种教学方法我们推测可能是和教材的设计有内在的联系,因为这本《新实用汉语课本》在这最前几课的课后注释中都是没有用到任何汉字,而是直接标拼音然后用英语直接翻译在后边的,因此推测,教师遵循这种英汉准确结合的方法,将课文中每一句话都准确地翻译为英语,有助于学生理解课文,加快课堂效率。而且,从教师准确的翻译中可以看出教师拥有多年海外生活及教学背景,双语的功力深厚,例如:您贵姓?教师翻译为:What’s your honorable third name?将语体的翻译也贯穿在其中了。但是逐字逐句地用英文解释是否真的是最为行之有效,是否偶尔穿插一些简单汉语对学生的听觉进行刺激能更加有效地实现二语习得还值得商榷。 2、教师的讲解很有主次轻重之分,对于课文中有关语体的问题,虽然是重点但是不属于学生理解中的难点,教师的教授就点到即止,学生也能很快地接受。在这篇课文中涉及语体的重点词有诸如“请”或“您”。在“请”字的教学上,教师将“请”这一较难写的汉字写在了黑板上,并且进行适当的拓展来说明其语用特征,如:请进、请喝水/咖啡、请坐。而在讲解“您”时教师直接讲解说杨老师地位或威望较之陆雨平高,所以陆雨平为了表示尊敬要称呼杨老师为“您”,而杨老师可以直接称呼陆雨平“你”,这样的解释学生很容易理解和接受,不用过多的赘述。 3、教师在讲解中也有注意观察学生的反应,及时解决学生的疑问。当讲解到“他是记者。”这一句时,有学生对记者的发音存在疑虑,教师立刻做出反应,提示学生“记”字的声母即刚学到的j,在教师读了几遍之后学生还是有疑虑,教师就将记者一词的拼音标在了黑板上,败笔是“者”的拼音标错了,但这不是太严重的问题。 由此,我们还发现教师比较习惯于先在黑板上写汉字再标上拼音,但这对于汉语初学者来说也许会加大他们学习的难度,首先在初级阶段他们并没有认识多少汉字,其次从教材的设计上来看这个阶段是认拼音的阶段,所以借助先写拼音板书再加上汉字辅助的方法应该能更好地推动同学的汉语学习。 值得一提的是,教材的设计中“记者”这一词的选定也不是随便选的,因为本课的声母教学中有j,而上节课的声母教学中有zh,因此“记者”这一词语可以很好地辅助学生的声母掌握,我们推测也许正是因此,在学生针对这一词语提出问题时,教师很重视,不仅做了板书,还重复朗读了几遍以加深学生印象。 4、教师的综合课教学中最大的亮点是将中华文化的教学贯穿在课堂教学中,讲解过程层层深入,让学生在学习汉语的同时了解中华民族的传统文化。在此以“您贵姓?”这句话的教学为例进行说明,教师的教学思路为:姓(third/family name)→贵姓(a very polite way

国家级精品课程《高级英语》课程建设方案

国家级精品课程《高级英语》课程建设方案 一、建设目标:用五年时间,把高级英语建设成为一门充分践行“学生本位”、“素质本位”思想,人文色彩浓郁,时代内涵丰富,教学方法创新,教学手段先进,教学环境信息化特色突出,课程评价体系完善,自我革新能力强的高年级“核心”课程。 二、建设步骤:本课程建设将在多项“分目标”同时并举的基础上,采取分层次、有优先、有重点、逐年推进的建设方略。具体规划如下: 1.人文及时代内涵建设 (1)本课程组刚刚编写、出版的《新编高级英语教程》取材广泛,选材新颖,时代性强,人文内涵丰富,这为本课程实现未来5年的“人文及时代内涵”建设目标打下了坚实的基础。 (2)适时引入、编写一批教辅、学辅材料,进一步扩充本课程人文内涵,保持其时代性。 (3)在课堂教学中,充分挖掘现有教材的人文内涵,探索有利于培养学生人文素养和科学创新精神的授课形式。 (4)将对学生人文、科学精神的培养作为设计、开展实践课教学的基本要求之一。 2.教学环境信息化建设 (1)“高英”课堂教学网建设:A. 完善并适时更新现有的电子资料库——CAI课件,背景知识、作者简介、语言知识点、文本赏析、注释、相关话题导引、习题、试题等教辅、学辅材料;B. 逐步实现课程全部模块授课录像并上网;C. 在现有朗文、韦氏、金山词霸等在线词典的基础上,再投放几部高质量的网络词典;D. 建设网上学习资料下载平台。

(2)校园网、局域网建设与利用:A. 进一步拓展校园网的“资源”功能;B. 开展网上资源利用研讨活动;C. 进一步发掘Internet网上学习资源,提供具体链接地址。 (3)在线语料库建设:A. 探索能充分利用现有BNC、BROWN,LOB,LDC等在线语料库的教学新形式;B.适时购进1-2个切合“高英”(及其它课程)教学、科研需要的国、内外语料库(尤其是英、汉平行语料库);C.力争自主建设1-2个切合本课程及其它多门课程教学、科研需要的校本语料库。 3.教学过程建设 (1)课堂教学建设:A. 教学理念与方法:开展对学生期望的理想教学形式的调查分析,进一步探索能充分实践启发、体验式、发现式、研究式、合作式等现代教学理念的有效授课形式,拓展其内涵。B. 教学资源:探索能有效利用现有多功能教学资源形式的途径和方法;开辟新的资源形式;加强网络教学资源的动态性、再创性、多样性、结构合理性研究。C. 教学手段:探索能增强课堂感染力、提高教学效果的各种传统及信息化教学手段。D. 加强信息化学习方式(如适应性学习、WebQuest 学习,探险性学习)及其影响因素的研究。E.加强课堂教学评估指标研究。 (2)在线辅助教学建设:A. 创建网上学习社区,构筑学生自主学习平台。B. 创设BBS电子布告板系统,增加师生互动。C. 建立师生个人电子档案,探索在线教学规律。D.加强网上教学实践技术培训。 (3)实践课建设:A. 融高年级学生毕业论文写作与实践课教学于一体;B.通过实践课培养学生的体验式、探究式学习能力以及人文素养和科学创新精神;C.通过实践课为学生提供就业、创业的体验和能力训练;D.探索一切行之有效的实践课形式,培养学生获取知识的能力、创新能力,交流能力、协作能力、适应工作的能力、知人处事的能力以及灵活应变的能力。 4.革新能力建设

中高级阶段西班牙学生常见汉语语法偏误分析-2019年精选文档

中高级阶段西班牙学生常见汉语语法偏误分析 汉语属于汉藏语系, 是一种孤立语, 它在语法上跟许多语言 的差别比较大, 会导致外国学生在学习汉语时出现偏误。 本文将 以中高级阶段西班牙学生习作《西班牙的番茄节》 (下文均简称 为《番茄节》)中出现的偏误例句,对偏误进行分析和探讨,并 提出对外汉语的教学建议。 、主要的偏误类型 一)搭配偏误 外国学生学习汉语时常常会出现搭配不当的问题, 即使是到 了中高级阶段, 这种偏误也时有发生。 在《番茄节》 这篇习作中, 搭配偏误的出现率相当高,是十分典型的一类偏误。 例1 在西班牙东方的城市 Bunol 最后一个八月的周进行每 年的番茄节。 例2既然这个娱乐的参加者将近四万个人,……所以很容 易摄像城市广场和居民开始番茄投射几分钟后变成什么样。 例3 节日的参加者(全部节日居民)一律对卡车跑过去, 抓住炮弹,开始战斗。 一些国家,不能跟“城市”组成定中关系,可改为“东部”。谓 语“进行”也使用不当, 因其总是用于表持续性的和正式、 的行为,比 如“进行讨论”、“会议正在进行”,它与番茄节活 例1中 的“东方”一词是方位词, 常泛指亚洲或亚洲东部的 严肃

动不能组成动宾关系,可改为“举行每年的番茄节”。 例2中使用了关联词“既然……所以……”,构成了关联词搭配偏误,改成“既然那么……”。 例3中抓住炮弹”应改为“抓起炮弹”,“抓住”通常指 抓着某物使位置固定,显然不符合语义,造成中补搭配偏误。 二)宾语偏误 学习者有时会只关注句子整体语义关系而造成宾语误代的偏误,有时会只关注宾语的用词准确与否而造成宾语的部分遗漏。宾语的偏误也是留学生学习汉语时常见的偏误。 例1 参加者的最重要的任务是把番茄知道(掷到)旁边的他是朋友或陌生人没关系。 例2 炮弹的数量一百吨番茄。 例3 一来二去,番茄会战成为全市的普通的。 例1 中的“掷到”后边接了一个小句宾语“他是朋友或陌生人都没关系”,这个小句宾语是直接宾语,例句中遗漏了间接宾语,改为“把番茄掷到旁边的人身上,他是朋友或陌生人都没 关系”。 例2中数量”的宾语应该是具体的数量词,而不应该是番茄”,改为“炮弹的数量是一百吨”。学生没有把握好句子 的整体语义关系,导致这种宾语误加的偏误。 例3中普通的”这个词常作定语,在这里直接做“成为” 的宾语是不恰当的,而且根据上下文语境,原句应改为“番茄会

中国海外成功案例

近三年中国企业跨国投资海外并购案例分析 ——投资直接环境的分析 摘要: 随着美国经济危机在全球的不断蔓延,各国的经济遭受着不同的影响。中国在此次危机中实现“走出去”战略也受到了不同程度的影响。本文通过对近三年中国企业跨国投资海外并购的一些案例的分析,提出了一些意见和建议,对于中国在今后的跨国投资海外并购有借鉴意义。 关键词:中国在经济危机中海外投资的直接环境华为海外收购失败联想收购IBM的PC业务 2007年上半年,以美国一些大的投资银行的倒闭为标志的次贷危机的到来,使得美国的股市动荡,楼市走低,大批的投资银行、保险等公司倒闭,随即波及到全球,冰岛破产、希腊债务危机等,西方国家陷入了经济停滞甚至是负增长时期。 中国随着对外开放的战略的实施,加入世界贸易组织,国际交往的加深,也或多或少的在其中受到了一些影响。中国在近三年中在海外投资和并购的过程中有失败也有成功: 中国企业跨国并购成功案例 2010年1月6日,兖州煤业出资32亿美元并购澳大利亚菲力克斯(Felix)公司100%的股权。 2010年2月24日,鞍钢集团投资亿澳元(约合亿美元)从澳大利亚金必达(Gindalbie)矿业公司手中拿到了卡拉拉(Karara)磁铁矿的终生开采权。 2010年2月26日,武钢集团出资约4亿美元认购巴西MMX公司约的股份并获得约6亿吨资源权益;3月12日斥资6846万美元收购利比里亚一处铁矿石项目60%的股权。 2010年3月13日,中海油以31亿美元收购阿根廷布里达斯能源控股有限公司(BEH)50%的股份;当月,中海油还与英国天然气集团(BG)买入澳大利亚昆士兰LNG项目;前一个月,中海油以25亿美元收购英国塔洛石油乌干达油田股份。 2010年3月22日,中石油和荷兰皇家壳牌公司宣布以35亿澳元收购澳大利亚最大煤层气生产商箭牌(Arrow)能源公司。 2010年3月25日,华东有色以亿美元收购伯迈资产管理公司旗下朱庇特(Jupiter)项目100%的产权。中铝集团2007年收购印度同业公司,获得储量达到1200万吨铜的世界级大铜矿;2008年,收购力拓英国公司52%的股权,成为力拓英国公司单一最大股东;2010年3月,以亿美元和力拓再次合作,联合开发几内亚世界级的铁矿山。 2010年3月26日,完美时空斥资约2100万美元收购日本网络游戏运营商C&CMedia公司100%的股权。 2010年3月28日,吉利与福特汽车签署最终股权收购协议,以18亿美元获得沃尔沃轿车100%的股权以及相关资产(包括知识产权)。 2010年4月22日,国内最大的民营软件外包企业博彦科技集团全资收购了

【CN110110336A】一种面向藏汉机器翻译的藏语句法语料库的构建方法【专利】

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910368324.3 (22)申请日 2019.05.05 (71)申请人 西北民族大学 地址 730030 甘肃省兰州市城关区西北新 村1号 (72)发明人 万福成  (74)专利代理机构 西安研创天下知识产权代理 事务所(普通合伙) 61239 代理人 杨凤娟 (51)Int.Cl. G06F 17/28(2006.01) G06F 17/27(2006.01) (54)发明名称 一种面向藏汉机器翻译的藏语句法语料库 的构建方法 (57)摘要 本发明公开了一种面向藏汉机器翻译的藏 语句法语料库的构建方法,包括以下步骤:A、将 具有句对齐结构的平行语料库中的藏语句子进 行词性标记;B、利用词对齐工具将藏语句子中的 词汇进行词对齐,形成藏语词、汉语词对齐匹配 形式;C、利用树库制作工具,将具有词性标记和 词对齐信息的藏语词逐个进行短语标记;D、运用 自增模式,扩展藏语句法语料库。本发明能够解 决藏语句法语料库稀缺的问题,从而提高翻译质 量。权利要求书1页 说明书3页CN 110110336 A 2019.08.09 C N 110110336 A

权 利 要 求 书1/1页CN 110110336 A 1.一种面向藏汉机器翻译的藏语句法语料库的构建方法,其特征在于,包括以下步骤: A、将具有句对齐结构的平行语料库中的藏语句子进行词性标记; B、利用词对齐工具将藏语句子中的词汇进行词对齐,形成藏语词、汉语词对齐匹配形式; C、利用树库制作工具,将具有词性标记和词对齐信息的藏语词逐个进行短语标记,并逐层进行合并直至形成一个完整的句法树; D、运用自增模式,扩展藏语句法语料库。 2.根据权利要求1所述的一种面向藏汉机器翻译的藏语句法语料库的构建方法,其特征在于,所述步骤B中将藏语句子中的词汇进行词对齐的方法包括以下步骤: a、运用词对齐工具训练双语句对齐平行语料库; b、以词对齐中间结果作为藏语汉语词匹配形式,并形成具有类似括号匹配的形式; c、将词对齐的结果以及词性标注的结构统一处理成具有括号匹配形式的内容,提供下一步处理作为输入。 3.根据权利要求1所述的一种面向藏汉机器翻译的藏语句法语料库的构建方法,其特征在于,所述步骤C中逐层进行合并直至形成一个完整的句法树的方法包括以下步骤: a、将具有括号匹配形式的带有词性标记和词对齐信息的各个单元输入到树库制作工具中; b、以词性为基础,逐个将以词为单元的内容合并,并以短语标记结尾; c、逐个合并短语结构标记为新的短语结构标记,最终合并成一个句子,并标注以句子标记结尾。 4.根据权利要求1所述的一种面向藏汉机器翻译的藏语句法语料库的构建方法,其特征在于,所述步骤D中运用自增模式扩展藏语句法语料库的方法包括以下步骤: a、将人工制作的藏语句法语料库作为训练语料库,运用BerkerleyParser句法分析器作为句法分析工具; b、解码测试语料库,得到待人工校对的藏语句法树; c、人工校对藏语句法树的结果,将校对后的结果加入到训练语料库中,继续步骤a,以这种模式扩展藏语短语句法树库。 2

(完整版)对外汉语教学中高级阶段功能大纲

对外汉语教学中高级阶段功能大纲 前言 一、本大纲的制定 对学习者来说,其语言学习的初级阶段是基本言语能力形成的过程,中高级阶段则是交际能力逐步熟练的过程,是使语言成为言语习惯、言语行为的过程。在初级阶段向中高级阶段转化的过程中,更需要课堂教学的交际化,这一认识是我们多年来对外汉语教学的实践总结。在20多年的课堂教学和教材缩写中,我们逐步认识到,仅理解和掌握某些词汇和言语知识是不够的,如:课文练习中的词语解释、理解重点词、近义词辨析、联词写话等练习对扩大词汇量无疑有很大的帮助,但在具体的言语环境中使用起来常常出现偏误,如果在教学中注意语法、语义、语境的有机结合,就能正确地掌握和运用。基于以上认识,我们编制了这部包括功能、意念、情景、文化等多种因素的综合性大纲《对外汉语教学中高级阶段功能大纲》(下称《大纲》),以作为对中高级阶段对外汉语教学的指导和规范。 二、中高级功能顶目的分类及功能大纲的等级特性 《大纲》在选择功能项目时充分考虑了交际的普适性和通用性。汉语的功能项目浩繁、复杂,功能项目的范围到底有多大,很难给出一个确切的数字,因此,我们所选取的功能项目是根据实际教学的需要筛选出来的。 《初级功能大纲》(杨寄洲主编)共选用121个功能项目。根据中高级阶段学习者的交际需

要,本大纲在《初级功能大纲》基础上有所增补,扩展为152项,归纳为7大类。这7大类是: l.社交活动中的表达功能; 2.对客观情况的表述; 3.对理性认识的表达; 4.对主观感情的表达; 5.对道德情感的表达; 6.表达使令; 7.交际策略的表达。 本大纲中的许多功能项目与《初级功能大纲》是共同的,其差别体现在言语形式的简单与复杂及出现的先后顺序上。有些较简单的言语形式,由于重音、语调乃至语境变化等多种因素的影响,功能会产生变化。在中高级阶段,由于学习者的语感能力增强,对这样的言语形式,只要教师稍加提醒和引导,学生就能理解和掌握,因此,在我们的大纲中没有将其全部列出,在教学实践中可以自行补充完善。 另外,许多功能项目用以表达的言语形式繁多,不能在初级阶段不加控制地给予学习者,需要合理地分配在不同阶段。我们的选择和分配依据国家对外汉语教学领导小组办公室汉语水平考试部编制的《汉语水平词汇和汉字等级大纲》和《汉语水平等级标准与语法等级大纲》,超纲部分浮动在20%左右。 语段和语篇所表达的功能近年来在教学中引起普遍关注。我们在编写《大纲》的过程中力图在这方面有所加强,哪怕是点滴的,或许还没被语言学界普遍承认的,只要对教学有利,也编入了《大纲》。但语段的功能多数不是单一的,选择起来难度较大。我们的做法是确定其语义中心或焦点,以此定位其功能,在使用过程中再加以调整。

《对外汉语教学入门》笔记周小兵主编

对外汉语教学入门笔记 周小兵,李海鸥 上编主要介绍学科建设以及教学方法,中编主要介绍语言要素以及文化教学,下编主要讲语言技能教学机测试。 第一编 一教学简论 1.语言学习的基本概念 第一语言第一语言是指孩子最早习得的语言,也就是从父母或者周围其他人哪里自然习得的语言。 第二语言第二语言是指在第一语言之后再学习的其他语言。 目的语目的语是指学习者正在学习的语言。它的涵盖性强,可以包括第一语言,第二语言,母语,外语,本族语,非本族语,标准语,方言等。不管是什么语言,只要是一个人正在学习并希望最终掌握的语言,都可以成为目的语。 习得与学习 习得是指从周围环境中通过自然学习过的某种能力。比如说,幼儿站立,行走,饮食的能力,就是自然习得的。习得无需专门的教师,专门的教学。习得理论包括强化论,传递论,内在论,认知论等。 学习是从阅读,听讲,研究,实践,训练中获得知识和技能。多数情况下,学习是指在专门场所由专门教师实施的专门教学,应该有教学计划,教材,教学实施和测试。学习包括信号学习,刺激—反应学习,连锁学习,多种辨别学习,言语联结学习,概念学习,原理学习和解决问题的学习等。 2.第一语言习得和第二语言学习的差异 儿童第一语言习得和成人第二语言学习的区别主要表现在主体,动机,环境,方式,教育者及相关因素,过程和文化等方面。 3.基础学科和相关学科 对外汉语教学的产生本身就是多学科交叉的结果,相关学科主要有神经生理学,心理学,语言学,教育学等。 二.第二语言习得研究 第二语言习得研究始于20世纪70年代,并很快成为应用语言学中最有影响的部分。 1.对比分析 行为主义学习理论习惯和偏误是行为主义学习理论的两个重要概念。 对比分析的内容对比分析假说的心理学基础是行为主义心理学。假说有两派:强硬派和温和派。对比分析的语言学基础是结构主义语言学。它强调对语言进行细致描述。 对比分析遭遇的批评20世纪60年代以来,对比分析假说在发展中受到的批评主要来自一下三个方面:非干扰性偏误的事实,理论批评和来自实践的批评。 对比分析的发展对比分析在三个方面有了明显发展:回避,相似等级和干扰是学习者的策略。汉外对比分析汉外对比有宏观、微观两类。 2.偏误分析 偏误分析的步骤和作用 Corder曾详细描述了偏误分析的五个步骤:语料选择,偏误识辨,偏误分类,偏误解释和偏误评估。 偏误类别包括语际偏误、语内偏误和认知偏误。 3.中介语及其变异 中介语中介语的概念是:学习者在二语习得过程中构建的,既不同于母语又不同于目的语的

(马燕华)高级汉语阅读课教案

(马燕华)高级汉语阅读课教案 高级汉语阅读课教案马燕华撰写 《人与动物》 一教学对象 学习此课时,学习对象已经学习了2000学时左右的汉语,掌握的汉语词汇量在3500以上。在不借助工具书的条件下,能比较准确、流畅地阅读非专业性汉语书面材料,能理解汉语一般隐喻现象,了解汉语与自己母语的常见隐喻手法的差异。 二教学内容 本课程为泛读课程,主要训练学生在限定时间内不借助工具书,比较准确地阅读汉语书面材料的能力。 本课由两篇阅读材料组成:《藏羚羊跪拜》、《猫》。 教学内容是: 1 把握阅读材料主旨:老猎人不再狩猎的真正原因(《藏羚羊跪拜》) “我”家养的三只猫的特点; “我”家后来不再养猫的原因(《猫》) 2 准确理解阅读材料读中的关键性语句(详见“阅读练习”); 3 理解书面词语的意义(详见“阅读练习”); 4 领会阅读材料中某些隐喻现象:“软”隐喻怜悯(见《藏羚羊跪拜》); 5 学会汉语书面语表示某省某一部分的格式(见《藏羚羊跪拜》); 6 学会汉语称呼女佣的表达法(见《猫》); 三教学目标 教学目标:在限定时间内不借助工具书做完阅读练习,大部分学生的正确率

达到60,70,; 教学重点:阅读材料的主旨; 某些汉文化含量较高的语句含义。如, 眼睛一亮、心头一软、云游四方、朝别藏北雪,夜宿江河源,饿 时大火煮黄羊肉,渴时一碗冰雪水(见《藏羚羊跪拜》); 花白的毛、怂恿、毫无生意、诅咒(见《猫》) 汉语书面语表示某省某一部分的格式(见《藏羚羊跪拜》): 省的简称,方向词 汉语称呼女佣的表达法(见《猫》): 姓氏,嫂/婶/妈 四教学方法 先让学生在限定时间内不借助工具书阅读材料,完成阅读练习。要求每题必做。然后让学生们按座位顺序依次回答练习答案,边对练习答案边讲解教学重点。 1 五教学过程 本课共用两课时。 第一课时教学步骤(因课间不休息,第一课时实际上课时间70分钟) 1 简要介绍本课主题,指导学生先仔细阅读教材中“阅读提示”。因为每篇阅读材料标题之上的“阅读提示”都是针对文章的主旨、脉络来设计提 问的。仔细阅读“阅读提示”便于激活阅读者知识结构中的相关知识。 2 学生在阅读和做阅读练习时,要求做到三条: 1独力思考 ? 2每题必做 ? 3限时完成 ?

语料库检索分析在高级英语语篇教学中的应用_语料库检索

语料库检索分析在高级英语语篇教学中的应用_ 语料库检索 语料库检索分析在高级英语语篇教学中的应用_语料库检索摘要语料库语言学通过对自然文本的检索、统计,实现文本的语篇结构、文体风格、语言特征等的量化分析。语料库软件工具如Wordsmith、Concordancer软件等为语篇教学提供了量化分析手段。本文依据语料库语言学的研究方法,主要运用Wordsmith、Antconc软件,以课文"Blackmail"为小型教学语料库,探索高级英语语篇教学的新途径。 关键词语料库检索分析;高级英语;语篇教学1.引言高级英语是英语专业高年级阶段的一门主干课程,其教学目标是"通过阅读和分析内容广泛的材料,扩大学生知识面,加深学生对社会和人生的理解,培养学生对名篇的分析和欣赏能力、逻辑思维与独立思考的能力,巩固和提高学生英语语言技能"1。鉴于此,围绕高级英语课程的教学研究与改革长期以来备受专家、学者和广大师生的关注,如朱传枝2、杨志亭3、刘采敏和楚向群4、李洁平5、黄文英6等。十多年来,随着语言教学理论研究的深入以及计算机网络和多媒体技术的快速发展,高级英语课程改革成绩斐然,教学效果显著提高。然而,在语篇教学中不难发现,由于缺乏科学的文本分析手段和工具,学生对语篇的分析和欣赏"多来自

教师在反复阅读全文的基础上根据某种理论框架或自身独特的理解能力及审美取向所做的解释"7,或者依赖于教学参考书籍上的注解,学习效果大打折扣,成为了困扰教师的一大教学瓶颈。语料库语言学的出现为高级英语语篇教学提供了有力的理论和技术支持,对于解决教学中存在的难题有着重大的启示和意义。 2.语料库与语料库检索分析软件的应用20世纪90年代以来,语料库语言学的迅速发展"给语言研究以及语言应用研究带来了一场革命性的变化"8,而"基于语料库的研究方法已经逐渐扩展到语言教学、话语分析、翻译研究、词典编纂和自然语言处理等多个领域"9。语料库语言学以真实的语言数据为研究对象,通过对大量语言事实进行分析,寻找语言应用的规律和模式。由于语料库研究中的统计数据以实际使用中语言现象的出现概率为依据,且基于语料库而得到的数据避免了偶然性,从而提升了分析结果的可信度。 因此,语料库语言学为语言研究和教学提供了一种全新的模式。 随着计算机信息技术的日新月异,语料库为语言研究提供了空前广泛的语言资料。目前,国际上影响较大的语料库有英国COBUILD语料库(CollinsBirminghamUniversityInternationalLanguageDatabas e)、BNC英语国家语料库(TheBritishNationalCorpus)、CIC 语料库CambridgeInternationalCorpus、ICE语料库

对外汉语中高级阶段词汇教学法探讨

对外汉语中高级阶段词汇教学法探讨 【摘要】对外汉语教学中,词汇教学始终是重中之重。可以说留学生汉语水平的高低取决于其汉语词汇量的大小。所以如何快速扩大学生的词汇量,提高其汉语水平,既是对外汉语教学的重点,也是教学的难点。 【关键词】对外汉语;中高级词汇;教学法 对外汉语教学中,词汇教学贯穿始终,是语言教学的基础之一。一个在目的语国家学习的外国学生,即使语音不好,语法不通,可是他如果掌握了一定量的词语,就能交际。实践证明,要学好第二外语,掌握大量的词汇是关键。因此,在对外汉语教学中尤其是中高级阶段如何运用好词汇教学方法,快速扩大学生词汇量具有非常重要的意义。本文就对外汉语中高级词汇教学技巧作些探讨。一、词汇展示的技巧 展示词汇就是教师把所要教的词通过某一方法介绍给学生,并让学生认读,从而使学生对所学词的形、音、义有所了解,让学生掌握词语的用法。中高级阶段常见的词语排列式有以下几种形式:1.按词类排列展示 把课文中的生词按照不同词类排列后展示,常常以表格形式出现。这种排列方法从词的语法功能出发,便于将来进行词语的搭配练习,并帮助学生建立词类的概念。 2.相关排列 教师根据词与词之间意义的相关性,对生词表中的生词进行排列

组合。这种排列的方法在于帮助学生记忆。 3.串联排列 按照生词在课文中出现的顺序排列。认读后教师以排列好的生词为线索叙述或串讲课文。学生以生词为提示线索,听教师串讲课文或复述课文,教学的各个环节都围绕着生词进行。这种方法适用于精读课,口语课和听力课等多种类型。大多教材上也是这样排列的,教师可以直接使用。 4.分话题排列 教师根据当天课所要讲练的内容,把生词按不同的话题分组排列。如谈家庭就按照家庭成员和相互关系排列等。这种排列的好处是生词的讲解和运用有机地融为一体,学以致用,记忆深刻。适用于精读课和口语课的教学。 二、词汇释义的技巧 解释词汇就是将所要讲授的词汇的意义及用法给学生加以解释。词的用法包括词的语法功能及特点,词在句中的位置,词的语境义,词的搭配,词的使用范围等。 1.以旧带新法 用学生已经学过的汉语词汇来解释新词。在解词时老师可启发学生用已经学过的词自己解释词义,然后再给以归纳,纠正。 2.利用语素释义 语素释义主要是讲清楚某个语素的形、音、义和用它构成词的方式。比如:“操场”的“场”,告诉学生“场”的意思相当于ground

语料库常用统计方法

3.5语料库常用统计方法 第3章前几节对语料库应用中的几种主要技术做了介绍。通过语料检索、词表和主题词表的生成,可以得到一定数量的句子、词汇或结构。为能更好说明所得到的结果的真正意义,常常需要对它们加以统计学分析。本章主要介绍语料分析中的一些常用统计方法。 3.5.1 语料库与统计方法 介绍相关统计方法之前,首先需要了解为什么语料库应用中需要运用统计方法。在2.1节讲到文本采集时,我们知道文本或会话构成了最终的语料库样本。这些样本是通过一定的抽样方法获得的。研究中,我们需要描述这些样本的出现和分布情况。此外,我们还经常需要观察不同语言项目之间在一定语境中共同出现(简称共现)的概率;以及观察某个(些)语言项目在不同文本之间出现多少的差异性。这些需要借助统计学知识来加以描写和分析。 理论上说,几乎所有统计方法都可以用于语料库分析。本章只择其中一些常用方法做一介绍。我们更注重相关统计方法的实际应用,不过多探讨其统计学原理。这一章我们主要介绍语料分析中的频数标准化(normalization )、频数差异检验和搭配强度的计算方法。 3.5.2 频数标准化 基本原理 通常语料检索、词表生成结果中都会报告频数(frequency, freq 或raw frequency )。那么某词(如many )在某语料库中出现频数为100次说明什么呢?这个词在另一个语料库中出现频数为105次,是否可以说many 在第二个语料库中更常用呢?显然,不能因为105大于100,就认定many 在第二个语料库中更常用。这里大家很容易想到,两个语料库的大小未必相同。按照通常的思维,我们可以算出many 在两个语料库中的出现百分比,这样就可比了。这种情况下,我们是将many 在两个语料库中的出现频数归到一个共同基数100之上,即每100词中出现多少个many 。这里通过百分比得到的频率即是一种标准化频率。有些文献中标准化频率也称归一频率或标称频率,即基于一个统一基准得出的频率。 实例及操作 频数标准化,首先需要用某个(些)检索项的实际观察频数(原始频数,raw frequency )除以总体频数(通常为文本或语料库的总词数),这样得到每一个单词里会出现该检索项多少次。在频数标准化操作中,我们通常会在此基础上乘以1千(1万、1百万)得到平均每千(万、百万)词的出现频率。即: 1000?=总体频数 观测频数标准化频率(每千词) (注:观测频数即检索词项实际出现的次数;总体频数即语料库的大小或总形符数。) 例如,more 在中国学生的作文里出现251次,在英语母语者语料中出现475次。两个语料库的大小分别为37,655词次和174,676词次。我们可以根据上面的公式很容易计算出251和475对应的标准化频率。另外,我们还可以利用Excel 或SPSS 等工具来计算标准化频率。比如,可以将实际观察频数和语料库大小如图3.5.1输入相应的单元格,然后在C1单元格里输入=(A1/B1)*1000即可得到中国学生每千词使用more 约为6.67次。要得到母语

对外直接投资案例分析

我国汽车企业对外直接投资与技术创新 ——奇瑞成功案例分析 2009年以来,在金融危机和贸易保护主义的双重夹击下,中国汽车出口市场一片黯然。据海关统计,2009年前5个月,我国出口汽车12.1万辆,价值17.3亿美元,比2008年同期分别下降60.4%和54.7%。特别是加工贸易出口下降了73%。几大主要的汽车出口市场非洲、东盟、俄罗斯、乌克兰等都出现了不同程度的降幅,俄罗斯和乌克兰的下降幅度更是高达96.2%和95.3%。汽车出口市场的这个节点被诸多中国汽车企业家称为“危”“机”并存的时刻。在这样一个特殊时期,出口急剧减少。但海外投资却日渐增加。中国车企海外扩张举动表明:自主品牌已经从对外贸易进入到资本输出的阶段。在众多中国车企中,奇瑞的海外扩张举动无疑是最成功的,而奇瑞之所以能够成功的关键是在对外直接投资中坚持技术创新。奇瑞通过对外直接投资在全球范围内充分整合资源,通过开展深度化、广泛化的国际合作。大幅度降低了整车制造和开发成本,缩短了开发周期,激发企业的创新活力。 一、奇瑞对外直接投资的历程 奇瑞汽车是国内少数在创业生产周期进入国际创业阶段的企业之一,在短短几年内,奇瑞完成了它的国际化创业过程,从出口开始,然后海外建厂,此后开始走国际化路线。奇瑞开始出口的主要市场是中东地区。2001年10月意外接到了出口叙利亚的第一笔定单,打破了长期以来国产轿车零出口的记录。之后奇瑞汽车开始出口叙利亚,伊拉克,伊朗,埃及,孟加拉,古巴,马来西亚等十余个国家。2003年,在伊朗合作建立了一个CKD整车厂。2004年初,古巴购买了奇瑞汽车作为古巴的国务院用车,随后,古巴的政府企业副总裁又带来了1100台轿车的订单。2004年12月,阿拉多公司以整车进口的方式将10000辆QQ运抵东盟市场,扩大了奇瑞在当地的影响力。在2005年奇瑞还进入了马来西亚的市场。同年它实现了出口西方的梦想,奇瑞与美国梦幻汽车公司秘密签约,向美国市场出口汽车,但在合资厂商仍占主要地位的国家市场中,竞争异常激烈,而且欧美等汽车工业发达国家已经形成了坚固的贸易壁垒,在这种情况下,奇瑞开始通过对外直接投资在竞争中站稳脚跟,对外不断加大了在海外建厂的力度。

对外汉语学习者的分析

对外汉语学习者的分析 在中国国内,外国人学习中文者基本由三类人构成:一类是真正对中华语言和文化感兴趣者,这部分以年纪较长者居多;第二类是希望利用汉语作为自身求职和发展,特别是在中国发展的重要筹码,这类人绝大多数都是比较年轻者,以留学生或交流生居多;第三类,定居或工作在中国的同时,为了生活或工作更加便利的需要,同时还希望利用汉语的学习来自我增值,但又不完全依赖汉语作为谋生的手段,这类学习者中特别以日本韩国等亚洲国家来华工作或生活者居多,其次是欧美澳等英语国家人士,例如在外企担任管理层工作的外国主管等。然而,这三类人中,第一类的数量是三者中最少的,但其学习的动机纯正,学习劲头最足,学习态度也最为端正,是中外文化沟通交流的中坚力量,他们经常在学校或专门聘请家庭教师进行中国语言和文化的学习,对老师水平的要求较高,老师需要对语言和文化较为深入甚至偏僻的知识有所掌握,从而才能应对他们千奇百怪而又确实存在的问题。第二类学习者的数量居中,这部分学习者的学习认真程度高,但动机也很单纯直接,就是为了以汉语为语言和文化工具,掌握汉语和与中国人打交道的方法技巧,从而自我增值,进而利用这一特长来找工作机会,因此这也就决定了这类学习者追求的是较为正规,一般以高校内学习为主,且能保证教学效果好的教学模式。 第三类人是大量的在中国居住工作和生活的人,以亚洲国家居多,他们学习模式也多具有以下特点:短期的,灵活性强,重视口语实用性,学习时间不定等等。他们参与汉语培训的时间地点多根据自身的业余时间决定,有在高校短期汉语培训班中学习的,有在培训机构开设的汉语学习班中学习的,也有聘请兼职对外汉语教师在住处进行一对一辅导的,他们是短期对外汉语培训主要的顾客。他们的数量是十分可观的,也因此带动和保证着相当数量的对外汉语培训机构或单干的兼职或全职对外汉语教师。 以上是对在华学习中文的外国人根据其参加学习的特点进行的大概分类,虽然不能完全概括所有的外国学习者情况,但基本上把主要的三大类外国学习人群涵盖其中。通过这样的分类和分析,我们可以看出,在近期乃至相当长的一段时期内,这三类外国学习者将是对外汉语教学的主要对象,也是国内对外汉语教师需要分析其学习特点和规律,进行有针对性教学的研究对象。而作为有较自由职业安排的对外汉语教师,针对第一类和第三类人,应该是作为自己重点寻找和维系的学生群体,与他们的联系和关系的扩展是个体对外汉语教师寻找“顾客”的重要途径。 来源:儒森汉语

基于语料库的海明威作品《雨中的猫》分析

基于语料库的海明威作品《雨中的猫》分析 ——以写作风格和小说主题为例 王树振 (天津师范大学外国语学院,天津, 300387) 【摘要】美国著名作家厄内斯特·海明威的短篇小说《雨中的猫》(1922),自发表以 来便引起文学评论界的极大关注。在作品中,通过对一个日常生活片段的叙述,作者 揭示了女性生存困境的主题。而基于语料库的文学研究,则是通过利用语料库检索软 件来考察作者的写作风格、解读作品的主题。在前人研究的基础之上,笔者拟运用语 料库语言学的方法对这部小说进行更深入的研究。通过使用Wordsmith和AntConc等 语料库检索软件,笔者拟对《雨中的猫》进行词语、句子及篇章结构进行统计分析, 最后不仅能够分析得出海明威用词简单、句子简短的写作风格,还能利用关键词检索 和自动生成的语境,来了解小说的主要内容和人物形象的塑造,这为解读小说的主题 提供了新的研究方法和途径。 【关键词】语料库检索;写作风格;主题 近年来, 国内外不少学者将语料库研究方法应用到文学领域,利用语料库检索软件对文本进行分析, 如Sinclair(1991)、Biber(2000)、张厚振(2004)、肖普勤(2005)等。他们的研究大胆创新,为后来的文学研究者带来很大的启示。正如Sinclair(1991: 36)所论述的那样,“(语料库检索)最激动人心的方面不是对描述进行直观的分类,而是为找到新的方法、新的证据以及新的描述提供可能。在这里,计算机技术的客观性和表面的正当性变成了一种优势,而不是没有放弃直觉前提下的一种责任。当然,我们要尽力找到符合证据的解释,而不是为了迎合现有的解释而去修改我们的证据。” 《雨中的猫》是美国著名小说家海明威的著名短篇,故事情节主要围绕一只雨中的猫展开,叙述了旅居意大利的一对美国夫妻的一段生活场景。本文用Wordsmith及AntConc的Wordlist、Concordance和Keyword对《雨中的猫》的文本特征、主要内容、人物形象和文本主题进行分析,以展示语料库检索软件在文学分析方面的强大功能。 一、基于词表的文本总体特征分析 基于语料库的语言研究一般采取定性与定量相结合的研究方法,要进行定量研究就要涉及文本检索和数据统计。Wordsmith软件中的Wordlist工具可以对文本的基本信息进行统计,自动生成词表(图1)。它可以提供文本中的简略统计数据,从而有助于分析文本的总体统计特征和基本情况。

浅析初级汉语学习者词汇记忆的个案研究.doc

浅析初级汉语学习者词汇记忆的个案研究 - “ 关键词:初级汉语词汇记忆心理对外汉语 摘要:本文采用个案研究的方法,对一位印度语背景的初级汉语学习者的词汇记忆过程进行了跟踪观察,将结果按照词性分类,并从心理学角度对被试词汇记忆的现象进行了讨论,总结出四点对对外汉语教学的启示分别为:不同复述方式保证长时记忆效果;深度加工与刻苦学习相结合;利用情绪,提高主动记忆意识;利用首因、近因效应有重点地帮助学生识记单词。 一、引言 词是语言中最小的能够独立运用的结构单位,也是构成句子的基础材料。词汇教学在对外汉语教学中具有举足轻重的地位,对词语的有效记忆是学生掌握和运用词语的基础。从心理学角度来看,记忆是个体在头脑中对其经验进行识记、保存和提取的心理过程,比如人们过去感知过的、思考过的、体验过的和行动过的事物都会以映像的形式保留在人的头脑中,在必要的时候可把它们重现出来,这个过程就是记忆。记忆包括识记、保持、再认和回忆等几个基本环节。目前对外汉语教学中对词汇记忆方面的研究很少,且限于理论,对词汇记忆效果的讨论缺乏有力的客观证据,很多方法都是人们猜测的结果,既不系统也不深入。 本文用个案调查的方式,对一个短期培训的印度留学生进行了一个月的跟踪调查,观察记录了其词汇学习和记忆过程,并试着从心理学角度对发现的规律性现象和问题进行分析解释,以期

通过研究学生“怎么学”的问题,更好帮助教师解决“怎么教”的难题。 二、个案调查 个案调查中笔者对调查对象进行了为期一个月的跟踪观察。被试为笔者的辅导对象,笔者每周辅导其4次,基本掌握了被试汉语学习过程中的问题和采用的学习策略。笔者将整个过程进行录音、整理、归纳,从中得出了被试的词汇记忆规律和倾向性特点。 (一)调查对象情况 N,男,25岁,母语为印度语,第二语言为印度英语,同时会很多印度方言,语言背景复杂,但来北京前没有任何汉语基础。被试所用教材为北京语言大学出版社出版的马箭飞主编的《汉语口语速成(上)》。N每周一至周五上午有4小时汉语课,下午两小时辅导课。(二)调查方法 笔者利用课间,有重点地和被试讨论其词汇记忆的方法并让N自己总结记不住的原因。笔者有时会根据当日课程设计出有助于记忆的方法,在辅导中应用,隔天再次提问以检验记忆效果。同时在辅导过程中,观察被试对不同词语的记忆难度并记录。 (三)调查结果讨论 调查中的词汇记忆指长时记忆。现象综合了笔者对N的词汇记忆结果的观察和N对自己记忆过程的描述。 1.名词的记忆 亲属、时间、方位类名词容易混淆,一般的处所、职业类名词很快就会忘记。但也有一些名词如“秘密、图书馆、爸爸、妈

对外汉语教学慕课分析

对外汉语教学慕课分析 一、汉语教学慕课的总体情况分析 我们搜索了coursera、学堂在线、华文慕课、好大学在线、中国大学MOOC 平台上的汉语慕课,发现截止到2018年11月已有26门③课程上线,制作院校包括清华大学、北京大学、上海交通大学、北京语言大学、北京师范大学、国立台湾大学等。详细数据见表2。汉语教学慕课2014年开始在coursera上线,最早的汉语慕课是北京大学的“汉语入门”,自2014年以来,陆续有26门慕课上线,其中2018年新上线的课程最多,达到9门,是有汉语教学慕课以来,增长速度最快的一年,慕课发展呈现出方兴未艾的势头。目前上线的26门慕课,可以分为四大类课程:语言要素类课程、汉语综合类课程、专业汉语类课程和HSK 专项课程(见表3)。从表3可以看出,语言要素课主要集中在语法课上;专项课程主要专门为HSK设置的课程;专业汉语课程主要是商务汉语课;综合汉语课程最多,主要是初级汉语教学课程,其中面向零起点学习者的课程有6门。上述四类课程在教学内容和教学目的上有较为清晰的界限,语法类课程是属于语言知识类课程,商务汉语有特定的教学内容和教学目标,HSK课程主要围绕HSK 大纲展开,而汉语综合类课程具有第二语言(外语)教学课程的代表性特征,是语言教学类课程中的典型代表。本文选取面向零起点学习者的基础汉语课程为分析对象,一是因为这类课程是典型的第二语言教学类课程,同时这类慕课数量较多;另外这类课程教学内容相近、同质性强,具有可类比性,所得出的分析结论,具有代表性。 二、初级汉语教学慕课分析 在六门汉语基础课程中,本文选择四门面向零起点学生的汉语慕课作为考查对象,这四门课程是:北京大学的“汉语入门”、清华大学的“清华对外汉语”、北京师范大学的“汉语初级口语”和北京语言大学的“功能汉语速成”。这四门课程

相关主题