搜档网
当前位置:搜档网 › 基于语料库的《经济学人》中文本的词块分析

基于语料库的《经济学人》中文本的词块分析

基于语料库的《经济学人》中文本的词块分析

【摘要】随着认知学研究的发展,单词不再是语言信息处理的唯一单位,在语言理解和语言产出中存在着词块这样一种理想的单位。从20世纪80年代至今,随着语料库语言学的发展,人们能够更加客观的认识语言。人们发现,在人的大脑中储藏着很多固定化或半固定化的语言结构,这些结构兼有句法和词汇的双重特征。这些词块不仅在语言的习得中扮演着重要的角色,而且帮助人们更简单,流利地产出语言。因此对自然语言中词块的使用进行研究是具有价值的。《经济学人》中的文章常常被用于大学生英语考试的阅读的初始材料。研究《经济学人》中文本的词块特征对英语考试阅读能力的提高有着重要的作用。在以往的研究中,有不少对大学生英语考试中的作文词块的研究,对英语考试中阅读材料的初始材料的词块的研究是比较少的。因此,这篇论文试图建立一个关于《经济学人》文章中语块的微型语料库。借助于Antconc软件提取一些36词的词块。按照一定的标准进行人工筛选确定词块。根据Altenberg的分类标准,将语块的结构分为完整分句,分句成分和不完全词组3个类别。研究结果表明词块的长度和词块出现的频率成反比。3种词块类型中分句成分所占比例最大,而完整分句所占比例最小。

【关键词】词块;语料库;阅读理解

引言

20世纪80年代以来,大型计算机语料库的丰富发展给语言学家们提供了一个研究自然语言的新发展。人类语言中存在着大量的固定化和半固定化的表达结构。它们储藏在人类大脑中供提取和运用。大约70%的口语都是由词块产生的。词块的存在加快了语言处理的速度,对语言习得和语言输出的流利性和地道性都具有重大的意义。因此,近年来,在语言使用中对于词块的研究更为广泛。许多前人的研究都主要是理论化的研究,对多词语集合的不同视角研究进行对比,提出一些新的分析方法模式。Weinert 确定了两种基本的研究问题:确定固定的词语集合,分析其语篇功能。对这两类研究问题出现了大量的实证研究。然而对如何定义这些多词语集合,用什么样的方法来研究它们,却很少达到一致。

《经济学人》中的文章常被用于编写大学英语考试的阅读理解部分。因此了解这其中的一些常用的词块能够提高学生的阅读理解能力。对于阅读理解原始材料的语料库相关的研究比较少见。论文试图建立一个语料库,通过Antconc软件提取一些不同长度的词块,分析他们的结构和语用特征。借此希望通过提高学生对词块的了解来提高学生阅读理解的能力。

1 文献综述

1.1国外的研究

Becker(1975)是第一个较详尽地研究词块的人,他认为那些固定的或半固

相关主题