搜档网
当前位置:搜档网 › 第八章 句法分析

第八章 句法分析

句法结构中的语义分析

句法结构中的语义分析 学习要点:掌握句法结构分析中运用语义关系、语义指向、语义特征三种语义分析方法,并且能够运用这些分析法解释一些常见的语言现象。 句法结构是句法形式和语义内容的统一体。对句法结构不仅要做形式分析,如句法层次分析、句法关系分析、以及句型分析等,还要做种种语义分析。句法结构中的语义分析主要指语义关系、语义指向、语义特征三种分析法。 一、语义关系 (一)句法关系和语义关系 在句法结构中,词语与词语之间不仅发生种种语法关系,主谓、述补、述宾、偏正、联合等,而且发生种种语义关系。语义关系,语义学中指语言成分所表示的客观对象之间的关系,我们所说的语义关系是指动作和动作者、动作和受动者、动作和工具、动作和处所、事物和事物之间的关系等。句法关系和语义关系可能一致,也可能不一致。 ⑴吃面条。/削苹果。(句法、语义关系一致。) ⑵我吃完了。/饼干吃完了。/文章写好了。(句法、语义关系不一致) 前者“我”与“吃”是动作者(施事)和动作的关系,后者“饼干”和“吃”是受动者(受事)和动作的关系,结果和动作的关系。 一种句法结构关系,可能包含着多种语义关系,如:修理家具。/挖了一个坑。/来了一个客人。/写毛笔。(述宾关系,受事、结果、施事、工具。)反之,一种语义关系也可能构成多种句法结构关系。 ⑶沙发上坐着一个人。 ⑷那个人坐在沙发上。 ⑸那个人在沙发上坐着。 这几个句法结构的语义关系基本相同,“人”“沙发上”与“坐”之间都是“施事”“处所”与“动作”的关系;但句法结构关系却不一样。 (二)动词和名词语义关系的类别 汉语句法结构中的语义关系是多种多样的,句法分析的重点是动词跟名词性词语之间的语义关系。在各种语义关系中,名词性成分担任了一定的语义角色,如“受事、结果、施事、工具”等,这实际上也就是揭示了名词性成分跟动词之间的关系。名词性词语经常担任的语义角色主要有: 1、施事:指动作的发出者(可用介词“被、叫、让、给”引进) 他在看书。/小狗啃完了骨头。/敌人被我们打败了。 2、受事:指动作行为的承受者(可用介词“把、将”引进)。 小牛吃草。/张三修桌子。/毛把花瓶打碎了。 3、系事:指连系动词联接的对象(?) 我们是教师。/小王成了大学生。 4、与事:指动作行为的间接的承受者(送、还?)(可用介词“给”引进)。 张三还李四一支笔。/我给兰兰送去一些巧克力。 5、结果:指动作行为产生的结果。 编草帽。/烙饼。/做烟斗。/打毛衣。/盖大楼。

空间句法的新方法_比尔_希利尔

54 世界建筑2005/11 1 步行可达指数。图中显示了影响伦敦哈罗兹,金茨桥区域的步行活 动的重要因素。/Walkability Index.Bar chart showing significantfactors influencing pedestrian movement in the area aroundHarrods in Knightsbridge, London, as identified by the WalkabilityIndex.2 同一地区的步行活动预测图显示出了对新的联系(金茨桥和海德公园之间)的需求,可以同其他重要因素联系起来。预测等级通过不同 空间句法是一种研究城市的方法,主要是了解社会和经济因素是如何逐步影响并形成空间的。用当今的流行术语来说就是把城市看成是自组织系统。 空间句法最为人所知的方面也许是它建立了在建筑环境里分析空间模式或者说分析空间组构的方法。这些方法不仅揭示了城市中的空间结构,而且把它们和人的移动、停留和交流方式相联系。空间句法还能预测设计和规划所带来的中长期效果,因此,能让设计者和规划者在工作中遵循社会和经济发展规律,而不是违背它们。 这些研究方法已经在一段时间内得到了成功地运用,其中包括轴线分析法(用来分析城市街道网络和步行系统)和“可视性分析”(用来分析公共空间内的视域模式)。但是同时新的分析方法正不断地由伦敦大学学院空间句法实验室以及它的商业合作伙伴空间句法有限公司开发和研究出来。本文将简要地介绍其中一些发展。 组构的修正:步行可达指数 正如空间句法理论所说,空间组构强烈地影响人的流动,但并不意味着组构完全决定了人流或者它的作用是放之四海皆准的。在一些案例中,组构的影响比较弱,所以,要理解人流模式或者预测设计结果就需要一些其他额外的信息。这些附加的信息包括一些相关因素,如交通节点、土地利用、临街建筑、基础设施、主要吸引物和美学因素等。 现在这些其他因素都通过最近研发的一项称为步行可达指数的技术整合到了组构模式上。步行可达指数是 建立在统计学方法的多重回归分析(MRA)的基础上。多重回归分析是经验性地分析数据,以此来决定每个元素作为人流模型中所起的可变量作用。多重回归分析模型可以更好地理解与人流模式相关的问题,因为它强调了因素的相对重要程度,比如建筑高度、交通节点或者活跃的临街行为等等,有时它们和局部整合度(影响人流的主要组构量度)一样重要。 同时,改变不同的输入变量的值,例如那些步行道的宽度或者活跃临街行为的数量,都可以帮助预测可能发生的人流模式。事实上,这些因素的结合是可以被分析和修改的,这也就有了一个灵活性的方法。 步行可达指数在一些地区尤其有效,这些开发对空间结构、人流和土地利用的影响不同步,比如伦敦的大象城堡(Elephant and Castle)地区(它的总图设计采用了很多空间句法分析)。实际上,对于这样一个技术的需求正好说明路网结构、人流和土地利用三者之间的协调发展是一个发育良好的城市的产物。这也许是为什么传统城市更为人称道的主要原因。这并不意味着城市必须设计得和过去一样,但是却意味着它们设计的根据应借鉴那些具有活力的城市的经验。 更精确尺度的组构:线段分析 空间句法的一个很大优势在于它可以同时在城市宏观和微观尺度上分析空间。线是都市分析的一个主要单位(这反映了一个事实:城市空间本质上是一个线性空间网络)。但是这并不是我们需要了解的最精确的尺度,因为这些线在交点之间的不同线段经常是起着不同作用的。同样重要的是要考虑到不同城市存在非常不同的几 何形式,从更加网格状到更加有机状。 为解决这些问题,现在发展出了一种新的句法模式。它仍然是建立在线网的基础上,但是它的基本单位是交点之间的线段。这种模式不仅能在更精确的尺度上进行结构分析,而且可以通过不同的方式定义一个节点和另外一个之间的距离来进行不同类型的分析:实际路程距离(从点A到点B多远),最少转弯距离(一条路线有多少转弯),最小角度距离(两点之间的实际路径与连接两点的直线所形成的偏差角度大小)。这些不同的分析方法从不同的方面反映了都市的复杂程度。 尽管这种新模型还在研究测试中,但是它已经被证明对于分析城市最微观尺度的土地利用变化非常有效。这个模式现在被用来分析更精确的人流模式,同时它也指明了路程、几何和拓扑3个元素的作用使得城市空间网络本身形成了人流。这个领域的重要新成果在不久的将来公布,某种程度上可能是惊人的成果。 主观的组构:空间中智能行动者 现在来介绍最新的发展:EVAS空间中智能行动者。它是从视线分析(VGA)方法发展而来,已经被运用在很多公共空间项目上,包括最近的特拉法加广场(Trafalgar Square)的重新设计。 EVAS创造了虚拟环境(它建立在地图或者建筑图纸基础上),然后给虚拟的智能行动者赋予限制视角的朝前的视域。当这些智能行动者四处活动时,他们用“感知—行动”的规律来指导他们的运动行为,例如他们会被某个进入视野的特殊物体所吸引。如果环境改变(例如模拟一个新设计),EVAS会显示人流模式如何相应变 空间句法的新方法 NEW METHODS IN SPACE SYNTAX 比尔?希利尔,克里斯?斯塔茨/Bill Hillier, Chris Stutz 作者简介:比尔?希利尔 ,伦敦大学学院巴特雷特研究生院教授 兼院长,空间句法咨询公司非执行董事。 克里斯?斯图兹,空间句法咨询公司副主管。 收稿日期:2005-10-09 1 2 颜色来表达,红色最高,蓝色最低。/Pedestrian movement forecast map of same area with proposed new link (betweenKnightsbridge and Hyde Park), incorporating likely effects oflayout/configuration and other significant factors. Forecastlevels for each segment are represented on a colour scale, withhighest levels red and lowest levels blue. 影响步行活动的因素/Factors influencing movement 非常重要/Very significant 不重要/Not significant 重要/Significant 空间布局/Spatial layout 零售/Retail 地铁/Tube 特殊因素/Special 静止边界/Inactive frontages 哈罗兹/Harrods

英语语法教学的策略

英语语法教学的策略 摘要英语教学要注重在教学中方法策略的应用本文就引入, 及“四位一体”实践教学法谈了自己的经验。 关键词教学策略地位方法 目前在英语教学中, 语法教学的地位已处于有史以来的最低谷。许多教师对此理解不够准确, 甚至很是偏颇, 他们认为教学的重点主要是培养学生的口语表达能力, 于是" 淡化语法观念" 的论调有日益高涨之势。为此在新课程改革背景下重新审视语法教学的地位, 进一步阐明语法教学的必要性, 并深入探讨语法教学改革之策略尤为重要。 一、语法在语言教学中的地位 什么叫语法?张道真教授说" 语法是研究词性变化和句子结构的科学。研究词性变化的部分称为词法, 包括词的语法形式和词的搭配特点。如名词的数、格、动词的时态、语态等都属于词法的范围。研究句子结构的部分称为句法, 如句子成分、语序以及句子的种类等都属于句法范围。" 语言是人类交际的工具, 而语法更是指导人类使用语言交际工具的工具。无论哪种语法, 都是经过若干年人们经过语言的交际而总结出来的一种语言法规, 反过来又用于指导实践。比如: 中国人说汉语不管识字的和不识字的, 他们用以交流的语言都是符合汉语规范的。小孩生下来到会说话, 一代传一代, 自然文盲人说的话也符合语言规范了。但是对于外语, 那就不行了, 因为你不了解外语的法则, 比如我们说英语, 不了解英语语法, 你能说出地道的英语和英美人交谈吗?从这几年的中考试题看, 无论是单项选择, 还是完形填空、情景交际、单词拼写、词形变换, 乃至书面表达,无不与语法紧紧地联系在一起。对中学教师来说, 词法和句法的教学更显得重要了。 二、实施有效的教学策略 参天的大树离不开粗壮的根, 高耸人云的摩天大楼靠的是坚实的基础。写文章或发表言论好象建房子, 词汇就像建筑材料, 语法就像建筑框架和建筑技术。英语语法教学是使学生会说地道英语, 会写地道英语文章的一门很重要的技能课。教师不但“教会”还要“会教”。 1.从学生的实际要求入手 我的教学原则是: From the students 从学生而来, 取之于学生; To the students 到学生中去, 教之于学生; For the students 为学生而教,为学生而思。教师要经常深入学生当前的思想, 懂得他们需要什么,以及他们的苦衷和要追求的是什么, 是学习基础差, 还是学习不得法, 知识漏洞的多少, 是词法差还是句法乱等等。尤其是对学习后进生和优秀生的了解尤其重要, 尽管他们人数少, 但是他们将影响全班学生的学习积极性。对他们的了解得越透彻, 就越能更为有效地把knowledge 传授给学生。For the students, 这坝活动最能体现一名教师的人生观, 它将影响学生走出校门后做·个什么样的人的问题。 2.从英语“四位一体”教学法“4P”课堂教学模式入手 在教学过程中PI———Preparation 是一种有目的的有准备的在课前完成的学习任务。预习是一个十分重要的环节, 预习要顾及到一堂课的教学, 预习的内容应包括" 语言、词汇、语法、听力、句型等等, 同时对课文中出现的新知识, 要鼓励学生敢于面对, 善于把它们与旧知识进行有机的融合, 人教版英语教材每个单元都设有要学话题的重要句型, 学生在预习后, 可以找出本单元的重点句型, 同时又可与曾经学过的相似句型进行 比较或联想。P2 Presentation 是主要由教师传授的正规的课堂教学, 是以教师为主导, 学生为主体来进行的。教师必须精心设计好这一阶段, 对它的效果要有预测。有教才有学, 有学才有教, 两者相辅相成。对低年级的学生, 教师要多讲,多提供刺激, 来引发学生反

基于空间句法的网络城市评价体系研究

基于空间句法的网络城市评价体系研究 李云飞 【摘要】:在经济全球化和知识经济迅猛发展的背景下,城市的网络化特征越来越明显,“网络中的城市”和“城市中的网络”已成为学术界研究的热点。本文试图从空间句法的视角来研究“城市中的网络”。不同于传统定性分析方法,空间句法提供了一种全新的、理性的、可量化的对城市网络的空间表示与分析方法。本文通过选取空间句法理论中跟城市形态相关度比较高的四个参数——全局整合度、局部整合度、可理解度、空间智能度,来构建网络城市结构的评价体系。并以长沙为实例,通过对长沙市三个不同时期的现状和城市总体规划空间结构特点的研究,分析城市内部的发展潜力以及城市整体空间结构发展趋势,为实现长沙城市空间的可持续发展提供决策支持;2009年长沙城市空间现状网络的空间智能度印证了长沙市芙蓉CBD选址的合理性;2009年长沙市现状网络的全局整合度与长沙市高层建筑布局规划研究结果进行对比,发现两者具有很大的相似性,反证了长沙市高层建筑布局规划研究结论的合理性。 【关键词】:网络城市空间句法城市空间 【学位授予单位】:中南大学 【学位级别】:硕士 【学位授予年份】:2009 【分类号】:TU984.113 【DOI】:CNKI:CDMD:2.2009.240867 【目录】: ?摘要3-4 ?ABSTRACT4-8 ?第一章绪论8-17 ? 1.1 研究背景与意义8-11 ? 1.1.1 研究背景8-10 ? 1.1.2 研究意义10-11 ? 1.2 研究思路与内容11 ? 1.2.1 基本思路11 ? 1.2.2 研究内容11 ? 1.3 本文框架11-12 ? 1.4 国内外相关研究综述12-17 ? 1.4.1 国外相关研究13-14 ? 1.4.2 国内相关研究14-17 ?第二章空间句法概述17-39 ? 2.1 空间句法的产生和发展17-18 ? 2.2 组构18-19 ? 2.3 网络19

空间句法的简易应用

空间句法的简易应用 Company Document number:WUUT-WUUY-WBBGB-BWYTT-1982GT

空间句法的简易演示 1、研究方法 空间句法主要有三种研究方法:凸多边形法、轴线底图法、视区分割法,建筑和城市研究多采用前两种方法,本演示说明只针对前两种方法进行简单演示。 凸多边形法: 凸空间定义:假设一个空间内部,任意两点之间可以相互看见(all see all)(如图)。 凸多边形法:适用于将建筑空间转换为二维平面图,进而计算空间之间的相互关系,通过准确描述空间结构,来观察人的行为和社会活动,反作用于研究建筑空间的合理性和功能性。 左边空间为凸空间,右边空间由于部分点之间视线遮挡,不能定位为凸空间。 轴线底图法适用于城市范围内的空间和道路空间可达性的研究。 2、软件应用 (1)凸多边形法演示——以单层建筑平面为例 在网络上下载UCL 的Depthmap10进行安装,并打开软件。 Ctrl+N,新建一个graph文件。 在此之前,我们按照建筑平面进行凸空间整理,以下图空间为例,首先在CAD里进行凸空间绘制。 绘制完成后将CAD文件另存为“dxf”文件,用于导入Depthmap中。 按Ctrl+I,导入Depthmap中,并将文件转化为“Convex Map”(凸空间模型,转为Convex Map;轴线模型,转为Axial Map;线段模型,转为Segment Map。),软件才可以进行凸空间运算。

运算完成后,得到有颜色的结果,对于有数值的,空间句法采用是颜色级别显示策略,如果一个元素是灰色的,说明这个元素是没有数值的,需要在CAD里重新绘制。 然后设定空间之间的连接关系,常用按钮为Link和Unlink,。 点击“Select”退出编辑,然后进行运算。 在Depth Map→Axial/Convex/Pesh→Run Graph Analysis,弹出对话框。 对话框中的参数设置,最上面为Rdius,设置计算半径,数值选择有“n, 3,5,7,9,11”,以任意一个空间元素为中心,再以“全系统”、“半径3”、“半径5”、“半径7”等以此类推为限制条件,分别进行某个算法的计算。每一项都要打上勾,最后一项的意思是“以什么为权重”,凸空间模型一般选择“Connectivity”,在研究城市课题的空间句法模型中,经常需要考虑“米制距离”,一般是在轴线模型中,这时应选择weight by“Length”。 点击“OK”后,就会出现软件计算完成的结果,窗口左侧出现了参数选择栏,可拖动参数选择栏右边的滚动条进行上下浏览,不宜用鼠标滚轮,滚轮一动,易造成右侧图形的消失,这时可以用“Recenter” 这个命令,将图形最大化显示。 至此,凸空间模型的软件操作已经告一段落,接下来即是结合建筑与城市规划的知识进行读图分析。 (2)轴线底图法——以城市为研究对象,采用轴线模型,进行道路可达性分析操作演示。 主要分析流程 选择研究范围:可以以环城高速作为边界,或者选择规划边界作为研究边界,并设置一个足够大的缓冲区。 在CAD里进行轴线绘制,注意要点如下: (1)交接处要稍微出头,确保连接关系的正确表达; (2)对空间的概括要准确,尽量按照“最长也最少”的原则选择更简化、更合理的表达方式。 S形街道的轴线绘制示例交通转盘的轴线绘制示例

再论“空间句法”(图文整理详细版)

再论“空间句法”(图文整理详细版) 作者:张愚王建国 国内建筑界对空间句法的了解,多数仅限于由赵冰翻译的《空间句法——城市新见》一文[1]。发表于1985年第一期《新建筑》上的这篇文章,简要介绍了早期的空间句法方法在城市空间形态研究方面的应用,但未全面介绍其方法背景、原理和其他应用,因此,至今很多人仍颇有不解或“持保留态度”[2]。多年来,空间句法在各方面已有长足发展,国内杂志却鲜有论及。本文试图比较清晰地介绍和评析空间句法的理论、方法、实践及其最新研究进展。 简单地说,空间句法是一种通过对包括建筑、聚落、城市甚至景观在内的人居空间结构的量化描述,来研究空间组织与人类社会之间关系的理论和方法(Bafna, 2003)。它是由伦敦大学巴利特学院的比尔•希列尔(Bill Hillier)、朱利安妮•汉森(Julienne Hanson)等人发明的。早在1974年,希列尔就用“句法”一词来代指某种法则,以解释基本的但又是根本不同的空间安排如何产生[3]。到1977 年,空间句法研究则略具雏形。经过二十余年的发展,空间句法理论已经深入到对建筑和城市的空间本质与功能的细致研究之中,并得到不断完善;由此开发出的一整套计算机软件,可用于建成环境各个尺度的空间分析;而且在建筑和城市设计中进行了广泛的应用。如今,空间句法的研究和应用已经在世界范围内普遍展开。 1997年,首届世界性的空间句法研讨会在伦敦举行;其后于1999年和2001年又在巴西利亚和亚特兰大举行了第二和第三届。2003年6月,在伦敦刚刚举行的第四届研讨会上,来自世界数十个国家和地区的82篇论文,从不同角度对空间句法进行了广泛深入的探讨。另外,日趋成熟的空间句法分析技术,已经成功应用于商业咨询。理查德•罗杰斯、诺曼•福斯特、泰瑞•法雷尔等知名事务所,在众多建筑和城市设计项目中雇请空间句法咨询公司进行空间分析,为其设计提供了有力的引导和支持。 由于篇幅所限,本文以解释构形概念为主线,重点从空间知觉的角度简析空间句法的方法原理,使读者能真正理解并实际运用它;而对于空间句法的理论概念和具体应用成果仅作扼要介绍。 1. 构形与建筑学 1.1 构形的含义 构形(configuration),从字面上看,是指“轮廓由其各部分或元素配置决定的外形”(据美国传统辞典)。希列尔将构形定义为“一组相互独立的关

038、基于空间句法的城市历史街区的功能优化——以哈尔滨市道外传统商市风貌保护区为例

基于空间句法的城市历史街区的功能优化 ——以哈尔滨市道外传统商市风貌保护区为例 周慧 摘要:历史街区的功能优化应遵循保护和更新相结合的原则,无视于原有居民改善生活环境需求的历史街区保护违背了“发展”的本质内涵。本文旨在基于空间句法理论基础上,以哈尔滨市道外传统商市风貌保护区为例,通过模拟历史街区的整体布局特征、街区组织特征和视觉效果,解析道外商市功能布局的特征规律,包括功能类型选择与句法整合度、街区利用潜力与空间可识别性、商业活力分布与拓扑距离的关联分析,进而提出历史街区的功能优化设计策略,包括调节街区核心街道的功能、根据空间可识别性挖掘街道利用潜力、根据街区活力分布建立公共节点,并在此基础上从功能类型选择、街区利用潜力、街区活力分布三个层面归纳一些风貌保护区的控制与引导对策。从而,探索以空间句法模拟分析研究城市历史街区功能优化的技术路径。 关键词:功能优化、历史街区、商市风貌、空间句法 1道外传统商市风貌保护区概述 1.1区位信息 道外区地处哈尔滨市区中东部,是历史悠久的老城区,地域广阔,位置适中,是全市八区十县(市)的区位中心,与呼兰、松北两个行政区隔江相望,与道里、南岗、香坊、阿城四个行政区接壤,南与香坊区幸福乡、城高镇接壤,东与香坊区向阳乡、阿城区毗邻,北与呼兰区隔江相望。(见图1) 图1:道外区的区域地理位置

1.2历史沿革 道外区是哈尔滨市的老城区,旧称傅家甸,地处哈尔滨市区中东部,北临松花江,作为哈尔滨市的开埠地,1736年(清乾隆元年)这里就已有人烟生息,1907年光绪帝在此设立行政厅,1929年建立滨江市,1956年改称道外区。数百年的历史沉淀了道外区独特的中华巴洛克建筑文化——欧式立面、清水砖墙、雕花围檐、砖木结构。来自商贾云集,街景繁华,257个传统大院在此形成了全国面积最大的“中华巴洛克”建筑街区。(见图2、图3) 图2:哈尔滨近代建筑发展阶段 为保护其珍贵的历史文化价值,政府于2003年划定哈尔滨道外传统商市历史文化街区,占地53.11公顷。截至目前,已有5.4%的街区基本完成改造,94.6%处于待改造阶段。此次研究针对已改造和待改造街区分别进行。作为哈尔滨的发源地,历史街区内至今仍保存大量历史建筑和历史风貌地段,形成了以中华巴洛克为主兼容古典主义、文艺复兴和新艺术运动等时期的建筑风格,它们都是哈尔滨近代发展史的见证。区内有些建筑属国家级保护建筑,而且大多数保存完好,这是改造和更新历史街区的触媒点,也是人们文化和娱乐休闲旅游的吸引点。 图3:哈尔滨市与道外区历史发展沿革各阶段

中文复杂名词短语依存句法分析

优先出版 计 算 机 应 用 研 究 第32卷 -------------------------------- 基金项目:国家自然科学基金项目(61173095),国家自然科学基金重点项目(61133012) 作者简介:陈永波(1990-),男,山东禹城人,硕士研究生,无,主要研究方向为自然语言处理、句法分析、机器学习等(chenyongbo1990@https://www.sodocs.net/doc/148519731.html,);汤昂昂(1990-),男,硕士研究生,无,主要研究方向为自然语言处理、信息检索、机器学习等;姬东鸿(1967-),男,博士,博导,主要研究方向为自然语言处理、语义网技术、机器学习、数据挖掘等; . 中文复杂名词短语依存句法分析 * 陈永波,汤昂昂,姬东鸿 (武汉大学 计算机学院,武汉 430072) 摘 要:针对中文复杂名词短语的依存句法分析进行了研究,提出简单边优先与SVM 相结合的依存句法分析算法。算法的每一步迭代根据边的特征于每一对相邻子树之间的无向边中选择最优者,然后利用支持向量机根据边两端子树的特征确定该边的方向,即得到两棵子树的中心语之间的依存关系。实验证明对于复杂名词短语的依存句法分析,算法准确率比简单边优先算法有明显提高,且优于基于最大生成树算法的中文句法分析器。算法分析效率更高,时间复杂度为O (n2logn )。 关键词:中文复杂名词短语;依存句法分析;决策式算法;支持向量机;特征 中图分类号:TP391.1 文献标志码:A Dependency parsing of Chinese complex nominal phrase CHEN Yong-bo, TANG Ang-ang, JI Dong-hong (Computer School, Wuhan University, Wuhan 430072, China) Abstract: This paper developed Easy Arc First Algorithm Combined with SVM, and used it in dependency parsing of Chinese Complex Nominal Phrase. In each iteration step, the algorithm finds out the optical non-directional arc among arcs linking neighboring subtrees according to their features, and determines the arc ’s direction using SVM. Results of experiments show that accurate rate of the algorithm is significantly higher than Easy First Arc Algorithm, and higher than Chinese parser based on MST algorithm. Time complexity of the algorithm is O(n2logn). Key Words: Chinese complex nominal phrase; dependency parsing; deterministic algorithm; SVM; feature 0 引言 复杂名词短语的语义解释是自然语言处理领域最具挑战性的课题之一[1]。研究复杂名词短语的依存句法分析算法,对句子依存分析计算复杂性的简化和准确率的提高具有重要意义 [2]。当前主流的依存句法分析算法可以分为三类:基于转换的 算法、基于图的算法和同时基于图与转换的算法。基于转换的算法计算简单,而准确率较低;基于图的算法准确率高,但计算复杂。Yoav 等[3]结合前两种方法,提出了简单边优先算法。该算法能较好地处理长句,却不能移植到复杂名词短语的句法分析。针对复杂名词短语的内部结构特征,本文提出了简单边优先与SVM 相结合的依存句法分析算法。算法考虑了复杂名词短语的内部结构特征,在降低计算复杂度的同时有效地保证了准确率。实验证明该算法能良好地应用于复杂名词短语的依存分析,且准确率和效率高于基于最大生成树算法的中文句法分析器。 本文内容主要分为五部分:本部分为引言;第一部分介绍 复杂名词短语的定义及其语义结构;第二部分介绍依存句法分析的定义及目前的主流算法;第三部分介绍简单边优先与SVM 相结合的依存句法分析算法;实验及结果分析在第四部分。 1 复杂名词短语 1.1 定义 本文的研究对象是指包含至少三个词语且不含助词“的”的复杂名词短语。下面1)和2)给出了两个复杂名词短语的例子。 1) 多种语言现象 2) 多种语言习得 研究复杂名词短语的识别和依存分析对于句子分析的简化和准确率的提高具有重要意义。目前国内外对于复杂名词短语语义结构的研究主要集中在NN 二词短语,而对于多词名词短语的研究比较少见。但多词名词短语的语义结构远非二词名词短语所能涵盖。例如1)中如果没有“现象”,“多种”语义上指向“语言”;如果添上“现象”,则很可能指向“现象”。相比

2020年海淀一模英语语法填空题分析及备考策略

2020年海淀一模英语语法填空题分析及备考策略 At 8, I started taking art lessons __1___(improve) my painting skills. However, later, I found that I focused too much on mastering different techniques. Eventually, I became more distressed when my expectations weren't matched. 1.to improve 给词题,动词,已经有谓语动词形式了,需要填非谓语动词形式,to do 不定式表目的。 So, in the 11th Grade, I returned to the basics. On__2____sketchbook I forced myself to draw whatever interested me. Over time, I have been released from the tight control. I have learned that a good painting is not about having perfect technique. In fact, all I need to do is trust my _3____ (create) talents and find moments of joy in life. 2.a 不给词题,空中常填冠介连,a(an) the, 泛指,不是元音发音,所以用a. 3.creative 给词题,信任我的____才能,名词前需要形容词。 B In recent years, trampolining (蹦床)has become a new craze among Chinese youths. Short videos__4___ (show) people's excitement about jumping back and forth on the colourful trampolines are regularly uploaded to social media. Most videos feature teenagers, but adults too have jumped on the trend, hoping to relive their childhood. Compared with soccer, basketball, tennis or any other competitive sports, __5__ various injuries occur from time to time, trampolining is relatively __6___ (safe). However, preparation and safety always come first. You must do warm-up exercises before playing and you can't lose concentration during the movements. 4.showing 给词题,所在句中,已有谓语动词are uploaded, 这里需要一个在名词后做定语的修饰名词的非谓语,名词后空看名词,video和动词之间主动关系,用现在分词。 5.where 不给词题,此处需要连词,非限制性定语从句,空后句子不缺主宾表,用关系副词,表示“在这些活动中”。 6.safer 形容词,比较级。 C A news report shows that China's urban pet consumer market __7__(expect) to break through the 200 billion yuan threshold this year. Young people in big cities are the main contributors. Nowadays, with the cost of living rising, young people __8__ (suffer) from greater loneliness and pressure. They are busy working all day in a competitive environment, leaving

让初中语文语法知识活起来的应用策略分析

让初中语文语法知识活起来的应用策略分 析 古语有言:工欲善其事,必先利其器。若是初中生学习语文知识时对于句子的主、谓、宾构成都搞不清楚,碰到“汝之不惠”这样的句子,教师怎么才能讲明白?可见语法的重要性毋庸置疑,关键的问题是怎样让初中语文语法知识活起来,让他们学会、乐学。 一、教材资源是语法教学的基本环境 尽管我国教育部门一直没有对初中语文教学中的语法内容提出具体严格的要求,教材中的专项语法练习也屈指可数,但这恰恰在实际上给语文教师进行语法教学,提供了便利条件,那就是不必受教材内容所限,可以自由发挥主观创造性。但同时这对教师而言也是一个复杂的课题:究竟应该利用哪些材料实现语法的灵活教学?因为教学客体是心智发育尚未完全的初中学生,所以语法教学难以简单地以分析与练习进行,最好的办法依然是把教材内容的功能充分发挥出来,让语法从教材中来,融于教材中去,使语法知识由枯燥无味变为灵活生动。 例如我们在讲解茅盾的散文《白杨礼赞》时,会分析到这样的句子:“它没有婆娑的姿态,没有屈曲盘旋的虬枝。

也许你要说它不美……宛然象征了今天在华北平原纵横决荡用血写出新中国历史的那种精神和意志。”这段话很具有语法代表性,教师可以带领学生共同探讨各个分句所采用的修辞手法,并详细说明其作用,继而划分句子主干。通过此种深化引导分析,学生一方面形象接受了有关的语法知识,另一方面还在深入分析时熟悉了作者逐步深入的写作技巧,从而起到对教材内容全面认识的客观效果。 再比如贾平凹先生的散文名作《月迹》中有:“盼着月亮”、“ 坐回中堂”、“ 爬着那竹帘”、“ 没了踪迹”、“ 端了一壶甜酒”、“ 掬着沙儿”等短语,可以拿来当作鲜活的例子加以细致分析,让学生在这些例子里面自行探索短语的结构规律,最后由教师给出总结性陈述。 二、阅读与写作是语法教学的两大辅弼 语法知识不仅可以从教材中来,而且可以在阅读和写作中得到升华。借助阅读教学,学生一方面可以开阔视野,增加学习兴趣,另一方面也可以带动相关语文知识的全面整合。语法教学在阅读过程中的展现就是这种整合过程中的组成部分。例如莫泊桑的小说《我的叔叔于勒》里面有这样一句话:大家都认为分文不值的于勒,一下子成为了正直的人、善良的人。当学生读到这里时,教师即可顺势讲解:如果遵从语法规律,句子须以主语作为开头,但却不能僵化地使用,若直接将于勒一词置于前面,句子将会不容易通顺,“大家

基于句法分析和机器学习的中文自动问答系统研究

基于句法分析和机器学习的中文自动问答系统研究自动问答系统是为了应对信息爆炸的客观挑战和满足信息时代人们对于快速、准确地获取信息的主观需求而发展起来的。它逐渐成为自然语言处理和自然语言理解领域的前沿。 本文首先对问答系统的整个框架结构进行了剖析,对问答系统的三个关键模块的实现任务和解决方案进行了细致的综述。其次本文提出了基于汉语问句句型分析和支持向量机相结合的中文问题分类方法。 本文还提出了基于最大熵模型对候选答句进行二分类的方法对答案进行抽取。综述部分全面介绍了问答系统三个关键模块的实现任务和解决方案,着重剖析和总结了问答系统中两个最关键的子模块:问题分类和答案抽取的实现方法。 本文分析指出,对问句进行句法分析的分类特征抽取和基于机器学习的分类方法成为问题分类的技术发展趋势;句法分析和机器学习成为答案抽取里面两个最重要的组成部分。问题分类模块中,本文首次提出根据距离疑问词最近原则确定问句中的谓语动词,根据疑问词和谓语中心语的距离信息对汉语问句进行句型分析。 然后,在此分析的基础上,提取出疑问词、谓语动词、主语和宾语作为问题分类的特征。最后采用支持向量机作为问题分类的机器学习算法,取得了良好的实验结果,准确率达到95.87%。 答案抽取模块中,本文首次提出把答案的抽取问题转化成一个对候选答句进行二分类的问题。首先,在对问句进行句型分析的基础上,提取出问句词及词性序列、查询关键词、疑问词、主语、谓语和宾语作为问句特征集;然后,对候选答句进行浅层句法分析,提取出候选答句词序列,候选答句词性序列和正确答案词性

标记作为答句特征集;基于问句特征集和答句特征集得到组合特征集;最后,引入最大熵模型,在组合特征集的基础上训练答案抽取的分类器。 良好的实验表现证明了这种方法的可行性。

语料库的类型

语料库的类型 [作者:李文中转贴自:Corpora and the ELT点击数:97 文章录入:neilruan ] 语料库来自拉丁词corpus,原意为“汇总”、“文集”等,复数形式为corpora或corpuses。语料库是“作品汇集,以及任何有关主题的文本总集”(OED)是“书面语或口头语材料总集,为语言学分析提供基础”(OED)。语料库是“按照明确的语言学标准选择并排序的语言运用材料汇集,旨在用作语言的样本”(Sinclair,1986:185-203)。语料库是按照明确的设计标准,为某一具体目的而集成的大型文本库(Atkins and Clear,1992:1-16)。 Renouf认为,语料库是“由大量收集的书面语或口头语构成,并通过计算机储存和处理,用于语言学研究的文本库”(Renouf, 1987:1)。 Leech指出,大量收集的可机读的电子文本是概率研究方法中获得“必需的频率数据”的基础,“为获得必需的频率数据,我们必须分析足量的自然英语(或其它语言)文本,以便基于观测频率(observed frequency)进行合乎实际的预测。 因此,就需要依靠可机读的电子文本集,即可机读的语料库”(Leech, 1987:2)。综上所述,语料库具有以下基本特征: 1〕语料库的设计和建设是在系统的理论语言学原则指导下进行的,语料库的开发具有明确而具体的研究目标。如二十世纪六十年代初的BROWN语料库主要目的是对美国英语进行语法分析,而随后的LOB语料库基本按照BROWN语料库的设计原则收集了同年代的英国英语,目的是进行美国英语和英国英语的对比分析和语法分析。 2〕语料库语料的构成和取样是按照明确的语言学原则并采取随机抽样方法收集语料的,而不是简单地堆积语料。所收集的语料必须是语言运用的自然语料(naturally-occurred data)。 3)语料库作为自然语言运用的样本,就必须具有代表性(representativeness)。Chomsky曾经批评语料库不过是试图用很小的样本代表巨量的甚至无限的实际语言材料,其结果必然存在偏差,缺乏代表性,“自然语料库存在如此严重的偏差,以至于对其所进行的描述将不过是一个词表而已”(Chomsky, 1962:159)。这种批评对任何以概率统计为基础手段的研究都是有价值的(McEnery, 1996:5)。 但是,目前的计算机语料库可以通过控制抽样过程和语料比例关系来缩小偏差,增强语料的代表性。决定语料代表性的主要因素不外乎样本抽样的过程和语料量的大小。语料库抽样一般采取随机抽样方法。一种做法是在抽样前首先确定抽样的范围,如BROWN语料库和LOB语料库分别是以1961年全年的美国英语和英国英语出版物作为抽样范围i[i];再就是确定语料的分层结构,进行分层抽样,如把语料按文类(genre)和信道(channel, 如书面语和口语等)进行分层,如图2.1所示。从各种语料的抽样比例上又可分为‘均衡抽样’(balanced)和‘塔式抽样’(pyramidal)。前者对各种语料按平均比例抽取,而后者对不同的语料进行不等比例抽取。 4)语料库语料以电子文本形式储存并且是通过计算机自动处理的。巨量语料以纯文本形式存储在磁盘上,以便语料库索引软件检索和处理。也可以通过转换软件把其它格式的文件如超文本(htm 或html)格式转换为纯文本。另外,语料库具有一定的容量。语料库的大小取决于语料库的设计原则和研究需求,以及建库过程中语料资源的获取难度及其它因素。计算机语料库实际上提供了一种人机交互,这种交互方式随着语料库工具的发展而逐步加强其自动化特性。Leech认为这种人机交互有以下四种渐进的模式:(1)‘数据检索模式’。计算机以便利的形式提供数据,人进行分析。(2)‘共生模式’。计算机提供部分经过分析的数据,人不断改善其分析系统。(3)‘自我组织模式’。计算机分析数据并不断改善其分析系统,人提供分析系统参数及软件。(4)‘发现程序模式’。计算机基于数据自动划分数据范畴并进行分析,人提供软件(Leech,1991:19)。 计算机自动处理包括自动词性附码(tagging)、自动句法分析(parsing)等。其基本处理和分析过程包括以下几个步骤: 语音分析(phonetic analysis)指音段分析,主要用于语音识别和语音合成。 正字分析(orthographic analysis)指对文本中各种非文字符号、标点、大小写问题等进行处理和歧义消除。 形态分析(morphological analysis)即词性指定和附码。语料库自动附码软件通过概率统计和分析,对所给句子每一个词指定一个或多个词性码。结果显示分列显示和行显示两种。目前语料库自动词性附码准确率一般在97%以上。 句法分析(syntactic analysis)是指句子成分切分、句法关系识别、以及句法分析。语义分析(semantic analysis)和语用分析对语篇进行语义指定和意义解释。 5)基于语料库的研究以量化研究为基石,以概率统计为基本手段,以“数据驱动”为基本理念。其基本方法是通过对实际语言运用的抽样,确定其对语言整体的代表性,通过对样本特征的描述概括整体特征。在量化分析中,首先对特征进行分类,并统计各个特征的频率,通过建立复杂的统计模型对观测到的数据进行解释。分析结果可对研究对象总体进行概括。量化分析能够使我们发现在某一种语言或语言变体中哪些现象反映了语言的真实特征,那些现象仅属于偶然的个例。针对某一语言变体而言,我们还可以确切地知道某一语言现象的显著性,从而确认该现象是规范的还是异常的(McEnery,1997:3)。 6)语料库既是一种研究方法,又代表着一种新的研究思维,并以当代先进的计算机技术为技术手段。 7)语料文本是一连续的文本或话语片断(running text or continuous stretches of discourse),而不是孤立的句子和词汇。在语料库研究中,对某一搜索词的语法关系、用法、以及搭配的观察是通过分析提供的语境(context)进行的。语料库索引提供的语境可分为以下几种:(1)指定跨距,即使用者指定以搜索词为中心左右相邻的词数;(2)意元语境,即以某一意义单元结束为一微型语境,在语料库索引中意元的确定是以意义结束符号如“,;”等为标识的;(3)句子语境,即以句子终结符号如“. !”等为标识;(4)可扩展语境,即对搜索词所在语境可无限扩展。这对研究词汇的语法关系、词汇用法、词汇搭配、词丛(word cluster)、词汇在连续语篇中呈现的范型(pattern)、以及主题词汇之间的意义关系提供了可靠而方便的途径。如“necessarily”一词在《新英汉词典》中作为“necessary”词条下该词的副词形式,定义为“必定,必然”;Oxford Advanced Learner’s Dictionary of Current English把它列为一个单独的词条,给出的定义为“adv as a necessary result; inevitably”;各种英语教科书中对该词的定义和解释也大同小异。在上海交大科技英语语料库(以下简称JDEST)中搜索“necessarily”这个词,发现该词在全库中出现264次,频率最大的搭配词“not”出现在该词左边第一个位置,观察搭配频数为136。全库中出现5次以上的三词词丛有20组,同时含有“not”和“necessarily”的词丛有18组。通过索引行统计和词丛统计可以看出(见图2.4示例),“necessarily”一词最典型的用法是与“not”

相关主题