搜档网
当前位置:搜档网 › RoboCup清华大学毕业设计论文

RoboCup清华大学毕业设计论文

RoboCup清华大学毕业设计论文
RoboCup清华大学毕业设计论文

清华大学毕业设计论文

目录

第一章背景介绍 (1)

第二章设计理念和决策框架 (3)

2.1设计理念 (3)

2.2决策框架 (4)

第三章截球技术的实现 (6)

3.1 问题介绍 (6)

3.2 RoboCup仿真环境的运动模型 (6)

3.3二分法求解 (7)

3.4 训练作截球判断的BP神经网络 (8)

3.5 比较和总结 (9)

第四章脚法的实现 (10)

4.1 问题介绍 (10)

4.2 再励学习(Reinfocement Learning) (10)

4.2.1再励学习简介 (10)

4.2.2 Bellmen最优方程 (12)

4.2.3 动态规划算法简介 (12)

4.2.4 Q学习算法简介 (13)

4.3 用再励学习训练脚法 (13)

4.3.1 Kalsruhe Brainstormers 的方法 (13)

4.3.2 我们的实验结果 (14)

4.3.3 我们的方法 (15)

第五章仲裁算法 (19)

5.1 问题介绍 (19)

5.2 RoboCup仿真环境中队员的观察模型 (19)

5.3 仲裁算法 (20)

5.4视野宽度的决策 (23)

第六章传球线路的搜索算法 (24)

6.1 问题介绍 (24)

6.2 传球线路搜索算法 (25)

6.2.1 简单的搜索算法 (25)

清华大学毕业设计论文

6.2.2 优化搜索算法 (25)

6.2.3 穿越速度的计算 (28)

第七章防守体系 (29)

7.1 问题介绍 (29)

7.2 角色的定义 (29)

7.3 阵形的定义 (30)

7.4 一个简单的防守系统 (30)

7.5 考虑全局利益的防守系统 (31)

7.5.1 考虑全局利益防守体系介绍 (31)

7.5.2 求解全局利益最优的防守方案 (32)

7.5.3 实战效果 (32)

7.5.4 缺点 (33)

第八章 TSINGHUAEOLUS的程序结构 (34)

参考文献 (36)

致谢 (37)

清华大学毕业设计论文

第一章背景介绍

机器人足球世界杯(RoboCup)是国际上一项为促进分布式人工智能、智能机器人技术及其相关领域的研究与发展而举行的大型比赛和学术活动。它通过提供一个标准的比赛平台来检验各种智能机器人技术。它的最终梦想是能在2050年发展出能打败人类足球运动员的机器人足球队。RoboCup仿真组重点研究多个智能体(MultiAgent)的竞争与合作的关系。设计RoboCup仿真比赛程序面临的主要难点在于:

在连续空间作连续的决策;

多个智能体的存在给状态空间带来维数灾难;

环境的反馈延迟太长。

环境具有强实时性和动态性;

环境通讯带宽很窄;

环境有噪声;

环境具有部分可观性;

环境不具有马尔可夫性;

前三点使得直接利用从环境中的得到的信息和反馈进行决策几乎不可能实现。曾经有球队直接利用遗传算法(Genetic Algorithm)训练球队,效果并不好。巨大的状态空间和长延时的反馈特性使得RoboCup的研究者纷纷转向分层的决策结构。Peter Stone在他的博士论文中把层学习的方法运用于RoboCup 的研究当中。他把决策分成底层技术层和顶层决策层,在不同的层次采用不同的方法决策,上层决策构筑在下层决策基础之上。其实,层学习的概念非常的简单,当整个复杂的决策任务被分层,分到每个层次的决策任务都变成简单可行了。

第1页

清华大学毕业设计论文

汉堡大学采用Case-base的思想研究RoboCup。其主要想法是利用定义各种典型的场景,根据当前场景和典型场景的匹配度来进行决策。可以设想,这种方法无法克服状态空间巨大的问题,而且很难跟得上环境对动态性的要求。

卡尔斯鲁厄大学以再励学习(reinforcement learning)为他们的主要研究方向。他们的梦想是能够做到仅仅告诉智能体去完成进球的任务,而智能体能够自主的通过和环境的交互,学习各种技能甚至是策略。再励学习在RoboCup中遇到的最大的两个挑战是:一、再励学习最初是以离散空间为求解空间设计的,而RoboCup环境是连续的;二、RoboCup中的再励信号延迟太长,因为只有进球是最本质的再励信号。从思维的层次上说,再励学习模仿的更多是人较为低级的智能行为,它很难表现如推理这类人类思维中较高级、较抽象的行为。关于再励学习的问题,本文第四章“脚法的实现”有所涉及。

葡萄牙的里兹本大学队是2000年RoboCup仿真组的冠军,他们的主要特点是充分利用人类足球的知识和建立准确的世界模型。由于环境具有噪声而且是部分可观的,如何充分利用得到的信息去推测当前的世界模型成了比赛的一个关键所在。

RoboCup的仿真比赛的场景如下图:

图1 RoboCup仿真比赛场景

第2页

清华大学毕业设计论文

第二章设计理念和决策框架

2.1设计理念

由于状态空间的过于庞大以及反馈延迟过大,不融入任何先验知识来设计决策几乎不可能实现。许多非常简单的概念如:带球、截球、射门、传球等要让智能体从与环境的交互当中总结出来,而且组织成知识都是十分困难的。从人类自身获取知识的途径来说,通过教学活动的占了很大的比例。基于以上考虑,我们认为一个融入人类的先验知识,并且能在一定程度上自主学习的决策系统是一个有价值而且可行的设计目标。人类的知识主要作为框架和建议的形式存在。比如人类可以不加思索的把决策分成控球和无球,进攻和防守,如果还有点足球知识的话,带球、截球、传球、射门几类。在我们的决策体系中,这些概念都是事先假定的,也就是我们所谓的以框架的形式存在。作为建议的人类知识通常以限定求解的方向的形式存在。这就类似于启发式搜索的思想,利用外来的信息来加速搜索,当然形式不限于此。还有一部分人类知识以教练的形式存在,如角色、角色行为的定义、阵形、定位球配合等等。

环境的复杂性使得我们不可能全部通过先验的知识来确定智能体每一时刻的行为,而且人类的知识不能完全适合模拟环境。智能体本身具有学习和适应能力,能够自己从环境中获取知识,也成为决策系统是否成功的关键所在。目前流行的自适应学习的算法有BP、动态规划、Q-learning、遗传算法等。当运用于决策时,这些学习算法普遍面临的问题是能处理的问题形式单一,能力有限。如何能合理的把这些学习算法获取的知识运用在决策体系中,使之能够处理形式复杂的各种决策场景,也是我们研究的一个重点。

第3页

清华大学毕业设计论文

2.2决策框架

在纵向,我们采用了分层的结构,分成基本动作层和策略层两层;在横向,我们按足球的各个基本的战术动作来划分模块,分成截球、传球、带球、射门、跑位、视觉、通讯几个模块。每个模块由底层的基本动作和上层的决策策略构成。底层评价在不考虑战术利益情况下动作的合理性(feasibility)。而上层策略层结合战术利益,对候选动作进行进一步的评价和仲裁。模块内部的候选动作先进行局部竞争,然后再提交给更上层的仲裁器进行模块之间的仲裁。概括的说,总体的结构是一个分层、分模块的多级评价仲裁器。结构示意图如下:

图2 决策系统结构

之所以采用多级仲裁和局部竞争是由于模块的评价器往往对同一模块内的候选动作评价有合理性,而在模块之间就失去可比性了。尽管如此,模块的评价结果至少表明了该候选动作在目前环境中的适应程度,也即在目前状况下执行该动作的好坏,只不过不同模块之间用来评价好坏的标准不同。模块之间的仲裁器可以等价于一个平衡标准的动态加权器,对不同模块之间的评价结果进行动态加权,使它们具有可比性。这个全局的动态仲裁器,可以根据实际的比赛效果来学习调整,也可以由人类足球专家进行建议。比如设计者可以有意的

第4页

清华大学毕业设计论文

加重传球动作的权值来向智能体灌输多传球的战略意图。

接下来的几章将依照模块为序介绍几个重点的技术的设计与实现,第三章介绍截球技术,第四章是踢球技术,第五章是仲裁算法和视觉决策,第六章搜索传球线路的优化算法,第七章防守跑位体系,第八章简要介绍一下程序的结构。

第5页

清华大学毕业设计论文

第三章 截球技术的实现

3.1 问题介绍

对球运动的判断是足球运动员需要具备最基本的素质。仿真环境物理模型与实际比赛球的运动的物理模型有很大差异,即使是在人类足球比赛当中由于存在不同的场地条件和不同的天气条件,球运动的物理模型也会不同。所以对于一个人类足球队员来说,最基本应该具备适应比赛场地的能力,对于我们的仿真队员也是一样。截球技术需要解决的就是对球运动的判断,从而作出正确的截球决策,它是其他决策的基础。

我们把截球问题归纳成如图3的一个简单的场

景:白点代表球,红色的圆圈代表球员,dist 为球员

到球的距离,a 为球到球员之间的连线和球运动方向

的夹角,speed 为球的即时的运动速度。球的速度随

运动衰减。截球问题归结为给定dist 、a 和speed ,

决策出队员正确的截球角度b ,或者是当截到球时,

球运动的距离,并给出对截球所可能花的时间的估计。在介绍截球的算法之前,下一节将先对RoboCup 仿真环境中的运动模型做简单的介绍。

图3 截球场景

3.2 RoboCup 仿真环境的运动模型

在RoboCup 仿真环境中,时间被离散为周期,所以运动也是离散的。物理模型由下面的公式决定:

(u )=(v )+():accelerate

11,++t

y t x u t

y t x v ,t

y t x a a ,()=()+(u ):move 11,++t

y t x

p p t

y t x p p ,11,++t

y t x u 第6页

清华大学毕业设计论文

(v )=:decayspeed

11,++t

y t x v ),(11++×t

y t x u u decay ()=(0):resetacceleration 11,++t

y t x

a a 0,其中t 表示周期,()和()分别表示t 周期物体的位置和即时速度,

(u )为t-1到t 周期物体的平均速度。Decay 是一个运动的衰减因子,球的衰减因子为0.94,球员为0.4。()表示对象的加速度,球的加速度由踢球

动作(kick )获得,球员的加速度由冲刺(dash )获得。

t

y t x p p ,t

y t x v v ,t

y t x a a ,t

y t x

u , 仿真环境中的截球问题,等价于解一个由上面公式确定的球的运动轨迹和球员运动轨迹的交点。只不过在这里我们假设球在运动过程中不会获得加速度,也就是不考虑球在过程中被踢的情况。因为球员可以不断冲刺使自己保持匀速,所以我们假定球员的运动为匀速,这有助于简化问题。

下面将介绍我们采用的两种求解算法,然后进行比较,并且提出可能的改进方案。第一种二分法假设了物理模型,第二种BP 网络求解的方法没有假设物理模型。

3.3二分法求解

这个算法的原理比较简单,见图4.1。这里我们求

解的目标是当截到球时球运动的距离。假设球员沿着

绿线的方向尝试截球,当球员跑到球的运动轨迹上时,

根据球的运动模型,可以估计球这时所在位置,假设

如红点所示。这时球在队员前面(前面指离球原来所

在的位置近),如果绿线和球轨迹的交点在队员到球轨

迹的垂足以前,那么我们可以断定队员可以在绿线和

球轨迹的交点以前截到球,这样我们可以确定解的上界。当球员沿黄线跑至球运动的轨迹上的时候,因为他需要花比原先更长的时

间,则跑到时球一定已经在队员的后面了,所以我们可以确定解的下界。第二

图4.1、4.2截球的二分法求解 第7页

清华大学毕业设计论文

种可能的情况如图4.2,当球员跑至球的轨迹上时球已经在队员后面了,那么可以确定下界,如果红点所示的球的位置在垂足以前,那么如果队员沿黄线跑至球的运动轨迹需要花的时间比沿绿线跑至球的轨迹上长,所以我们可以断定这时球在队员前面,据此我们可以确定解的上界。截球尝试在垂点以后的两种情况也有类似的判断。

由上述原理我们得到求解算法:以队员到球运动轨迹上的垂点为分界线,通过二分法试探,每一次试探,利用球在队员跑到球轨迹上的时候运动的距离确定解的上界与下界。第一次试探点为垂点。如果试探结果解在垂点以前,以后的试探点都选取解的上、下边界的中点;如果解在垂点以后,而上界没有确定,则试探点为下界加上一个试探距离,一旦确定了上届,以后的试探选取二分点。通过反复的试探,我们可以很快的把解确定在一定精度的范围之内。

3.4 训练作截球判断的BP神经网络

二分法假设了球运动的物理模型已知,并且没有考虑环境噪声。本节提出的训练方法不需要球运动的物理模型,而是从环境交互当中由智能体通过观察,来辨识环境的物理模型,并且做出正确决策。训练时,我们构造出各种情况的截球场景,让智能体尝试各种角度截球,每当队员成功的截到球,就将成功的数据记下。采集到的成功的数据送入神经网络用BP算法进行训练。神经网络作为一个记忆的载体记录下这些成功的例子,能够进行实际各种场景的截球决策。

由于开始尝试时没有任何的信息和知识,采集到的成功例子比较少,而BP 算法需要大量的数据来覆盖整个特征空间。起初的训练效果可能不是很好,所以训练可能要反复进行多次。每次训练可以利用以前训练的结果,利用训练得出的神经网络决策出的结果为中心,在一定范围内随机搜索。开始训练时可能采集到的数据比较少,训练出的网络精度也较低。但利用这个精度较低的网络采集数据,可以得到更多的成功例子,这样可以训练出精度更高的网络。通过

第8页

清华大学毕业设计论文

反复的训练,得出的网络精度也越来越高。训练流程图如图5:

修正数据采集器

图5 截球训练流程图

3.5 比较和总结

方法一实际上适用于球运动方程单调递增的情况,而且收敛很快,物理意义十分直观,但是使用时必需清楚的知道物理模型。方法二不假设球运动的物理模型,并且可以对噪声的影响有所考虑,但实际上如果球的运动十分不规则,它的归纳能力也有限,尤其当解的曲面有较大突变的时候,神经网络本身可能会引入不定的因素,带来误差。

从学习算法的角度来说,方法一是一种搜索算法,利用了人类常识作为启发信息,加速了搜索,它的物理意义比较直观,便于在决策中运用;方法二是一种监督学习的算法,它通过对成功例子的记忆实现了一个输入到输出的多级映射,输入和最后输出的映射是一个决策过程,但是中间各级的映射没有物理意义。在实际运用当中,两种方法都可以做出较好的决策,但是在实际运用中方法一输出的结果比方法二准确。

结合方法一和方法二的优点,我们可以利用方法二的BP网络的归纳能力来推算当队员跑到球的轨迹上时球的运动的距离,即推算球得运动模型,然后利用方法一的搜索算法求解。新的算法只是假设了球运动是单调的,并且可以通过观察来获得球的运动模型,所以适用范围较广。

第9页

清华大学毕业设计论文

第四章 脚法的实现

4.1 问题介绍

RoboCup 仿真环境和真实环境一样,球员的踢球能力是

有限的,也就是说他们的脚力(即球员可以给球的最大加速

度)的是有限的,而且球员以不同姿态(这里的姿态指的是

身体朝向和踢球方向的夹角)可以给球的最大加速度不同。我们这里所说的脚法指的并不是一般意义上的脚法,而是一个具体明确的任务:给定球的初速度,把球按照指定的速度尽快踢出去,如图6。当运用到实战中的时候,则需要考虑对手和边线可能对踢球造成的影响,这时候的任务转变为:给定球的初速度,把球按照指定的速度尽快踢出去,并且在踢球的过程中不被对手断去,也不能出界。

图6踢球任务 下面的几节将先介绍Kalsruhe Brainstormers 队的算法,然后介绍我们在Kalsruhe Brainstormers 基础上作的一些探索,以及我们最后的解决方案,在介绍算法之前过程中将先简单介绍再励学习的基本原理。

4.2 再励学习(Reinfocement Learning)

4.2.1再励学习简介

再励学习是一种非监督学习的方法,它通过从环境中得到奖惩来自主的发现能够得到最大奖励的策略。再励学习最大的特点是采用试错法搜索和延迟奖惩。所谓试错法,即“吃一堑长一智”,指的是不断利用已有得知识的尝试各种动作,通过从环境中的到奖惩来修正自己的知识,从而修正策略。所谓延迟奖惩就是 第10页

清华大学毕业设计论文

将得到的奖惩折算分配到每个动作中去。当一个决策过程由一系列动作组成的时候,每个动作对最后的成功都作出一定的贡献,对最后的失败也都负有一定责任。只有合理的把最后的奖惩分配到各个动作中,才可能学习出正确决策。再励学习指的是具有试错法搜索和延迟奖惩两个特征的一类算法。其中包括动态归化(Dynamic programming )、蒙特卡罗法(Monte Carlo )、Q 学习(Q-Learning )等。下面用符号描述再励学习算法。

如果假设为智能体t 时刻的状态,r 在t 时刻得到的奖励(惩罚为负值),比如对于一场足球比赛当进球时t s t t r r 为正值表示奖励,当输球时r 为负值表示惩罚,a 为t 时刻采取的动作,R 为t 时刻得到的长远利益,假设,

t t ∑∞

=0k ++=1k t k r γt R γ为折现率,这里假设了每一时刻的折现率相等。从公式中可以看出,为t 时刻以后的所有的到的奖惩折现之和,表示了所谓的长远利益。再励学习的目标就是通过学习得到策略t R π,使得在状态s 下决策出的动作所获得的长远利益尽可能大。

t t a t R 再引入两个符号和V ,分别表示在状态下选择动作的长远回报值函数或动作选择评价值函数(评价在状态下选择的好坏),和状态的值函数(评价状态的好坏)。上标),{t t s a Q πt s ){t s πt s a t a t s t t s π说明智能体将一直以策略π决策,这两个值函数是和策略相关的。这也不难理解,智能体以后能得到的回报是和它以后的策略相关的。论文以后的部分不作说明将省去π。两个值函数的计算如下:

{s s R E s V t t ==|)(ππ{s R E a s Q t t ==|),(ππ}}

(1)

(2) a a s t =,E 表示数学期望。

第11页

清华大学毕业设计论文

再励学习算法通过和环境的交互,修正自己对状态评价值V 或是动作选择评价值Q 的估计,并利用修正后的评价值按照一定的策略选择动作来和环

境进行交互(策略举例:在每个s 状态下,选择使Q 最大的动作a )

,反复学习来获取最优策略。选择修正状态值或是修正动作选择评价值的不同,以及修正的方法的不同,派生出不同的再励学习算法。

)(s ),(a s ),(a s 4.2.2 Bellmen 最优方程

Bellmen 方程指出了最优策略应该满足的条件:

{}a a s s a s Q r E a s Q t t t a t ==+=++,|)',(max ),(1*'1*γπ

(3) ),(max )(**a s Q s V πα=

(4) 其中*表示最优策略。最优策略必需满足(3)和(4)式。因为只要它不满足(3)和(4)式,我们就有办法对它进行改进使得得到更大的Q 值或V 值,从而违背是最优策略的假设。对于有限状态的马尔可夫过程,Bellmen 方程有唯一解。

*π*π4.2.3 动态规划算法简介

动态规划算法用状态值V 作为决策的依据。它的更新方程如下:

)(s {s s s V r E s V t t k t k }=+=+++|)()(111γπ (5)

其中V 中的下标k 表示的第k 次迭带更新后的结果。可以看出,每次迭带更新利用了已有的估计。公式(5)中的迭带是策略相关的,迭带结果是根据策略对状态作的估计。n 迭带之后,V 将逐步逼近V 。

)(1+t k s )(s n )(*s 第12页

清华大学毕业设计论文

4.2.4 Q 学习算法简介

Q 学习算法用动作选择值Q 决策的依据,一步Q 学习算法更新方程如下:

),(a s []),(),(max(),(),(11t t t t t t t t a s Q a s Q r a s Q a s Q ?++←++γα

(6)

其中α是学习率。 从(6)中可以看出,Q 学习算法的迭带是策略无关的,它总是选择最大的作为迭带输入。同样经过反复迭带后,Q 将逐步逼近Q 。

),(1a s Q t +),(t t a s ),(*a s 4.3 用再励学习训练脚法

4.3.1 Kalsruhe Brainstormers 的方法

用再励学习训练脚法遇到的最大问题是连续空间的输入和连续动作输出的问题。训练脚法问题的输入为球的初始速度,以及球相对于球员的位置(以球员位置为原点,指定的出球速度的方向为x 轴),都是连续值;输出为每一脚给球的加速度,也是连续值。但是传统的再励学习算法处理的都是离散动作和离散状态的问题。Karlsruhe Brainstormers 采用了动态规划算法学习脚法,他们首先离散化了可选择的动作,设计了500种踢球动作来覆盖可能的可选动作。动作的奖惩设计为:(a)按指定速度把球踢出,1=r ;(b)没按指定速度把球踢出,但球仍在控球范围,;(c)球出控球范围而且没达到指定速度,0=r 1?=r 。Karlsruhe Brainstormers 用神经网络存储状态评价值V ,这里的为状态向量,(和分别为球的相对速度和相对位置。采用神经网络使他们就避免了对s 的离散化而可能带来的维数灾难。神经网)(s ),,,(y x y x p p v v s =),y x v v ),y p (x p 第13页

清华大学毕业设计论文

络的输入为s ,输出为V ,相应的状态评价值的修正算法转变成BP 算法的形式,即迭带出的V 被作为目标输入神经网络,用BP 算法修正神经网络。修正算法如下图:

)(s )(1s k +

图7 以神经网络作为状态值函数存储的动态规划算法

4.3.2 我们的实验结果

我们对Kalsruhe Brainstormers 的算法做了测试,发现学习效果并不像我们想象中那么好。在开始几乎没有任何知识的时候,学习十分缓慢。学了很长时间后,成功率上升,但并不能达到我们期望的高度,而且上升到一定高度训练结果开始振荡。

导致实验结果不如人意的原因主要是BP 训练的问题。我们知道用BP 算法训练要求样本多而且能够比较均匀的覆盖状态空间。而在学习之初几乎没有任何成功经验的时候,失败的例子显然多于成功的例子。当把失败的例子和成功的例子一起送入神经网络训练时,成功的例子被湮没于大量的失败中。当成功率上升到一定程度后,由于BP 网本身泛化能力有限,更多例子输入时,将影响已有的训练结果,导致网络出现振荡。当然算法的细节处理不当和一些参数的设置不好也可能是实验结果不如人意的原因。但是,显然BP 算法本身的缺点使它不能完全解决从离散的再励学习算法到连续再励学习算法的转变的问题。 第14页

清华大学毕业设计论文

4.3.3 我们的方法

尽管实验结果不是很理想,我们对利用再励学习来训练脚法的信心却增强了。用再励学习可以省去许多设计上的繁琐过程,而且它不假定环境的模型,当环境的物理模型改变时,只要重新学习一次,就可以得到新的环境中的脚法。

我们考虑采用离散化状态的方法。如果对所有输入的四个变量进行离散化必然带来维数灾难,但我们注意到了脚法问题本身的一个特点,即当当前球的相对位置和下一个周期球的相对位置确定后,球的相对速度可以推算出来。所以如果设计得当,我们可以得到一个只需要离散化的算法,这样就大大降低了状态空间的维数。

t p 1+t p ),(1y x t v v v +t p 基于上述考虑,我们把球员的控球区域离散化为,见图8.1。在图8.1所

表示的离散化方案中,p 均匀的分布在一个圆上,

我们固定了离原点的距离,只对相对角度离散化。可选动作集由两种动作构成:a)k p a k k p p m k p m k →=),(,即把球从控球范围内的一点踢到控球范围内的另一点,也就是我们所谓的倒脚;b ) 从控球范围内的一点把球按指定速度一脚踢出。这里我们的状态只有球相对于球员的位置。对于第一类动作,动作选择评价值:

k p m p kickout k a )(k p k p )),(()),(,(m k m k v p V m k a p Q →=, (7) 这里V 即Kalsruhe Brainstormers 算法中的状态评价值,是从位置转移到位置获得的速度。注意到(7)成立用到了我们对奖惩值的假设,即倒脚时。

m k v →k p m p 0=r 对于第二类动作,动作选择评价值:

(8) 1))(,(=kickout k k a p Q 这样由公式(7)和(8)我们新设计的状态和动作以及动作选择评价值和 第15页

清华大学毕业设计论文

Kalsruhe Brainstormers 算法中的状态、动作和状态评价值对应起来,也就为我们算法找到了依据。

因为第二类动作有确定的Q 值,所以学习的目标转变为学习,问题转变成了一个离散的Q 学习问题。实验结果表明学习

速度十分快,几乎不需要时间(在PIII500上做的实验),

而且准确。

)),(,(m k a p Q k 注意到我们的状态中并不包含球的初始速度,而实际

上不同的球的初始速度对动作的选择是有影响的。这种影

响表现为在不同球速下,由状态能转移到的的集合

不同,如图8.1。粉红色的点表示状态不能转移到的点,蓝点表示可以转移到的点。这个可转移到的点的集合不仅受球的初始速度的影响,而且受可以给球的最大加速度,即踢球的最大脚力的影响。而后者受踢球的姿势的影响,本章

第一节曾对此做过介绍。在Kalsruhe Brainstormers 的算法中,每个状态的状态评价值V 显然和它能转移到的状态有关,而输入的状态中并没有信息表明队员在这时的踢球姿势,所以Kalsruhe Brainstormers 的算法必须假设球员在不同踢球姿势情况下脚力差不多,并且选取平均脚力、最小脚力或是最大脚力作为状态转移的脚力限制。这种假设使Kalsruhe Brainstormers 的算法在实战使用中的效果打了折扣。

k p m p k p )(

s 图8.1 状态转移。我们的算法选择了记录动作选择评价值Q 而不是状态值作为动作决策的依据。这一点给我们带来的好处是这个Q 值的评价相对客观,不用假设脚力。脚力大小对动作选择的影响同球初始速度对动作选择的影响相同,即影响可以转移到的位置集合。我们在实际决策的过程中,可以根据实际的球的初始速度和脚力限制设置可以转移的位置集合,在可以转移到的位置集合中选择动作。 第16页

清华大学毕业设计论文

在实际比赛中需要考虑对手断球的威胁和踢球出界的危险。在我们的算法中,这两点对动作选择的影响同样表现在对可以转移到的位置集合的影响。如图8.3、8.4。这样我们很容易的把我们的算法扩展到可以实战运用的层次上去。

最终的算法:

(1) 学习过程:用Q 学习算法得到Q ;

)),(,(m k a p k (2) 使用过程:从当前状态出发,以Q 值为评价函数进行深度优先搜索,搜索中止目标为找到一条把球按指定位置踢出的路径。在扩展过程

中。状态为当前球的相对位置。可以扩展的点集受这时球的初速度、

最大脚力、对手和边界的影响。

图8.2、8.3和8.4分别为没有对手影响,加入一个对手考虑和加入边界考虑算法搜索出的路径。

图8.3 加入对手影响的踢球线路,粉红色的点表示对手可以踢到球的位置

图8.2 没有对手影响

的踢球线路,绿线表

示倒脚

图8.4 加入对手影响的踢球线路,红色的点表示在界外的点

从图中可以看出,算法很好的和各种实战的情况结合起来,有很高的实际价值。

下面我们讨论离散化给实际运用带来的影响。由于一旦我们开始我们踢球过程,每一脚都将把球踢到离散化的位置集合中的一点,所以实际可能带来的影响的主要是球初始位置和代表球初始位置的点之间的差别。我们在作扩展判断和推算状态转移所获得速度时,使用的都是实际的位置,而不是代 第17页

清华大学毕业设计论文

表点的位置,所以只有评价值和实际的值函数之间的差别可能发生错误。这两者之间的差别很小,而且这个差别可能影响的是路径的选择的好坏,而不是路径选择的正确性。也就是说经过离散化选择出的路径不一定是最好的,但一定是可行的,而且也应该是相当好的。从实际运用效果看,离散化带来的误差造成的影响很小。

)),(,(m k a p Q k 可以看出我们的算法很好结合了Q 学习算法和搜索算法的优点,并且利用问题的特点避开了对全部特征离散化而可能带来的维数灾难的问题,在运行效率和运用效果上都达到令人满意的程度。

第18页

2013年清华大学校级“优秀博士硕士学位论文”获奖名单-推荐下载

2013年清华大学校级优秀博士硕士学位论文获奖名单 经学生和导师申请、学位评定分委员会推荐、研究生院审定,确定2013年校级优秀博士学位论文一等奖26篇,二等奖68篇,优秀硕士学位论文173篇。获奖名单如下。优秀博士学位论文一等奖(共26篇)院系作者导师论文题目 建筑学院袁琳吴良镛从都江堰灌区发展论成都平原人居环境的生态文明土木系王宇航聂建国曲线梁桥钢管混凝土桥墩的扭转效应研究水利系杨雨亭尚松浩植被非均匀覆盖下垫面蒸散发模型及应用研究环境学院梁赛张天柱多种政策对我国物质流和价值流变化的综合作用分析 机械系周铭温诗铸仿生粘着的机理及应用研究 精仪系桂丽丽杨昌喜基于低维碳纳米材料饱和吸收体的锁模光纤激光器热能系张易阳李水清基于滞止火焰合成的高温场纳米颗粒动力学研究电机系兰江张钟华溯源到电阻基准的电容和互感数字化精密测量方法研究电子系魏鲲鹏张志军多频段/宽带、双极化全向天线阵列关键技术研究计算机系王健楠冯建华基于众包的实体解析关键问题研究自动化系邓岳戴琼海高维低质视觉信息的结构化感知与理解航院季湘樱冯西桥生物启发的表面浸润与粘附力学研究 工物系佘顶王侃基于自主堆用蒙卡程序RMC 的燃耗与源收敛问题研究化工系赵梦强魏飞基于水滑石类化合物的碳纳米管多级组装结构材料学院胡嘉冕南策文多铁性异质结:电压调控磁性的计算模拟及元器件设计数学系陈志杰邹文明非线性薛定谔方程组的解 化学系闫晓宇席婵娟酸根型有机锆试剂与亲电试剂的反应研究 生命学院冯越杨茂君一类潜在的抗生素药物靶点蛋白NDH-2的结构与功能研究经管学院张瑾陈国青商务智能决策中的代表性信息提取理论与方法研究公管学院智强苏竣权责、网络与知识:国家科技计划执行研究法学院齐飞车丕照论常设国际争端解决机构的造法 新闻学院庞云黠熊澄宇社交网络平台上意见领袖极化现象研究:以新浪微博为例人文学院李季璇万俊人从权利到权力——论洛克自然法思想与其政治哲学的关系社科学院汪建华孙立平新工人的生活与抗争政治 美术学院王小茉张夫也法国文艺复兴:弗朗索瓦一世时期枫丹白露派的装饰艺术医学院 刘飞 白净 基于小动物模型的荧光分子成像方法与应用研究 优秀博士学位论文二等奖(共68篇)院系作者导师论文题目 李岩付林基于吸收式换热的热电联产集中供热系统配置与运行研究陶金张杰喀什文化区传统聚落空间分布与形态研究建筑学院 吴艳 单军滇西北民族聚居地建筑地区性与民族性的关联研究王萌石永久强烈地震作用下钢框架的损伤退化行为土木系 陈喜群 史其信 交通流动态随机演化模型研究 、管路敷设技术通过管线敷设技术不仅可以解决吊顶层配置不规范高中资料试卷问题,而且可保障各类管路习题到位。在管路敷设过程中,要加强看护关于管路高中资料试卷连接管口处理高中资料试卷弯扁度固定盒位置保护层防腐跨接地线弯曲半径标高等,要求技术交底。管线敷设技术中包含线槽、管架等多项方式,为解决高中语文电气课件中管壁薄、接口不严等问题,合理利用管线敷设技术。线缆敷设原则:在分线盒处,当不同电压回路交叉时,应采用金属隔板进行隔开处理;同一线槽内,强电回路须同时切断习题电源,线缆敷设完毕,要进行检查和检测处理、电气课件中调试对全部高中资料试卷电气设备,在安装过程中以及安装结束后进行 高中资料试卷调整试验;通电检查所有设备高中资料试卷相互作用与相互关系,根据生产工艺高中资料试卷要求,对电气设备进行空载与带负荷下高中资料试卷调控试验;对设备进行调整使其在正常工况下与过度工作下都可以正常工作;对于继电保护进行整核对定值,审核与校对图纸,编写复杂设备与装置高中资料试卷调试方案,编写重要设备高中资料试卷试验方案以及系统启动方案;对整套启动过程中高中资料试卷电气设备进行调试工作并且进行过关运行高中资料试卷技术指导。对于调试过程中高中资料试卷技术问题,作为调试人员,需要在事前掌握图纸资料、设备制造厂家出具高中资料试卷试验报告与相关技术资料,并且了解现场设备高中资料试卷布置情况与有关高中资料试卷电气系统接线等情况,然后根据规范与规程规定,制定设备调试高中资料试卷方案 。 、电气设备调试高中资料试卷技术电力保护装置调试技术,电力保护高中资料试卷配置技术是指机组在进行继电保护高中资料试卷总体配置时,需要在最大限度内来确保机组高中资料试卷安全,并且尽可能地缩小故障高中资料试卷破坏范围,或者对某些异常高中资料试卷工况进行自动处理,尤其要避免错误高中资料试卷保护装置动作,并且拒绝动作,来避免不必要高中资料试卷突然停机。因此,电力高中资料试卷保护装置调试技术,要求电力保护装置做到准确灵活。对于差动保护装置高中资料试卷调试技术是指发电机一变压器组在发生内部故障时,需要进行外部电源高中资料试卷切除从而采用高中资料试卷主要保护装置。

清华大学硕士论文博士论文格式及范文详解

清华大学硕士论文博士论文格式及 范文详解 清华大学硕士论文博士论文编辑排版建议采用的字体、字号名称实例中英文字体搭配中文英文字号章标题一级节标题二级节标题三级节标题正文段落表题与图题第二章手征介质平面波导手征介质平面波导的本征方程场分析基本原理国内外对称手征介质平板波导的研究… 图4-1 一般手征介质园波导黑体黑体黑体黑体宋体宋体Arial Arial Arial Arial Times New Roman Times New Roman 小三号(15pt) 四号(14pt) (13 pt) 小四号(12 pt) 小四号(12 pt) (11 pt) 文献[19] Fogarasi G, et al. The calculation of ?, J. Am. Chem. Sco. 1992, 114: 8191-8201 第四章结果与讨论- 96 - 宋体Times New Roman 五号( pt) 页眉页码宋体五号通栏

下划线粗1 pt Times New Roman 五号,页脚居中Times New Roman 与正文段落字号相适应,用Word 2000 编辑数学公式时建议采取如下尺寸定义清华大学博士论文格式样例:芳杂环高分子的高温水解特性与量子化学研究(申请清华大学理学博士学位论文) 培养单位:专业:清华大学化学系物理化学易某某某甲甲教授某乙乙教授研究生:指导教师:三号仿宋或华文仿宋副指导教师:二○○一年四月论文送审日期专业排版,专业论文写作修改降低论文重复率制作答辩幻灯片请联系淘宝旺旺:文交天下友淘宝搜索@文天下/ 芳杂环高分三子号仿的宋或高华温文水仿解宋特性与量子请化将中学文研封究面左边易某某Experimental and Theoretical Investigations of Hydrolytic Stability of

本科毕业论文一般要求

毕业论文(设计)撰写与存档要求 1基本要求 1.1 毕业设计必须由学生本人独立完成,不得弄虚作假,不得抄袭他人成果。 1.2 论文应中心突出,内容充实,论据充分,论证有力,数据可靠,结构紧凑, 层次分明,图表清晰,格式规范,文字流畅,字迹工整,结论解释合理。 1.3 毕业设计中所使用的计量单位一律采用国际标准单位。 1.4 对论文中的图或表要给予解释,统一标上编号和图题,安排于相应位置。 若同类图表数量过多,也可作为附录列于论文后面。 1.5 凡手绘图形一律用碳素笔在硫酸纸或复印纸上誊描,并标上图号、图题, 然后贴附于论文适当位置或附录中,要求图面整洁、比例适当。流程图、设备及 结构图应按国标绘制。 1.6 毕业设计篇幅以8000 字左右(不含图表、程序和计算数字)为宜。 1.7 毕业设计的封面可参照学校提供的项目内容自行设计(附后),所有文字部 分一律用 A4 号纸激光打印,一级标题用三号黑体;二级标题用四号黑体;其 他标题和正文用小四号宋体(表格内填写内容用小四号楷体),段落前空 2 个汉字,单倍行距。页面设置 : 上/ 下/ 左/ 右分别为 2.4/2.2/2.6/2.0; 页码标在右下。 2内容要求 2.1标题要求简洁、确切、鲜明,有概括性。字数不宜超过25 个汉字,如 果有些细节必须放进标题,可以分成主标题和副标题。 2.2摘要叙述本设计的主要内容、特点,文字要精练。中文摘要约 300 汉字; 英文摘要约 250个实词。 2.3关键词从说明书标题或正文中挑选 3~5 个最能表达主要内容的词作为 关键词,同时有中、英文对照,分别附于中、英文摘要后。 2.4 目录写出目录,标明页码。 2.5 正文前言、本论、结论三个部分。 ( 1)前言(引言)本设计的目的、意义、范围及应达到的技术要求;简述本课题 在国内外的发展概况及存在的问题;本设计的指导思想;阐述本设计应解决的主 要问题。 ( 2)本论 ①设计方案论证说明为什么要选择这个设计方案(包括各种方案的分析、比 较);阐述所采用方案的特点(如采用了何种新技术、新措施、提高了什么性 能等)。 ②计算部分该部分在设计说明书中应占有相当的比例。要列出各零部件的工作条件、给定的参数、计算公式以及各主要参数计算的详细步骤和计算结果;根据此计算应选用什么元、器件或零、部件采用计算机的设计还应包括各种软件设计。 ③结构设计部分机械结构设计、各种电气控制线路设计及功能电路设计、计算机 控制的硬件装置设计等,以及以上各种设计所绘制的图纸。④样机或试件的各种实 验及测试情况:包括实验方法、线路及数据处理等。⑤方案的校验所设计的系统是 否满足各项性能指标的要求,能否达到预期效

清华大学 计算机科学与技术专业 本科毕业设计

数据结构分析及算法研究 一.数据结构概述 当今时代是一个以信息技术(Information Technology,简称IT)为代表的知识经济时代,计算机技术和信息科技的发展更是日新月异,从各个方面影响和改变着我们的生活,而其中的计算机网络技术的发展更为迅速,已经渗透到了我们生活的各个方面,人们已经离不开计算机网络,并且随着因特网的迅速普及,给我们的学习与生活条件带来更大的方便,我们与外部世界的联系将更加的紧密和快

速。 随着人们对于信息资源共享以及信息交流的迫切需求,促使网络技术的产生和快速发展,计算机网络的产生和使用为人类信息文明的发展带来了革命性的变化。随着计算机网络管理功能的强化,计算机硬件技术和软件技术都与网络技术融合到一起,近几年来应用程序的开发更发展到以WEB门户网站为界面,以与后台网络分布式数据库和实时交互操作的程序库,共同组成网络环境下的三层架构模式,这成了计算机应用程序开发模式的主流趋势。 本次石景山卫生局网络建设项目是以局域网为依托,架构办公自动化、信息传播、疾病控制和有关智能化系统等运行平台,为用户提供先进的办公、数据共享、信息传播和学术交流手段,实现各系统之间的信息交流和信息资源共享,实现内部局域网与Internet以及区卫生所专网的连接。

第一章计算机局域网概述 系统的理解网络理论对于掌握网络技术是十分必要的,本论文中仅对于相关技术作简单的介绍,便于读者阅读。 一.计算机局域网 “网络就是计算机”,计算机网络已经在企业、事业、学校、政府机关等地方成为不可缺少的工具。对网络的进一步定义是: “至少有两个具有共享需求的个体;至少有一种方法或通路使其个体互连;至少有一种规则使两个或两个以上个体相互传信。”个体指计算机硬件和软件、方法或通路指连接与传输媒介、规则指网络通信协议。网络在不同的阶段有不同的含义,定义也会被修改,但几十年的变迁有一点始终不改,那就是“资源”的共享,包括软件资源、硬件资源、数据和服务资源的共享,它是组网的原始动力。 1.计算机网络的分类 网络按照传输距离可以分为一下3种: 1)局域网(Local Area Networks,简称LAN)。 局域网的传输距离较短一般从几米到几公里,往往用于一个单位,比如一个公司、一个政府部门等。局域网的优点是传输速率高,往往可以达到百兆或千兆,局域网的另一个优点是传输信号质量高,误码率低,传输时延小。 2)广域网(Wide Area Networks,简称WAN)。 广域网也成为远程网,传输距离为几百公里甚至更远,一般跨城市甚至国家。广域网往往会用多种通信介质,比如光纤、微波中继、卫星通信与电力载波等。如何在广域网上保证网络访问的安全,是目前网络技术的关键和核心技术领域之一。 3)城域网(Metropolitan Area Network,简称MAN)。 城域网介于LAN和WAN之间,传输距离由几公里到十几公里,“城域网”可以理解为一个城市范围内的网络,事实上目前的城域网通常以高速环网为核心架构一个城市的主干高速通信网。

清华大学工程硕士论文

驼峰仿真系统 Hump Simulation System (申请清华大学工程硕士专业学位论文) 培养单位:计算机与科学技术系 工程领域:计算机技术 申请人:赵秀全 指导教师:冯建华教授 联合指导教师:丁昆高级工程师 二○○八年五月

关于学位论文使用授权的说明 本人完全了解清华大学有关保留、使用学位论文的规定,即:清华大学拥有在著作权法规定范围内学位论文的使用权,其中包括:(1)已获学位的研究生必须按学校规定提交学位论文,学校可以采用影印、缩印或其他复制手段保存研究生上交的学位论文;(2)为教学和科研目的,学校可以将公开的学位论文作为资料在图书馆、资料室等场所供校内师生阅读,或在校园网上供校内师生浏览部分内容;(3)根据《中华人民共和国学位条例暂行实施办法》,向国家图书馆报送可以公开的学位论文。 本人保证遵守上述规定。 (保密的论文在解密后遵守此规定) 作者签名:导师签名: 日期:日期:

摘要 本文作者具有十多年从事驼峰自动化控制研究的经验,基于实际工作中的需要提出一种新型的基于和驼峰控制系统信息共享的驼峰自由溜放的仿真系统的设计方法。 在查阅有关该领域内的研究文献后,密切结合现场的实际应用,提出了自己的分析方法。对于线路、车辆、调速设备、气象等对象实体建立起相应的对象模型,建模更多从实际应用入手,考虑理论和应用的密切结合,这些模型比起以往的一些论文具有很大的突破性。由于能够和实际控制系统联机,得到更多的实际应用数据,使得模型具有自我修正功能。 论文的重点是对于处于自由溜放状态的车辆,利用模型化分析建立受力质点,从质点受力分析入手,结合经典的自由溜放公式,逐步推导出符合与现场情况的修正后溜放公式。与以往仿真系统的比较,该仿真系统密切结合实际应用,具有更大的适应性。随后就仿真实现过程做出了说明,特别强调了仿真系统与控制系统的信息共享方法,为以后修正模型中的参数确定提供了基础。 作为仿真系统能够尽可能逼真实际应用情况,对于需要修正的参数、修正的方法也出了详细的论述。从工程应用角度出发,指出了目前控制系统调速控制中所存在的控制盲区问题,提出了对于控制系统调速参数(定速、放头拦尾)修正及反馈的方法。 关键词:驼峰仿真实时数据模型修正优化控制 Ⅰ

4-6 清华大学2011毕业论文舒圆媛论文打印版

含甲胺基化合物的消毒副产物NDMA特性 与机理研究 清华大学环境学院给排水科学与工程2011届舒圆媛 指导教师:张晓健教授 摘要: N-亚硝基二甲胺(NDMA)由于其对人类健康潜在的巨大危害性已经成为饮用水安全领域研究的热点问题。弄清水体中哪些物质是NDMA的前体物,是研究该消毒副产物生成机理与控制技术的重要基础。已有文献报道,具有特定化学结构——如胺基的某些水处理药剂、农药等能显著生成NDMA,但已有研究在不同胺基结构对化学物质消毒生成NDMA的影响方面缺乏系统认识,并缺乏对其他含胺基官能团的物质消毒生成NDMA的研究。 本研究选取杀虫脒、抗蚜威、绿麦隆、氯化胆碱、聚二烯丙基二甲基氯化 铵、洁尔灭、十六烷基三甲基溴化铵等七种含甲基胺官能团的化学物质及酪氨 酸、赖氨酸和单宁酸进行氯胺、自由氯和二氧化氯消毒试验,识别具有较大 NDMA生成潜能的目标化合物和相应消毒剂。在此基础上,研究pH、消毒剂剂量和消毒剂接触时间对目标化合物与相应消毒剂反应生成NDMA的影响;研究不同物质与消毒剂反应生成NDMA的动力学;结合有机化学合成理论,提出含有不同胺基官能团结构的化学物质和消毒剂反应时可能的NDMA生成途径,为判别具有类似化学结构的环境物质在水处理过程中的NDMA生成风险和开发相应的控制技术提供理论依据。 本研究得出如下主要结论: (1)含甲基胺官能团的化学物质是NDMA的重要前体物,但物质结构对 NDMA生成有重要影响。氯胺消毒时,聚二烯丙基二甲基氯化铵和杀虫脒有最大的NDMA生成潜能。 (2)消毒方式是所选物质生成NDMA的重要影响因素之一,在相同条件 下,氯胺消毒能产生比自由氯和二氧化氯消毒更多的NDMA。 (3)在氯胺消毒条件下,反应体系的pH值影响所选物质释放二甲胺 (DMA)及DMA进一步生成NDMA的反应。对绿麦隆和十六烷基三甲基溴 化铵的研究表明,pH越低,NDMA生成量越大。

本科大学毕业论文范文模板

本科大学毕业论文范文模板 本科是本科中重要的实践性教学环节,是高校实现人才培养目标的重要内容,是衡量本科教学水平的重要标准,也是学生毕业与学士学位资格认证的重要依据。下面是为大家推荐的本科毕业论文,供大家参考。 01浅谈电子商务环境下对商业的影响 摘要:本文从电子商务自身特点及其对会计环境与会计的影响出发,分析了及会计实务,包括会计目标、会计假设、会计原则、会计要素、会计职能、会计核算等,尤其是会计方面受到的冲击和影响。并从会计报告的目标、时效、内容、方式等方面建设性地提出了基于电子商务的会计报告。 关健词:电子商务会计会计报告 一、引言 随着21世纪的到来和发展,电子商务正在引领着网络发展的新方向,电子商务是、信息技术在商务领域的总和应用和体现,更是高新与现代商务、企业的营销策略相结合的产物。电子商务的出现改变了传统会计的生存环境,在很大程度上将对会计的发展起到不仅

作用。电子商务是指那些具有商业活动能力的生产企业、政府部门、金融机构、消费者等充分利用网络技术和现代先进的信息技术来从事的各项商业活动。电子商务环境下询问价格、了解市场行情、对商品报价、接到客户下达的订单、发货、支付货款等过程基本都是无纸化,都是利用各种电子工具完成的。 电子商务的出现和发展,为世界各国企业的发展带来了新的机遇,但是,随之而来的是企业之间的激烈竞争。电子商务的出现是信息时代网络飞速发展的产物,对传统的会计理论、会计实务都产生了极大的冲击和影响。随着我国各企业电子商务活动的不断展开,各企业必须对电子商务会计进行大力发展才能不断适应面对电子商务的发展而带来的企业经营管理方式的转变。 二、电子商务对传统商业会计理论的影响 1、电子商务环境下的会计目标 传统会计理论中,会计目标主要是指:在一定的时间、空间条件下,各会计主体作用在会计客体上期望达到的目的或要求,是各企业会计运行的主要方向。电子商务环境下会计的目标是建立在电子化、网络化、信息化的基础上的,一方面,要重视受托责任观的基础性作用,这主要是由于虽然会计环境由于电子商务的产生而发生

清华大学研究生答辩流程提示

清华大学研究生答辩流程提示 一.检查培养要求完成情况 1.研究生自查是否达到学科培养要求 2.研究生教务根据研究生入学时的培养方案以及学校和院系的相关要求,检查研究 生是否达到学科培养要求 3. 注意事项虽已达到培养要求、但仍有在学课程未获学分的,不能进入答辩程序 二.论文送审 (一)论文送审前 1.研究生1)向导师提交学位论文,并根据导师意见修改 2)与导师讨论确定学位论文密级 3)按照院系规定时间提交论文进行学术规范检查初检 4)向院系提交学位论文做格式审查 5)登录“论文评审与答辩”系统维护答辩申请相关信息、打印材料2.研究生导师1)审查研究生学位论文,提出修改意见,表明是否同意送审 2)拟定学位论文评阅人名单(涉密论文按保密规定送审) 3)初拟博士学位论文答辩委员会名单 (硕士学位论文实行集中答辩,答辩委员会组成由院系确定) 3.研究生教务1)检查研究生培养方案完成情况 2)向研究生发布学位论文抽查通知并落实抽查工作 3)学术规范检查、发布研究生论文查重的时间节点 (各院系可按照本单位规定在论文送审前或分委员会前进行学术规范检查) 4)进行学位论文格式审查(一般是先规范检查,后格式审查) 5)检查学位论文评阅人、答辩委员会组成是否符合学校和院系的要求 6)指定硕士集中答辩秘书,安排硕士学位论文集中答辩事宜 7)对答辩秘书进行培训 4. 注意事项1)经导师同意论文送审的博士生,至少于答辩前6周向所在院系研究 生管理部门提出送审申请

2)经导师同意论文送审的硕士生,至少于答辩前4周提出送审申请(二)论文送审至答辩前 答辩秘书1)协助送审论文(涉密论文的送审需符合保密规定) 2)回收并检查学位论文学术评议书 三、论文答辩 (一)论文答辩前 1.研究生在“论文评审与答辩”系统中维护答辩信息 2.研究生导师填写“指导教师对研究生学位论文的学术评语” 拟定答辩委员会组成名单 3.答辩秘书1)协助导师检查论文评阅人以及答辩委员会组成是否符合学校规定 2)整理、填写学位论文学术评议书意见并汇总 3)检查审批材料填写是否规范、准确、齐备 4)审批材料报所在单位院系主管领导审批 5)审批材料报学位分委员会主席审批(提示:于答辩前至少1周时间完成) 6)领取答辩表决票(加盖学位评定分委员会公章有效) 7)准备答辩横幅,张贴答辩公告 4.分会主席1)审查学位论文评阅是否符合要求 2)审查答辩委员会成员的专业特长与申请答辩学生论文研究内容是 否相关 3)审查答辩委员会组成是否符合学校规定 ?博士学位论文答辩委员会规定: ●答辩委员会由五至七人组成,成员应是具有博士生指导资格的教师或正 高职称专家,其中:(1)半数以上应具有本学科或相关学科博士生指导 资格;(2)至少包含一位论文评阅人;(3)有校外专家二至三人,校内 专家不少于三人;(4)属于学科交叉研究的论文,应聘一至二位相关学 科的专家;(5)至少包含一位学位分委员会委员(特殊情况可由分委员 会指定教师代替)。 ●答辩委员会主席应由具有正高职称的博士生指导教师担任。论文答辩委 员会秘书应由我校具有中级以上职称或我校具有相关学科博士学位的专 业人员担任。初次担任秘书工作的,院系须对其进行专门培训。 ●指导教师(最多一人)可作为委员参加论文答辩会,但不能担任主席; 申请人的论文答辩被抽查时,其指导教师不得担任答辩委员会成员。

本科生毕业设计(论文)模板2017

论文) 题 目: 线性表的设计和实现 专业年级: 2012级信息与计算科学专业 指导教师: 李四 年 月 日

中国石油大学胜利学院本科毕业设计(论文) 摘 要 数据结构算法设计和演示(C++)树和查找是在面向对象思想和技术的指导下,采用面向对象的编程语言(C++)和面向对象的编程工具( Borland C++ Builder 6.0)开发出来的小型应用程序。它的功能主要是将数据结构中链表、栈、队列、树、查找、图和排序部分的典型算法和数据结构用面向对象的方法封装成类,并通过类的对外接口和对象之间的消息传递来实现这些算法,同时利用 C++ Builder 6.0中丰富的控件资学中帮助理解、辅助教学和自我学习的作用。 关键词:毕业设计;格式;规范

ABSTRACT Xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx Keywords :Xxxx ;Xxxx ;Xxxx

目录 2.2.2 三级标题名 (2) 2.3线性链表 (2) 第三章设计的主体内容 (3) 3.1系统结构的设计 (3) 3.2交互界面的设计和实现 (3) 3.3线性表的00P序设计 (3) 3.3.1线性表的顺序存储的实现 (3) 第四章结果分析与讨论 (4) 第五章结论 (6) 参考文献 (7) 致谢 (8) 附录 (9) 附录A名词术语及缩略词 (9)

第一章 计算机与网络技术的高速发展,特别是面向对象技术的出现,使得 C++的软件开发得到了迅速普及。 本课题主要………………

清华大学本科毕设论文

清华大学 综合论文训练 题目:基于四旋翼无人机的PM2.5测量 系别:电子工程系 专业:电子信息科学与技术

中文摘要 近年来,随着无人航空技术发展的日趋完善与成熟,无人机逐渐受到重视并且得到广泛应用。无人机凭借其机动强、经济上较为实惠、方便起飞、降落等方面的优势,越来越受到人们的青睐。同时,无线遥感技术的飞速发展与日趋完善,也在很大程度推动了无人机的应用,无人搭载平台在空气检测、环境监测、恶劣条件侦探、航拍等方面都得到广泛应用。 本课题以无人机作为搭载平台,搭载空气传感器与GPS模块,实现对PM2.5与PM10数据的采集,在PC端通过单片机编程,实现SD卡存储所采集的数据,达到空气质量检测的目的。 本文依次介绍系统的硬件部分、软件部分。之后,对传感器的可信度进行评估,介绍如何通过单片机编程实现用SD卡存储PM2.5(PM10)值。最后对采集的数据进行处理,绘制PM2.5(PM10)随着不同的经纬度、高度、风速的变化趋势曲线图,得出结论。 关键词:四旋翼无人机;SDS011激光传感器;STM32单片机;数据储存与显示

ABSTRACT With the rapid development of UAV technology, its application has become more and more widespread together. With its advantage in mobility, fastness, economy, convenience and so on, the UAV has been used more widespread. With the development of wireless remote sensing technology, the UAV has been used in meteorological monitoring, resource surveys, aerial survey and respond to emergencies widely. This topic uses the UAV as carrying platform, and equips UAV with air sensor and GPS module, implementation of PM2.5 and PM10 data collection, through the microcontroller programming to achieve the data stored on the SD card, and finally achieve the purpose of air quality testing. This paper firstly introduces the hardware part and software part of the system. And the evaluates the reliability of the sensor, describes how to use the microcontroller to store the value of PM2.5(PM10) in the SD card. Finally deal with the data collected, and then draw the trends and graph of the values of PM2.5(PM10) change with the latitude and longitude, altitude, wind speed. Keywords: Four-rotor UAV;SDS011 laser sensor;STM32 microcontroller;Data storage and display

清华大学学位论文模板

T hu T hesis ? ? xueruini@https://www.sodocs.net/doc/9111856012.html, v4.5.1(2009/02/28) 1. L A T E X Project Public License 2. 3. 4. L A T E X Project Public License ?Tsinghua University L A T E X Thesis Template. ?LittleLeo@newsmth

1 1 2 1 2.1 (1) 2.2 (1) 2.3 (2) 2.4 (2) 2.4.1 (2) 2.4.2dvi→ps→pdf (3) 2.4.3dvipdfm(x) (3) 2.4.4pd?atex (4) 2.4.5xelatex (4) 2.4.6 (4) 2.5 (5) 3 5 3.1 (5) 3.2T hu T hesis (5) 3.3T hu T hesis (6) 3.4 (7) 3.5 (8) 3.5.1 (8) 3.5.2 (11) 3.5.3 (12) 3.6 (14) 3.7 (15) 4 15 5 17 5.1 ............ 17 5.2 (17) 5.3 (19) 5.4 (22) 5.4.1Three matters (22) 5.4.2 (22) 5.4.3 (24) 5.4.4 (25) 5.4.5 (26) 5.4.6 (27) 5.4.7 (28) 5.4.8 ..30 5.4.9 (31) 5.4.10 (32) 5.4.11 (35) 5.4.12 (36) 5.4.13 (44) 5.4.14 (45) 5.4.15 (46) 5.4.16 (47) 5.4.17 (48) 5.4.18 (49) 5.4.19 (49) 5.4.20 (50) 5.4.21 (50) 5.4.22 ..50 5.4.23 (51) 52 57

清华大学硕士论文模板

清华大学博士(硕士)论文 模板使用说明 (申请清华大学理学博士学位论文) 培养单位:清华大学计算机科学与技术系专业:计算机科学与技术 研究生:王磊 指导教师:徐光祐教授 二○○三年九月

An Introduction to Doctor(Master) Thesis Template of Tsinghua University Dissertation Submitted to Tsinghua University in partial ful?llment of the requirement for the degree of Doctor of Science by Lei Wang (Computer Science) Dissertation Supervisor:Professor Guangyou Xu September,2003

关于学位论文使用授权的说明 本人完全了解清华大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。 (保密的论文在解密后应遵守此规定) 作者签名:导师签名: 日期:日期:

中文摘要 摘要 这篇论文主要用来展示清华大学博士(硕士)论文L A T E X+CJK模板,并简要介绍其使用方法。 这一模板已获得清华大学研究生院的认可,符合相应的博士(硕士)论文的标准格式。这篇文档按照博士论文的要求生成,如果要符合硕士论文的要求,可能需要在个别地方做适当的修改。 一般而言,中文摘要包含500-1000字,1-2页。关键词5-10个。 关键词:论文,模板,清华大学,博士,硕士,L A T E X,CJK –I–

大学本科毕业论文注意事项

毕业论文注意事项 一、凡符合下列情况之一者,应取消其答辩资格,按不及格处理。 (一)累计旷课时间达到或超过毕业设计(论文)全过程1/4者; (二)未完成毕业设计(论文)教学要求者; (三)毕业设计(论文)未通过格式审查者; (四) 毕业论文未进行相似度检测或检测重复率超过25%的。 二、学生答辩前,应撰写书面提纲,容包括课题的任务、目的和意义,所采用的主要原始资料或参考文献,设计(论文)的基本容及主要方法,成果、结论和评价。 毕业设计(论文)本文结构规化要求 (一)基本要求 1.毕业设计(论文)应中心突出,容充实,论据充分,数据可靠,结构紧凑,层次分明,图表清晰,格式规,文字流畅,字迹工整,结论正确。 2.毕业设计(论文)中所使用的度量单位一律采用国家标准单位。 3.对论文中的图表要给予解释,统一标上编号和图表名,编排于相应位置。若同类图表数量过多,也可作为附录列于论文后面。 4.凡手绘图形一律用碳素笔在硫酸纸或复印纸上誊描,并标上图号、图名,然后贴附于论文适当位置或附录中,要求图面整

洁、比例适当。 5.毕业设计(论文)篇幅以8000-10000字为宜。 6.毕业设计(论文)一律用A4纸打印,具体要求见打印规。 7.参考文献注录格式要符合国家标准。 (二)毕业设计(论文)的资料组成 毕业设计(论文)资料包括装订完毕的毕业设计(论文)本文、毕业设计(论文)任务书、毕业设计(论文)开题报告、毕业设计(论文)评审表、毕业设计(论文)答辩记录表及工程图纸、光盘等。 (三)容要求 1.毕业论文的容要求 (1)题目:应简洁、明确、有概括性,字数不宜超过20个字。 (2)摘要:要有高度的概括力,语言精练、明确,同时有中、英文对照,中文摘要约300汉字,英文摘要约250个实词。 (3)关键词:从论文标题或正文中挑选3~5个最能表达主要容的词作为关键词,同时有中、英文对照,分别附于中英、文摘要后。 (4)目录:写出目录,标明页码。 (5)正文:包括前言、本论、结论三个部分。 ①前言(引言):是论文的开头部分,主要说明论文写作的目的、现实意义、对所研究问题的认识,并提出论文的中心论点等。

本科毕业论文标准范文

本科生毕业论文 题目:******************************* 学生姓名:************* 指导老师: ************* 学院:************* 专业班级: ************* 完成时间: *************

毕业论文(设计)任务书 毕业论文(设计)题目重大环境污染事故罪主观方面探析 题目类型理论研究题目来源生产实际题 网址:https://www.sodocs.net/doc/9111856012.html, 毕业论文(设计)时间从2007年3月1日至2007年6月8日 一、毕业论文(设计)内容要求 1、写作本文应当掌握以下基础知识:我国刑法理论中的罪过及其类型;重大环境污染事故罪的犯罪构成;重大环境污染事故罪的现状及司法实践中面临的主要问题,我国刑法学界关于重大环境污染事故罪主观方面的主流观点及主要分歧。 2、本论文应当结合我国司法实践中在认定重大环境污染事故罪主观方面存在的问题如故意实施污染环境的行为、能否适用严格责任的问题、举证责任的分配问题等等,对目前刑法学界关于重大环境污染事故罪主观方面的各种观点如“过失论”、“混合罪过论”、“故意论”等进行分析论证,并提出对司法实践中重大环境污染事故罪主观方面认定有指导、参考价值的观点。 3、本文的写作应当对我国重大环境污染事故罪主观方面的立法沿革进行考察,对外国有关该罪主观方面的立法例进行分析比较,收集刑法学界关于该罪主观方面的相关文献并进行全面充分的分析研究,围绕该罪的主观方面组织论文内容,合理安排论文结构,做到重点突出、观点鲜明、论证充分、语言通顺。 4、论文应当符合《中南大学法学院2006届毕业论文工作手册》 关于论文格式的要求,不少于10000字。 [1]题目类型:(1)理论研究(2)实验研究(3)工程设计(4)工程技术研究(5)软件开发

RoboCup清华大学毕业设计论文

清华大学毕业设计论文 目录 第一章背景介绍 (1) 第二章设计理念和决策框架 (3) 2.1设计理念 (3) 2.2决策框架 (4) 第三章截球技术的实现 (6) 3.1 问题介绍 (6) 3.2 RoboCup仿真环境的运动模型 (6) 3.3二分法求解 (7) 3.4 训练作截球判断的BP神经网络 (8) 3.5 比较和总结 (9) 第四章脚法的实现 (10) 4.1 问题介绍 (10) 4.2 再励学习(Reinfocement Learning) (10) 4.2.1再励学习简介 (10) 4.2.2 Bellmen最优方程 (12) 4.2.3 动态规划算法简介 (12) 4.2.4 Q学习算法简介 (13) 4.3 用再励学习训练脚法 (13) 4.3.1 Kalsruhe Brainstormers 的方法 (13) 4.3.2 我们的实验结果 (14) 4.3.3 我们的方法 (15) 第五章仲裁算法 (19) 5.1 问题介绍 (19) 5.2 RoboCup仿真环境中队员的观察模型 (19) 5.3 仲裁算法 (20) 5.4视野宽度的决策 (23) 第六章传球线路的搜索算法 (24) 6.1 问题介绍 (24) 6.2 传球线路搜索算法 (25) 6.2.1 简单的搜索算法 (25)

清华大学毕业设计论文 6.2.2 优化搜索算法 (25) 6.2.3 穿越速度的计算 (28) 第七章防守体系 (29) 7.1 问题介绍 (29) 7.2 角色的定义 (29) 7.3 阵形的定义 (30) 7.4 一个简单的防守系统 (30) 7.5 考虑全局利益的防守系统 (31) 7.5.1 考虑全局利益防守体系介绍 (31) 7.5.2 求解全局利益最优的防守方案 (32) 7.5.3 实战效果 (32) 7.5.4 缺点 (33) 第八章 TSINGHUAEOLUS的程序结构 (34) 参考文献 (36) 致谢 (37)

实验类毕业论文模板

X X 学院 毕业论文 题目:×××××××××××××××××× ××××××××××××× 的研制 学生:××× 学号:××× 系(院):××× 专业:××× 班级:××× 指导教师及职称:×××教授、×××实验师 起止时间:2012年 4月—— 2012年12月

教务处制表

××××××××××××××× 的研制 摘要:目的:本文研究了…………………………..。方法:通过….试验……………….。结果:研究结果表明,…………………….。结论:………………………………。 关键词:辣木酸乳饮料;配方;稳定性;影响因素 Study on Moringa Oleifera Yogurt Beverage Abstract:…Objective:……………………Methods:………………………………Results : …………………..….Conc lusion:………………………………………… Key words: Moringa oleifera lactobacillus drink; Formula; Stabilitly; Influence factors

目录 摘要................................................................ I Abstract............................................................ I 1 前言.. (1) 1.1 调配型酸乳饮料的发展新趋势 (1) 1.2辣木酸乳饮料研究的意义 (1) 2 材料与方法 (2) 2.1 材料与设备 (2) 2.1.1 材料 (2) 2.1.2 设备 (2) 2.2 试验设计 (2) 2.3 测定指标 (3) 2.3.1 感官指标测定 (3) 2.3.2 粘度测定 (3) 3工艺研究 (3) 3.1 辣木酸乳的工艺流程 (3) 3.2 操作要点 (3) 4 结果分析 (3) 4.1 辣木酸乳饮料感官指标 (3) 4.2 辣木酸乳饮料品质指标测定结果 (3) 4.2.1 辣木酸乳饮料综合评分结果分析 (4) 4.2.2 辣木酸乳饮料粘度结果分析 (5) 5 结论 (6) 致 (7) 参考文献 (8)

中南大学本科生毕业论文

本科毕业设计(论文) GRADUATION DESIGN(THESIS) 题 目: 指导教师: 学 院: 专业班级: 本科生院制 20XX 年X 月 校徽与中英文 封面标题, 45磅黑体 封面标题英 封面栏目, 栏目内容,小二号楷体 部门版权标 完成日期,小 封面页,不 版面调整行。当题目等栏有2行文字,版

年产50万吨MTO 工厂设计 摘要 50万吨MTO 工厂的初步设计。通过分析当前国内外MTO 生产和研究现状,对生产工艺进行了选择论证。然后运用Aspen 软件模拟初步的工艺流程,并通过对一系列工艺参数,如精馏塔的塔板数—产品纯度、进料塔板数—产品纯度、产品纯度—回流比、再沸器负荷—回流比等进行灵敏度分析,优化设备操作条件,提高工艺的合理性和经济性。本设计还针对工艺流程进行换热网络设计和对全局换热网络进行了优化和评估,通过内部流股之间相互换热以减少公用工程的消耗,最终优化后节约79.4%的热公用工程资源和73.7%的

Design of a MTO plant with output of 500,000 tons a MTO plant with an annual output of was selected and demonstrated. Aspen process. Heat integration method was applied to optimize the heat exchange network. Rational heat exchange between process streams were suggested which resulted in the decreasing of utilities consumption and exchanger number. The heat integration leaded to energy saving of 79.4% of heat utilities and 73.7% of the cold utilities. In addition, the water pinch technology was also implemented to optimize the water network. The water operating unit was classified The amount of fresh water The optimized water network economic analysis to the entire project was estimated in order to get the project construction cost and profitability. In summary, this design is of some practical significance for the production and design of the MTO industry.

相关主题