搜档网
当前位置:搜档网 › RNAseq-表达图谱 清华大学本科论文

RNAseq-表达图谱 清华大学本科论文

RNAseq-表达图谱 清华大学本科论文
RNAseq-表达图谱 清华大学本科论文

清 华 大 学

综 合 论 文 训 练

题目:用RNA-Seq数据估计剪接异构体表达的方法调研与程序实现

系别:自动化系

专业:自动化

姓名:马鑫云

指导教师:张学工教授

2011 年 6 月 10 日

于学位论文使用授权的说明

本人完全了解清华大学有关保留、使用学位论文的规定,即:学校有权保留学位论文的复印件,允许该论文被查阅和借阅;学校可以公布该论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存该论文。

(涉密的学位论文在解密后应遵守此规定)

签名:导师签名:日期:

中文摘要

RNA-Seq技术是利用深度测序技术来进行转录组水平研究的新兴技术,是当前生物信息领域的一个研究热点。RNA-Seq技术凭借其高精度、高通量、高检测范围等一系列优点冲击着传统的转录组研究的方法。

RNA-Seq技术在转录组研究方面有很多应用,其中很重要的一个应用是估计基因和剪接异构体的表达值。本文研究了几种利用RNA-Seq技术进行表达值估计的方法,对各方法的特点进行了一定的分析,并且编程实现了其中的一种基于“读段非均匀分布假设”的算法。

关键词:RNA-Seq;表达值估计;非均匀分布

ABSTRACT

RNA-Seq is a recently developed technology to study transcriptome which is based on deep-sequencing. RNA-Seq has shaken the status of traditional transcriptome researching methods, because of its advantages such as unprecedented precision, throughput and high dynamic range over them.

RNA-Seq can be applied to many transcriptome researching fields, and one of the most important applications is to estimate the expression level of genes and isoforms. This paper conducts a study about some methods based on RNA-Seq to estimate the expression level of transcriptome, analyze the characteristics of each method and realize one of these methods which is based on the hypothesis of "reads' start position follow non-uniform distribution"by programming.

Keywords: RNA-Seq; estimation of expression level; non-uniform distribution

目录

第1章 引言 (1)

1.1研究背景 (1)

1.2 RNA-Seq原理 (1)

1.3 RNA-Seq技术研究现状 (2)

1.4本文的主要工作 (3)

第2章 基因表达值的估计 (4)

2.1基因表达与基因表达值 (4)

2.2利用基因芯片和RNA-Seq进行基因表达值的估计 (4)

2.3 RPKM简介 (5)

2.4几种利用RNA-Seq估计表达值的方法 (6)

2.4.1基于读段均匀分布假设的基因表达值计算 (6)

2.4.2基于读段均匀分布假设的剪接异构体表达值计算 (7)

2.4.3基于读段非均匀分布假设的剪接异构体表达值计算 (7)

2.4.4几种方法的联系 (8)

第3章 “基于读段非均匀分布假设模型”(N-URD)简介 (9)

3.1符号说明 (9)

3.2“基于读段均匀分布假设模型”URD简介 (9)

3.3“基于读段非均匀分布假设模型”N-URD简介 (10)

3.3.1在URD模型的基础上引入了表征非均匀分布的参数 (12)

3.3.2 GBC, Global Bias Curve (12)

3.3.3 LBC, Local Bias Curve (13)

3.3.4 GBC矩阵和LBC矩阵 (14)

3.3.5 b矩阵 (15)

3.4似然函数 (16)

第4章 N-URD模型的算法实现 (17)

4.1程序概况 (17)

4.2程序框架 (18)

4.3获取数据 (18)

4.4数据预处理 (19)

4.5核心算法的实现 (20)

4.5.1获取带权值的基因结构矩阵 (20)

4.5.2求解最大似然估计 (21)

4.6结果输出 (23)

4.7程序总流程图 (25)

4.8仿真实验 (26)

4.9实验结果 (28)

4.10程序有待改进之处 (28)

第5章 结论与展望 (29)

5.1结论 (29)

5.2展望 (29)

插图索引 (31)

表格索引 (32)

参考文献 (33)

致谢 (34)

声明 (35)

附录A 外文资料的书面翻译 (36)

附录B:CisGenome browser介绍 (51)

第1章引言

1.1研究背景

随着测序技术的不断发展,测序平台产生的数据量不断增大(表1.1)。如何

从这些海量数据中发掘其背后隐藏的生物意义成为了当今生物信息学的一个挑

战。

表1.1测序技术的发展[1,2]

测序技术 通量(/轮)

第一代测序技术 Sanger/ABI3730 DNA Analyzer 56Kbp

第二代测序技术 Roche/GS-FLX Titanium 500Mbp

Illumina/HiSeq 2000, HiScan 200Gbp

ABI/SOLiD 5500xl >100Gbp

第三代测序技术 Helicos/Heliscope 21-37Gbp

高通量RNA测序技术(RNA-Seq)是利用深度测序技术进行生物信息研究的

一个非常成功的典范。RNA-Seq利用深度测序技术对转录组(transcriptome)进

行测序,进而对所关心的细胞或组织进行转录组水平的研究。RNA-Seq在估计基

因表达、发现单核苷酸多态性(SNP)、新基因的检测等诸多重要领域都有非常重

要的作用。以估计基因表达为例,与传统的基因芯片(microarray)技术相比,

RNA-Seq技术不需要事先设计探针,对于基因组图谱还未完成的物种同样有效,

能够在全基因组范围内进行检测,具有单核苷酸分辨率的高检测精度,而且信噪

比高,应用范围广,已经成为估计基因表达和研究转录组的重要手段[3]。

本文的研究重点是对当下利用RNA-Seq数据进行基因和剪接异构体表达值

估计的几种模型进行研究,并对其中一种基于“读段非均匀分布假设”的算法进

行程序实现。

1.2 RNA-Seq原理

RNA-Seq是利用深度测序技术对转录组进行测序的技术。RNA-Seq的整个流

程如图1.1所示。

(fr 库。RNA

1.3下生相关

发展在RNA-S fragment ),利用深度A-Seq 的过3 RNA-Se RNA-Seq 生物信息学关的文献数年份

2007

2008

2009

2010

2011

从表1.2可

展之迅速以Seq 中,被在这些片段度测序技术对过程。 eq 技术研技术凭借其学的一个研究数量。

表1.2 (至2011年可以看到,近

以及在当前生图1.1测序的单链段的单端或对这些cDN 研究现状

其突出的优究热点。表PubMed 近几6月6日)近几年与R

生物信息研RNA-Seq 流链RNA 首先或者双端拼装NA 文库进行优点,迅速成表1.2列出了几年收录的R 所有文章0 6 33 152 139 RNA-Seq 相

研究领域的影流程[4]

先被打断并装上接头(行测序得到成为基因组了PubMed 近RNA-Seq 相关(篇) 综007175

关的文献呈影响力。

并反转录成c adaptor )制到读段序列的组学研究的重近几年收录关文献

综述性文章(7

呈指数增长cDNA 片段制备成cDN 的过程就是重要手段,录的与RNA (篇) 长,可见

RNA

NA 文是

是当A-Seq

A-Seq

在利用RNA-Seq进行表达值估计方面,很多生物信息学实验室都进行了广泛而深入的研究。

2008年,Mortazavi等人提出了“读段在基因上均匀分布”的假设[5],在此假设的基础上提出了利用RNA-Seq技术来估计基因表达的方法,并提出了一个能够定量表征基因表达值的概念——RPKM值[5]。

2009年,Hui Jiang等人基于“读段在基因上均匀分布”的假设,结合基因的结构信息,提出了利用RNA-Seq技术进行剪接异构体水平的表达值估计的算法[6]。

2010年,武征鹏等人基于“读段在基因上非均匀分布”的假设,提出了一个新的模型。该模型能够利用读段在基因上的实际分布的信息,进行剪接异构体水平的表达值估计[7]。

2010年,Bo Li等人利用生成模型,从测序的机理出发建立统计模型,并且

利用统计推断的方法进行剪接异构体水平的表达值估计[8]。该方法由于在建模时

利用统计的方法处理读段定位的不确定性,因此可以处理读段多定位的问题。1.4本文的主要工作

本文的主要工作是研究近几年在生物信息领域提出的关于基因表达值估计和剪接异构体表达值估计的几种方法,在此基础上,本文还对武征鹏的基于“读段非均匀分布假设”的算法进行了程序实现。

第2章基因表达值的估计

2.1基因表达与基因表达值

基因表达(gene expression)是指生物细胞在生命周期中,依照中心法则把储存在DNA中的遗传信息通过一定的生物过程转移到具有生物功能的基因产物的

过程。基因的表达值是指由基因生成的基因产物的数量。在生物信息学领域,通常以一个基因所转录出来的转录本(transcript)的数量来表征该基因的表达值。

由于转录本的数量对于细胞当前和将来的行为有着很大的影响[5],因此,对基因

表达值的正确估计是十分重要的。

在基因转录成信使RNA(mRNA)的过程中可能发生选择性剪切,同一个基因可能转录出多个mRNA,这些mRNA被称为“剪接异构体”(isoform)。对某

个基因中的各个剪接异构体丰度的估计称为剪接异构体表达值估计。由于剪接异构体的表达值的变化与许多复杂疾病的发展有着密切联系[9],因此剪接异构体的

表达值估计也是非常重要的。

2.2利用基因芯片和RNA-Seq进行基因表达值的估计

估计基因表达的传统方法是用基因芯片(microarray)技术。基因芯片基于杂交(hybridization)原理,利用人工合成的特定核苷酸序列作为探针(probe)来

检测与之互补配对的核苷酸序列的丰度。其流程是在一个很小的芯片上种上大量特定的DNA探针,将带有荧光标记的待测样品加入到该芯片中,令其与探针进

行杂交。通过对基因芯片进行荧光成像,可以获取与每个探针杂交的核苷酸序列的浓度,进而便可获得相应的基因表达值。

基因芯片曾经是基因表达值估计的主流方法,但是由于该技术只能用于检测已知基因的表达值,而且需要事先设计探针,检测范围较小,现在在基因表达值估计领域中基因芯片的地位正逐渐被新兴的RNA-Seq技术所动摇。

RNA-Seq技术相对于基因芯片而言是一个新兴的技术。它以深度测序为基础,可以进行很多生物信息学的分析,估计基因表达是RNA-Seq技术应用的一个方面。利用RNA-Seq技术估计基因表达值的做法是先利用深度测序技术获取转录组的

序列信息,该信息以一定长度的读段(read)序列形式来表示。得到读段序列信

息之即可测序在基位到2.3具。于2

越多之后,利用可得到读段序的结果,因基因上的读到某个基因3 RPKM 简RPKM 是RPKM 2008年第一显然,测

多。因此,用读段定位软段在基因上的因此转录本读段数。在利因上的读段数图2.1 利简介

是利用RNA 是Reads Per 一次提出[5]RPK 序深度越深

简单地利用软件将各读的分布信息本的丰度在R 利用RNA-S 数进行某种利用RNA-Seq -Seq 技术用r Kilobase p 。RPKM 的KM =被定总的深,基因的

用被定位到读段定位(m 息。由于RNA RNA-Seq 中Seq 估计基种形式的归一q 进行基因表用来定量估per Million m 的计算公式定位到某基因的测序深度长度越长,

到某个基因内mapping )到A-Seq 的测中就体现为因表达时,一化来作为表达值估计的估计基因表达mapped rea 式如下:

×因的读段数基因长度

被定位到

内部的读段到参考基因测序读段是对为能够被定位通常采用的为其表达值的的流程[4]

达值的一个ads 的缩写,910×数 到该基因内部

段数来表示其因的相应位置对转录本打位到该转录的方法就是的定量表示个非常有效的由Mortaz 部的读段数

其表达值是置,打断后录本所是将定示。

的工zavi 数也会

是不合

理的。RPKM通过将定位到某个基因内的读段数对总测序深度以及该基因的长度进行归一化,来表示该基因的表达值。

由于RPKM对基因的长度和测序深度进行了归一化,因此,它具有了在不同样本和同一个样本中的不同基因、剪接异构体之间的可比性[6]。

2.4几种利用RNA-Seq估计表达值的方法

本节介绍近几年发表的几种利用RNA-Seq技术进行基因和剪接异构体表达

值估计的模型和算法。

2.4.1基于读段均匀分布假设的基因表达值计算

Mortazavi等人于2008年提出了一个“读段在基因上均匀分布”的假设[5],

并且基于这个均匀分布的假设提出了一个简单而有效的估计基因表达值的方法——利用基因的RPKM值作为其表达水平的一个估计[5]。

在“读段均匀分布”的假设下,被定位到某个基因内的读段数与该基因的长度和测序深度呈正比。因此,为了估计某基因的表达值,应当将所有被定位到该基因的读段数对该基因的长度和测序深度进行归一化。这便是RPKM的概念。

当所有的读段都被唯一地定位到某个基因时,可以用简单地用RPKM来估计基因表达值。但是当读段存在多定位的时候,尤其是能定位到多个基因的时候,由于该读段到底来自于哪个基因并不能从读段序列和读段定位信息来重现,因此,涉及到这些读段的基因的表达值就不能简单地套用RPKM的概念。在Mortazavi

等人的工作中对这个问题进行了一定的分析,并且提出了一种解决办法:首先利用唯一定位的读段进行基因表达值的估计,之后对于那些定位到多个基因的读段,以当前基因表达值的比例将其分配到所涉及到的基因,再进行基因表达值的估计。

此外,Mortazavi等人在2008年的论文中还对“读段均匀分布”这一假设的

合理性进行了一定的分析。Mortazavi发现在实验中得到的真实数据并没有呈现很好的均匀分布特性,读段分布有一定的偏向。Mortazavi认为其原因可能与RNA

的二级结构会使引物结合位点的选择产生偏好有关。Mortazavi还发现先在反转录之前先进行RNA打断会一定程度上减轻读段分布的非均匀性,不过并不能完全

消除。

2.4.2基于读段均匀分布假设的剪接异构体表达值计算

由于在转录的过程中有选择性剪接的存在,一个基因很有可能转录出多个剪接异构体,研究各个剪接异构体的表达值也是一个十分重要的课题。Trapnell等

人的实验(2010年)证明,基因的各个剪接异构体表达值的相对高低对老鼠的肌肉细胞生成有着决定性的作用[10];Humbert等人的实验(2007年)和 Beyer等人的实验(2008年)都显示出剪接异构体表达值的变化与许多复杂疾病的发展有着密切的联系[9,11]。

Hui Jiang等人在2009年提出了一个基于“读段均匀分布假设”的模型估计

剪接异构体表达值的算法[6]。Hui Jiang证明:当读段在基因上均匀分布时,落入该基因各外显子内的读段数服从泊松分布。基于基因各外显子之间相互独立的假设可以得到读段在整个基因上的分布模型,我们称该模型为URD(Uniform Read Distribution)模型[7]。得到读段的在基因上的分布模型之后,便可以利用最大似

然估计的方法估计各剪接异构体的表达值。

2.4.3基于读段非均匀分布假设的剪接异构体表达值计算

Dohn于2008年发现,高通量测序产生的数据分布有明显的偏差[12],Mortazavi 于同年发现读段分布的非均匀性[5]。

现在认为造成读段在基因上分布非均匀的原因不止一个,一方面可能是由于RNA的二级结构造成反转录时引物对RNA的结合位点具有偏好性,另一方面,GC含量可能会影响扩增效率,进而导致读段分布的非均匀性。

武征鹏等人在2010年提出了一个基于“读段非均匀分布假设”的模型

N-URD[7]。该模型在Hui Jiang的URD模型的基础上引入了表征非均匀分布的特征,使得该模型能够更好地刻画真实数据的分布特性,其估计的剪接异构体表达值更加接近真实值[7]。

同年,Bo Li等人基于深度测序的原理建立了一个生成模型[8]。该模型的建立过程模拟了深度测序的几个主要步骤,并且考虑了每个步骤中存在的不确定因素。该模型在所有剪接异构体的表达值和利用RNA-Seq得到的所有读段序列之间建

立了联系,并利用统计推断中的EM算法给出了估计各个剪接异构体表达值的方法。由于该模型很好地刻画了测序机理,因此能够天然地解决读段分布非均匀的问题。此外,由于该模型使用统计模型来刻画测序中的不确定性,因此还能够解决读段多定位的问题。

2.4.4几种方法的联系

上述几种方法之间虽然具有很大的差别,研究问题的侧重点也有所区别,但是还是有着很明显的联系。

Mortazavi等人的方法较为朴素,并且只能估计基因的表达值,但是他们提出的“利用归一化的读段数来定量表示表达值”的思想为之后几种表达值估计方法奠定了基础;Hui Jiang等人的方法将表达值估计的问题从基因水平上升到剪接异构体水平,并且在表达值估计问题中引入了统计推断的思想;武征鹏等人的方法对Hui Jiang等人的模型进行了改进,使其能够更好地反映真实数据的信息,从而改善表达值估计的结果;Bo Li等人的工作是对“均匀分布假设”比较彻底的改进,不需要依赖于先前的分布假设,能够较好地反映表达值和测序读段序列之间的关系。

同样是处理“读段非均匀分布”的问题,武征鹏等人的方法虽然并没有建立一个完全基于“读段非均匀分布”假设的模型,理论上不够完备,但是由于该方法部分借鉴了URD模型的很好的性质(如似然函数的凸性),因此能够在不明显增加问题复杂度的前提下对表达值的估计效果进行较为明显的改进。Bo Li等人的工作虽然理论上比较完备,不依赖于分布假设,但是在实际操作中还是需要很多经验性的知识(如读段起始位置的经验分布)来帮助模型的求解,因此会在一定程度上影响估计的精度。武征鹏等人利用仿真数据证明:在绝大多数情况下,N-URD模型的估计精度要略高于Bo Li的生成模型[7]。武征鹏等人的工作更加偏重经验性,Bo Li等人的工作更加看重模型的普适性,长远来说,Bo Li等人的模型因其比较强的适应能力可能会愈加重要,但是在经验性还很重要的现在,武征鹏等人的工作也是十分重要的。

第3章 “基于读段非均匀分布假设模型”(N-URD )简介

3.1 符号说明

为了便于对问题进行描述,本节先介绍一些本文中对于模型描述需要用到的符号:

研究基因:G

该基因的外显子数:n

该基因的剪接异构体数:m

该基因各个外显子的长度(bp ):()12,,...,n l l l

落在该基因的各个外显子中的读段数:()12,,...,n x x x

落在整个基因上的所有读段数:w

该基因各个剪接异构体的表达值:()12,,...,m θθθ

为了反映该基因各剪接异构体的结构信息,本文引入两个结构矩阵a 和b 。其中:a 是一个0-1指示矩阵,元素1ij a =表示该基因的第i 个剪接异构体中含有第j 个外显子,0ij a =表示该基因的第i 个剪接异构体中不含第j 个外显子;b 是一个浮点类型的指示矩阵,能够比a 矩阵反映更加精细的基因结构信息。对于剪接异构体i ,ij b 的值反映了定位到该剪接异构体的第j 个外显子内的读段数的期望,

ij b 的值越大,表明被定为到该外显子内的读段数的期望也越大。

3.2 “基于读段均匀分布假设模型”URD 简介

Hui Jiang 等人在2009年提出了一个基于“读段在基因上均匀分布”的假设来计算剪接异构体表达值的模型URD (Uniform Read Distribution )[6]。Hui Jiang 证明:如果读段被均匀地定位到基因上,则被定位到该基因的一个外显子内的读段数是一个近似服从泊松分布的随机变量[6],以该基因的第j 个外显子为例,该随机变量的参数为:

1m j j ij i i l w a λθ==∑ (3-1)

其中各参数的含义请见第3.1节。

由此很容易得到估计剪接异构体表达值的最大似然函数为:

(|)!j j x j j j e L x x λλ?Θ=

(3-2)

进一步可以假设该基因的各个外显子上的读段数之间是相互独立的,则可以得到联合的对数似然函数为:

()()()1211111log |,,...,log log !n m n

m n

n j ij i j j ij i j j i j i j L x x x w l a x l w a x θθ=====??Θ=?+?????∑∑∑∑∑ (3-3)

解此优化问题,找到一组使得对数似然函数最大的参数()12,,...,m θθθ,则此()12,,...,m θθθ就是最优的剪接异构体表达值。

可以证明,联合对数似然函数(式3-2)是凸的[6],具有良好的优化性质,保证局部最优解等价于全局最优解。

3.3 “基于读段非均匀分布假设模型”N-URD 简介

虽然基于均匀分布假设的模型在数学上有很好的性质,而且已经有前人基于该假设建立了有效的模型,但是实际的实验数据却显示:读段在基因上的分布有着很明显的非均匀性。

(a )

EI24

(b)KNG1

(c)SLCO2B1

图3.1 读段在基因上分布的真实情况[7]

图3.1是利用Hui Jiang等人开发的CisGenome browser软件得到的基因读段分布的可视化表示。该图给出了人类基因组中的三个基因上的读段分布情况。每幅图中最上方显示的是基因的坐标,中间显示的是该基因各个剪接异构体中的外显子分布情况,最下方显示了被定位到该基因的读段的分布情况。

可以看到,读段在基因上面的分布呈现出明显的非均匀性,3'端(右)的读段密度明显高于5'端(左)。可以想象,在估计基因表达值的时候将读段分布的非均匀性也考虑进来理应会提升估计的精度。

武征鹏等人于2010年发表了一个“基于读段非均匀分布假设模型”的算法[7]。该算法在估计基因表达值的时候引入了能够表征读段非均匀分布的参数,使得模型更加接近真实情形,从而提升了基因表达值估计的性能[7]。

3.3.1在URD模型的基础上引入了表征非均匀分布的参数

武征鹏的模型是建立在Hui Jiang的均匀分布模型的基础之上的一个模型,通过在均匀分布模型中引入两个能够表征非均匀分布的参数来提升估计性能。这两个参数分别是:全局偏差曲线GBC(Global Bias Curve)和局部偏差曲线LBC (Local Bias Curve)。这两个参数分别表征了所有基因中读段分布的总体特性和某个特定基因中的读段分布特性。

3.3.2 GBC, Global Bias Curve

GBC是一条从基因的5'端到3'端的曲线,来自于对整个测序样本读段的统计,综合考虑了所有基因上面的读段分布情况,反映了整个测序样本中读段的分布情况。

本文采用归一化的统计直方图作为对GBC的估计。

本文估计GBC曲线的具体流程如下:

1.选择只有一个剪接异构体的基因

由于那些有多个剪接异构体的基因其读段的分布还受到该基因结构的影

响,因此本文在计算GBC曲线时只考虑那些只有一个剪接异构体的基因。

2.筛去低表达基因

由于那些低表达的基因有较大的不确定性,因此我们滤去那些读段数少

于一定阈值(本文的实验选取的阈值为100)的基因。

3.统计读段数

通过前两步筛选之后得到符合估计GBC曲线要求的基因。利用读段定位

信息,获取这些基因上的读段分布情况。在本文的实验中,用统计直方

图来表示读段的分布情况。为了减少读段数的波动性,也为了便于综合

不同基因之间的读段分布信息,在统计直方图的时候需要先将个基因分

成等长的几个区间(区间数不可过多,在本文的实验中,各基因被等分

为10个区间)。得到各基因的区间之后统计每个基因落在各个区间内的

读段数,通过统计所有的基因落在各个区间内的读段数的总和,可以绘

制成总的直方图如图3.2(a)所示。

4.归一化

为了便于后续的计算,本文进一步将3.2(a)中的曲线进行归一化,使

得各区间的平均值为1,如图3.2(b)所示。

图3.2(b)即是本文的GBC曲线。

(a )读段分布直方图

(b )偏差曲线

图3.2 偏差曲线示意图[7] 3.3.3 LBC, Local Bias Curve

LBC 和GBC 的不同在于它是针对某个特定的基因,所刻画的是某个基因自身的读段分布情况。本文中的LBC 曲线为一个阶梯函数,该阶梯函数在该基因的每个外显子的范围内维持恒定值,该恒定值为:

()1?,1,2,...,m j j ij i x l a j n θ==∑ (3-4)式(3-4)相当于将落在每个外显子中的读段数对该外显子在URD 模型中的泊松分布参数λ(见3.2节对URD 模型的说明)进行归一化的结果(仅差一个常数w ,w 为所有的读段数,在某次测序中为常数,因此对读段分布情况没有影响),而对于服从泊松分布的随机变量而言,λ表示该变量的期望值。因此式(3-4)反映了各外显子中实际的读段数与预期读段数之间的比值。又由于泊松分布是基于“读段均匀分布”假设的,因此式(3-4)也反映了实际读段的分布情况和均匀分布假设的差距。

注意到,该式中的θ值在估计LBC 曲线时是未知的,在第一次计算LBC 时,可以令()()12,,...,1,1,...,1m θθθ=来求解LBC ,求得各个i θ之后再代入式(3-4)中,

更新LBC 曲线的值,进而求得新的i θ,如此往复。这是一个迭代的过程。

3.3.4 GBC 矩阵和LBC 矩阵

在3.3.2和3.3.3小节中得到的GBC 曲线和LBC 曲线均是一维的曲线,并不能反映基因各剪接异构体的结构,而在实际的算法中,需要的是一个能够表示基因结构的带权值的指示矩阵。

图3.3给出了利用偏差曲线获取带权指示矩阵的过程。

(a )将区间分成三部分 (b )对每个部分取平均值

图3.3 利用偏差曲线得到带权值的指示矩阵[7]

以GBC 矩阵为例。用第3.3.2节中的方法得到GBC 曲线之后(图3.3(a )实线),为了得到某个基因的GBC 矩阵,首先,选定该基因的某个剪接异构体作为研究对象。将GBC 曲线分割成若干段,其段数恰好为该剪接异构体的外显子数,且每段的长度之比恰好为各个外显子的长度之比。之后计算每段区间中GBC 曲线下方所围成的面积,并将该面积对该段区间的长度进行归一化,得到的结果即为该剪接异构体的外显子在GBC 矩阵中所对应的元素的值。对于那些不在该剪接异构体中的外显子,只需令GBC 矩阵对应的元素为0即可。对该基因的每个剪接异构体都进行如上的计算之后即可得到最终的GBC 矩阵。

从LBC 曲线获得LBC 矩阵L 有两种算法。第一种算法是由武征鹏提出的,其计算方法与本小节所述的GBC 矩阵的计算过程类似,只需将GBC 曲线替换成LBC 曲线即可。第二种算法是由本文提出的一种新的算法。新的算法并没有将区间分段然后求取各区间内LBC 曲线所围面积的步骤,而是简单地对剪接异构体中所包含的外显子的LBC 值进行按比例放大,这个比例是整条LBC 曲线下方所围面积和该剪接异构体中的外显子的LBC 曲线下方所谓面积的比值。

新算法和武征鹏算法的示意图如下:

2013年清华大学校级“优秀博士硕士学位论文”获奖名单-推荐下载

2013年清华大学校级优秀博士硕士学位论文获奖名单 经学生和导师申请、学位评定分委员会推荐、研究生院审定,确定2013年校级优秀博士学位论文一等奖26篇,二等奖68篇,优秀硕士学位论文173篇。获奖名单如下。优秀博士学位论文一等奖(共26篇)院系作者导师论文题目 建筑学院袁琳吴良镛从都江堰灌区发展论成都平原人居环境的生态文明土木系王宇航聂建国曲线梁桥钢管混凝土桥墩的扭转效应研究水利系杨雨亭尚松浩植被非均匀覆盖下垫面蒸散发模型及应用研究环境学院梁赛张天柱多种政策对我国物质流和价值流变化的综合作用分析 机械系周铭温诗铸仿生粘着的机理及应用研究 精仪系桂丽丽杨昌喜基于低维碳纳米材料饱和吸收体的锁模光纤激光器热能系张易阳李水清基于滞止火焰合成的高温场纳米颗粒动力学研究电机系兰江张钟华溯源到电阻基准的电容和互感数字化精密测量方法研究电子系魏鲲鹏张志军多频段/宽带、双极化全向天线阵列关键技术研究计算机系王健楠冯建华基于众包的实体解析关键问题研究自动化系邓岳戴琼海高维低质视觉信息的结构化感知与理解航院季湘樱冯西桥生物启发的表面浸润与粘附力学研究 工物系佘顶王侃基于自主堆用蒙卡程序RMC 的燃耗与源收敛问题研究化工系赵梦强魏飞基于水滑石类化合物的碳纳米管多级组装结构材料学院胡嘉冕南策文多铁性异质结:电压调控磁性的计算模拟及元器件设计数学系陈志杰邹文明非线性薛定谔方程组的解 化学系闫晓宇席婵娟酸根型有机锆试剂与亲电试剂的反应研究 生命学院冯越杨茂君一类潜在的抗生素药物靶点蛋白NDH-2的结构与功能研究经管学院张瑾陈国青商务智能决策中的代表性信息提取理论与方法研究公管学院智强苏竣权责、网络与知识:国家科技计划执行研究法学院齐飞车丕照论常设国际争端解决机构的造法 新闻学院庞云黠熊澄宇社交网络平台上意见领袖极化现象研究:以新浪微博为例人文学院李季璇万俊人从权利到权力——论洛克自然法思想与其政治哲学的关系社科学院汪建华孙立平新工人的生活与抗争政治 美术学院王小茉张夫也法国文艺复兴:弗朗索瓦一世时期枫丹白露派的装饰艺术医学院 刘飞 白净 基于小动物模型的荧光分子成像方法与应用研究 优秀博士学位论文二等奖(共68篇)院系作者导师论文题目 李岩付林基于吸收式换热的热电联产集中供热系统配置与运行研究陶金张杰喀什文化区传统聚落空间分布与形态研究建筑学院 吴艳 单军滇西北民族聚居地建筑地区性与民族性的关联研究王萌石永久强烈地震作用下钢框架的损伤退化行为土木系 陈喜群 史其信 交通流动态随机演化模型研究 、管路敷设技术通过管线敷设技术不仅可以解决吊顶层配置不规范高中资料试卷问题,而且可保障各类管路习题到位。在管路敷设过程中,要加强看护关于管路高中资料试卷连接管口处理高中资料试卷弯扁度固定盒位置保护层防腐跨接地线弯曲半径标高等,要求技术交底。管线敷设技术中包含线槽、管架等多项方式,为解决高中语文电气课件中管壁薄、接口不严等问题,合理利用管线敷设技术。线缆敷设原则:在分线盒处,当不同电压回路交叉时,应采用金属隔板进行隔开处理;同一线槽内,强电回路须同时切断习题电源,线缆敷设完毕,要进行检查和检测处理、电气课件中调试对全部高中资料试卷电气设备,在安装过程中以及安装结束后进行 高中资料试卷调整试验;通电检查所有设备高中资料试卷相互作用与相互关系,根据生产工艺高中资料试卷要求,对电气设备进行空载与带负荷下高中资料试卷调控试验;对设备进行调整使其在正常工况下与过度工作下都可以正常工作;对于继电保护进行整核对定值,审核与校对图纸,编写复杂设备与装置高中资料试卷调试方案,编写重要设备高中资料试卷试验方案以及系统启动方案;对整套启动过程中高中资料试卷电气设备进行调试工作并且进行过关运行高中资料试卷技术指导。对于调试过程中高中资料试卷技术问题,作为调试人员,需要在事前掌握图纸资料、设备制造厂家出具高中资料试卷试验报告与相关技术资料,并且了解现场设备高中资料试卷布置情况与有关高中资料试卷电气系统接线等情况,然后根据规范与规程规定,制定设备调试高中资料试卷方案 。 、电气设备调试高中资料试卷技术电力保护装置调试技术,电力保护高中资料试卷配置技术是指机组在进行继电保护高中资料试卷总体配置时,需要在最大限度内来确保机组高中资料试卷安全,并且尽可能地缩小故障高中资料试卷破坏范围,或者对某些异常高中资料试卷工况进行自动处理,尤其要避免错误高中资料试卷保护装置动作,并且拒绝动作,来避免不必要高中资料试卷突然停机。因此,电力高中资料试卷保护装置调试技术,要求电力保护装置做到准确灵活。对于差动保护装置高中资料试卷调试技术是指发电机一变压器组在发生内部故障时,需要进行外部电源高中资料试卷切除从而采用高中资料试卷主要保护装置。

国外学位论文的获取(清华大学)

国内外学位论文的检索与获取有问题请向图书馆咨询台询问 https://www.sodocs.net/doc/2b6438153.html, 清华大学图书馆信息参考部范爱红 fanah@https://www.sodocs.net/doc/2b6438153.html, 2010.11.10

讲座内容安排 学位论文的检索方法 国外学位论文(重点介绍PQDT数据库) 国内学位论文 本校学位论文 学位论文的全文获取途径 国外学位论文全文获取途径 国内学位论文全文获取途径 馆际互借服务

第一部分:学位论文的检索

学位论文的特点与用处 数据图表充分详 数据图表充分详尽 参考文献丰富全面 可得到课题研究现状综述 可跟踪名校导师的科研进程 可学习学位论文的写作方法

国外学位论文的检索—PQDT PQDT (ProQuest Dissertations and Theses) PQDT是美国ProQuest公司推出的博硕士论文数据库,收录了以欧美为是美国公推出的博硕士论文数据库收录了以主的1000余所大学的250多万篇学位论文,是目前世界上最大和最广泛使用的学位论文文摘库。北美地区每年通过的学位论文90%以上收入该库。 每年增加7万篇论文全文。博士论文摘要350字左右,硕士论文摘要约150字左右。 特点: z收录年代长,从1637年开始; z更新快,每周更新; z多数论文除题录文摘外,还有前24页的原文。 人文社科类与理工类论文合在一起。

PQDT 检索技巧 截词符Basic Search :默认在题目、文摘、关键词字段中检索?截词符:*(右侧无限截词)?(单字符通配符)例:econom *可以检出econom y , econom ic , econom ical 等同干词。wom ?n 可以检出wom a n 和wom e n Basic Search (Basic Search 默认可以检出复数,但若想检出其他后缀,必须加截词符。)? 词组精确匹配:""两个单词默认为词组精确匹配三个单词以上则需要添加双引号(半角)两个单词默认为词组精确匹配,三个单词以上则需要添加双引号(半角)。例:fiber sensor "optic fiber sensor" ?逻辑算符:and 、or 、and not 例:librar* and copyright* "optic fiber sensor*"and power p p ?位置算符:W/#、Pre/# 例*Chi 两词前后位置任意相隔例:econom* W/3China 两词前后位置任意,相隔 <3单词econom* Pre/3China 两词前后位置一定,相隔<3单词

本科毕业论文一般要求

毕业论文(设计)撰写与存档要求 1基本要求 1.1 毕业设计必须由学生本人独立完成,不得弄虚作假,不得抄袭他人成果。 1.2 论文应中心突出,内容充实,论据充分,论证有力,数据可靠,结构紧凑, 层次分明,图表清晰,格式规范,文字流畅,字迹工整,结论解释合理。 1.3 毕业设计中所使用的计量单位一律采用国际标准单位。 1.4 对论文中的图或表要给予解释,统一标上编号和图题,安排于相应位置。 若同类图表数量过多,也可作为附录列于论文后面。 1.5 凡手绘图形一律用碳素笔在硫酸纸或复印纸上誊描,并标上图号、图题, 然后贴附于论文适当位置或附录中,要求图面整洁、比例适当。流程图、设备及 结构图应按国标绘制。 1.6 毕业设计篇幅以8000 字左右(不含图表、程序和计算数字)为宜。 1.7 毕业设计的封面可参照学校提供的项目内容自行设计(附后),所有文字部 分一律用 A4 号纸激光打印,一级标题用三号黑体;二级标题用四号黑体;其 他标题和正文用小四号宋体(表格内填写内容用小四号楷体),段落前空 2 个汉字,单倍行距。页面设置 : 上/ 下/ 左/ 右分别为 2.4/2.2/2.6/2.0; 页码标在右下。 2内容要求 2.1标题要求简洁、确切、鲜明,有概括性。字数不宜超过25 个汉字,如 果有些细节必须放进标题,可以分成主标题和副标题。 2.2摘要叙述本设计的主要内容、特点,文字要精练。中文摘要约 300 汉字; 英文摘要约 250个实词。 2.3关键词从说明书标题或正文中挑选 3~5 个最能表达主要内容的词作为 关键词,同时有中、英文对照,分别附于中、英文摘要后。 2.4 目录写出目录,标明页码。 2.5 正文前言、本论、结论三个部分。 ( 1)前言(引言)本设计的目的、意义、范围及应达到的技术要求;简述本课题 在国内外的发展概况及存在的问题;本设计的指导思想;阐述本设计应解决的主 要问题。 ( 2)本论 ①设计方案论证说明为什么要选择这个设计方案(包括各种方案的分析、比 较);阐述所采用方案的特点(如采用了何种新技术、新措施、提高了什么性 能等)。 ②计算部分该部分在设计说明书中应占有相当的比例。要列出各零部件的工作条件、给定的参数、计算公式以及各主要参数计算的详细步骤和计算结果;根据此计算应选用什么元、器件或零、部件采用计算机的设计还应包括各种软件设计。 ③结构设计部分机械结构设计、各种电气控制线路设计及功能电路设计、计算机 控制的硬件装置设计等,以及以上各种设计所绘制的图纸。④样机或试件的各种实 验及测试情况:包括实验方法、线路及数据处理等。⑤方案的校验所设计的系统是 否满足各项性能指标的要求,能否达到预期效

清华大学大学物理习题库量子物理

清华大学大学物理习题库:量子物理 一、选择题 1.4185:已知一单色光照射在钠表面上,测得光电子的最大动能是1.2 eV ,而钠的红限波长是5400 ?,那么入射光的波长是 (A) 5350 ? (B) 5000 ? (C) 4350 ? (D) 3550 ? [ ] 2.4244:在均匀磁场B 内放置一极薄的金属片,其红限波长为??。今用单色光照射,发现有电子放出,有些放出的电子(质量为m ,电荷的绝对值为e )在垂直于磁场的平面内作半径为R 的圆周运动,那末此照射光光子的能量是: (A) 0λhc (B) 0λhc m eRB 2)(2+ (C) 0λhc m eRB + (D) 0λhc eRB 2+ [ ] 3.4383:用频率为??的单色光照射某种金属时,逸出光电子的最大动能为E K ;若改用 频率为2??的单色光照射此种金属时,则逸出光电子的最大动能为: (A) 2 E K (B) 2h ??- E K (C) h ??- E K (D) h ??+ E K [ ] 4.4737: 在康普顿效应实验中,若散射光波长是入射光波长的1.2倍,则散射光光子能量?与反冲电子动能E K 之比??/ E K 为 (A) 2 (B) 3 (C) 4 (D) 5 [ ] 5.4190:要使处于基态的氢原子受激发后能发射赖曼系(由激发态跃迁到基态发射的各谱线组成的谱线系)的最长波长的谱线,至少应向基态氢原子提供的能量是 (A) 1.5 eV (B) 3.4 eV (C) 10.2 eV (D) 13.6 eV [ ] 6.4197:由氢原子理论知,当大量氢原子处于n =3的激发态时,原子跃迁将发出: (A) 一种波长的光 (B) 两种波长的光 (C) 三种波长的光 (D) 连续光谱 [ ] 7.4748:已知氢原子从基态激发到某一定态所需能量为10.19 eV ,当氢原子从能量为-0.85 eV 的状态跃迁到上述定态时,所发射的光子的能量为 (A) 2.56 eV (B) 3.41 eV (C) 4.25 eV (D) 9.95 eV [ ] 8.4750:在气体放电管中,用能量为12.1 eV 的电子去轰击处于基态的氢原子,此时氢原子所能发射的光子的能量只能是 (A) 12.1 eV (B) 10.2 eV (C) 12.1 eV ,10.2 eV 和 1.9 eV (D) 12.1 eV ,10.2 eV 和 3.4 eV [ ] 9.4241: 若?粒子(电荷为2e )在磁感应强度为B 均匀磁场中沿半径为R 的圆形轨道运动,则?粒子的德布罗意波长是 (A) )2/(eRB h (B) )/(eRB h (C) )2/(1eRBh (D) )/(1eRBh [ ] 10.4770:如果两种不同质量的粒子,其德布罗意波长相同,则这两种粒子的 (A) 动量相同 (B) 能量相同 (C) 速度相同 (D) 动能相同 [ ]

清华大学 计算机科学与技术专业 本科毕业设计

数据结构分析及算法研究 一.数据结构概述 当今时代是一个以信息技术(Information Technology,简称IT)为代表的知识经济时代,计算机技术和信息科技的发展更是日新月异,从各个方面影响和改变着我们的生活,而其中的计算机网络技术的发展更为迅速,已经渗透到了我们生活的各个方面,人们已经离不开计算机网络,并且随着因特网的迅速普及,给我们的学习与生活条件带来更大的方便,我们与外部世界的联系将更加的紧密和快

速。 随着人们对于信息资源共享以及信息交流的迫切需求,促使网络技术的产生和快速发展,计算机网络的产生和使用为人类信息文明的发展带来了革命性的变化。随着计算机网络管理功能的强化,计算机硬件技术和软件技术都与网络技术融合到一起,近几年来应用程序的开发更发展到以WEB门户网站为界面,以与后台网络分布式数据库和实时交互操作的程序库,共同组成网络环境下的三层架构模式,这成了计算机应用程序开发模式的主流趋势。 本次石景山卫生局网络建设项目是以局域网为依托,架构办公自动化、信息传播、疾病控制和有关智能化系统等运行平台,为用户提供先进的办公、数据共享、信息传播和学术交流手段,实现各系统之间的信息交流和信息资源共享,实现内部局域网与Internet以及区卫生所专网的连接。

第一章计算机局域网概述 系统的理解网络理论对于掌握网络技术是十分必要的,本论文中仅对于相关技术作简单的介绍,便于读者阅读。 一.计算机局域网 “网络就是计算机”,计算机网络已经在企业、事业、学校、政府机关等地方成为不可缺少的工具。对网络的进一步定义是: “至少有两个具有共享需求的个体;至少有一种方法或通路使其个体互连;至少有一种规则使两个或两个以上个体相互传信。”个体指计算机硬件和软件、方法或通路指连接与传输媒介、规则指网络通信协议。网络在不同的阶段有不同的含义,定义也会被修改,但几十年的变迁有一点始终不改,那就是“资源”的共享,包括软件资源、硬件资源、数据和服务资源的共享,它是组网的原始动力。 1.计算机网络的分类 网络按照传输距离可以分为一下3种: 1)局域网(Local Area Networks,简称LAN)。 局域网的传输距离较短一般从几米到几公里,往往用于一个单位,比如一个公司、一个政府部门等。局域网的优点是传输速率高,往往可以达到百兆或千兆,局域网的另一个优点是传输信号质量高,误码率低,传输时延小。 2)广域网(Wide Area Networks,简称WAN)。 广域网也成为远程网,传输距离为几百公里甚至更远,一般跨城市甚至国家。广域网往往会用多种通信介质,比如光纤、微波中继、卫星通信与电力载波等。如何在广域网上保证网络访问的安全,是目前网络技术的关键和核心技术领域之一。 3)城域网(Metropolitan Area Network,简称MAN)。 城域网介于LAN和WAN之间,传输距离由几公里到十几公里,“城域网”可以理解为一个城市范围内的网络,事实上目前的城域网通常以高速环网为核心架构一个城市的主干高速通信网。

清华大学硕士论文模板

清华大学博士(硕士)论文 模板使用说明 (申请清华大学理学博士学位论文) 培养单位:清华大学计算机科学与技术系专业:计算机科学与技术 研究生:王磊 指导教师:徐光祐教授 二○○三年九月

An Introduction to Doctor(Master) Thesis Template of Tsinghua University Dissertation Submitted to Tsinghua University in partial ful?llment of the requirement for the degree of Doctor of Science by Lei Wang (Computer Science) Dissertation Supervisor:Professor Guangyou Xu September,2003

关于学位论文使用授权的说明 本人完全了解清华大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。 (保密的论文在解密后应遵守此规定) 作者签名:导师签名: 日期:日期:

中文摘要 摘要 这篇论文主要用来展示清华大学博士(硕士)论文L A T E X+CJK模板,并简要介绍其使用方法。 这一模板已获得清华大学研究生院的认可,符合相应的博士(硕士)论文的标准格式。这篇文档按照博士论文的要求生成,如果要符合硕士论文的要求,可能需要在个别地方做适当的修改。 一般而言,中文摘要包含500-1000字,1-2页。关键词5-10个。 关键词:论文,模板,清华大学,博士,硕士,L A T E X,CJK –I–

清华大学《大学物理》习题库试题及答案--08-电学习题答案

清华大学《大学物理》习题库试题及答案--08-电学习 题答案 本页仅作为文档页封面,使用时可以删除 This document is for reference only-rar21year.March

一、选择题 1.1003:下列几个说法中哪一个是正确的? (A) 电场中某点场强的方向,就是将点电荷放在该点所受电场力的方向 (B) 在以点电荷为中心的球面上,由该点电荷所产生的场强处处相同 (C) 场强可由定出,其中q 为试验电荷,q 可正、可负,为试验电荷所受的电场力 (D) 以上说法都不正确 [ ] 2.1405:设有一“无限大”均匀带正电荷的平面。取x 轴垂直带电平面, 坐标原点在带电平面上,则其周围空间各点的电场强度随距离平面的位置坐 标x 变化的关系曲线为(规定场强方向沿x 轴正向为正、反之为负): [ ] 3.1551:关于电场强度定义式,下列说法中哪个是正确的? (A) 场强的大小与试探电荷q 0的大小成反比 (B) 对场中某点,试探电荷受力与q 0的比值不因q 0而变 (C) 试探电荷受力的方向就是场强的方向 (D) 若场中某点不放试探电荷q 0,则=0,从而=0 [ ] 4.1558:下面列出的真空中静电场的场强公式,其中哪个是正确的? [ ] q F E / =F E /q F E =E F F E F E ( x

(A)点电荷q 的电场:(r 为点电荷到场点的距离) (B)“无限长”均匀带电直线(电荷线密度)的电场:(为带电直线到场点的垂直于直线的矢量) (C)“无限大”均匀带电平面(电荷面密度)的电场: (D) 半径为R 的均匀带电球面(电荷面密度)外的电场:(为球心到场点的矢量) 5.1035:有一边长为 a 的正方形平面,在其中垂线上距中心O 点a /2处,有一电荷为q 的正点电荷,如图所示,则通过该平面的电场强度通量为 (A) (B) (C) (D) [ ] 6.1056:点电荷 Q 被曲面S 所包围,从无穷远处引入另一点电荷q 至曲面外一点,如图所示,则引入前后: (A) 曲面S 的电场强度通量不变,曲面上各点场强不变 (B) 曲面S 的电场强度通量变化,曲面上各点场强不变 (C) 曲面S 的电场强度通量变化,曲面上各点场强变化 (D) 曲面S 的电场强度通量不变,曲面上各点场强变化 [ ] 7.1255:图示为一具有球对称性分布的静电场的E ~r 关系曲线。请指出该静电场是由下列哪种带电体产生的 (A) 半径为R 的均匀带电球面 (B) 半径为R 的均匀带电球体 (C) 半径为R 的、电荷体密度为的非均匀带电球体 2 04r q E επ= λr r E 302ελπ= r σ02εσ = E σr r R E 3 02εσ=r 0 3εq 4επq 0 3επq 0 6εq Ar =ρ q 1035图 q

清华大学学位论文模板

T hu T hesis ? ? xueruini@https://www.sodocs.net/doc/2b6438153.html, v4.5.1(2009/02/28) 1. L A T E X Project Public License 2. 3. 4. L A T E X Project Public License ?Tsinghua University L A T E X Thesis Template. ?LittleLeo@newsmth

1 1 2 1 2.1 (1) 2.2 (1) 2.3 (2) 2.4 (2) 2.4.1 (2) 2.4.2dvi→ps→pdf (3) 2.4.3dvipdfm(x) (3) 2.4.4pd?atex (4) 2.4.5xelatex (4) 2.4.6 (4) 2.5 (5) 3 5 3.1 (5) 3.2T hu T hesis (5) 3.3T hu T hesis (6) 3.4 (7) 3.5 (8) 3.5.1 (8) 3.5.2 (11) 3.5.3 (12) 3.6 (14) 3.7 (15) 4 15 5 17 5.1 ............ 17 5.2 (17) 5.3 (19) 5.4 (22) 5.4.1Three matters (22) 5.4.2 (22) 5.4.3 (24) 5.4.4 (25) 5.4.5 (26) 5.4.6 (27) 5.4.7 (28) 5.4.8 ..30 5.4.9 (31) 5.4.10 (32) 5.4.11 (35) 5.4.12 (36) 5.4.13 (44) 5.4.14 (45) 5.4.15 (46) 5.4.16 (47) 5.4.17 (48) 5.4.18 (49) 5.4.19 (49) 5.4.20 (50) 5.4.21 (50) 5.4.22 ..50 5.4.23 (51) 52 57

4-6 清华大学2011毕业论文舒圆媛论文打印版

含甲胺基化合物的消毒副产物NDMA特性 与机理研究 清华大学环境学院给排水科学与工程2011届舒圆媛 指导教师:张晓健教授 摘要: N-亚硝基二甲胺(NDMA)由于其对人类健康潜在的巨大危害性已经成为饮用水安全领域研究的热点问题。弄清水体中哪些物质是NDMA的前体物,是研究该消毒副产物生成机理与控制技术的重要基础。已有文献报道,具有特定化学结构——如胺基的某些水处理药剂、农药等能显著生成NDMA,但已有研究在不同胺基结构对化学物质消毒生成NDMA的影响方面缺乏系统认识,并缺乏对其他含胺基官能团的物质消毒生成NDMA的研究。 本研究选取杀虫脒、抗蚜威、绿麦隆、氯化胆碱、聚二烯丙基二甲基氯化 铵、洁尔灭、十六烷基三甲基溴化铵等七种含甲基胺官能团的化学物质及酪氨 酸、赖氨酸和单宁酸进行氯胺、自由氯和二氧化氯消毒试验,识别具有较大 NDMA生成潜能的目标化合物和相应消毒剂。在此基础上,研究pH、消毒剂剂量和消毒剂接触时间对目标化合物与相应消毒剂反应生成NDMA的影响;研究不同物质与消毒剂反应生成NDMA的动力学;结合有机化学合成理论,提出含有不同胺基官能团结构的化学物质和消毒剂反应时可能的NDMA生成途径,为判别具有类似化学结构的环境物质在水处理过程中的NDMA生成风险和开发相应的控制技术提供理论依据。 本研究得出如下主要结论: (1)含甲基胺官能团的化学物质是NDMA的重要前体物,但物质结构对 NDMA生成有重要影响。氯胺消毒时,聚二烯丙基二甲基氯化铵和杀虫脒有最大的NDMA生成潜能。 (2)消毒方式是所选物质生成NDMA的重要影响因素之一,在相同条件 下,氯胺消毒能产生比自由氯和二氧化氯消毒更多的NDMA。 (3)在氯胺消毒条件下,反应体系的pH值影响所选物质释放二甲胺 (DMA)及DMA进一步生成NDMA的反应。对绿麦隆和十六烷基三甲基溴 化铵的研究表明,pH越低,NDMA生成量越大。

本科大学毕业论文范文模板

本科大学毕业论文范文模板 本科是本科中重要的实践性教学环节,是高校实现人才培养目标的重要内容,是衡量本科教学水平的重要标准,也是学生毕业与学士学位资格认证的重要依据。下面是为大家推荐的本科毕业论文,供大家参考。 01浅谈电子商务环境下对商业的影响 摘要:本文从电子商务自身特点及其对会计环境与会计的影响出发,分析了及会计实务,包括会计目标、会计假设、会计原则、会计要素、会计职能、会计核算等,尤其是会计方面受到的冲击和影响。并从会计报告的目标、时效、内容、方式等方面建设性地提出了基于电子商务的会计报告。 关健词:电子商务会计会计报告 一、引言 随着21世纪的到来和发展,电子商务正在引领着网络发展的新方向,电子商务是、信息技术在商务领域的总和应用和体现,更是高新与现代商务、企业的营销策略相结合的产物。电子商务的出现改变了传统会计的生存环境,在很大程度上将对会计的发展起到不仅

作用。电子商务是指那些具有商业活动能力的生产企业、政府部门、金融机构、消费者等充分利用网络技术和现代先进的信息技术来从事的各项商业活动。电子商务环境下询问价格、了解市场行情、对商品报价、接到客户下达的订单、发货、支付货款等过程基本都是无纸化,都是利用各种电子工具完成的。 电子商务的出现和发展,为世界各国企业的发展带来了新的机遇,但是,随之而来的是企业之间的激烈竞争。电子商务的出现是信息时代网络飞速发展的产物,对传统的会计理论、会计实务都产生了极大的冲击和影响。随着我国各企业电子商务活动的不断展开,各企业必须对电子商务会计进行大力发展才能不断适应面对电子商务的发展而带来的企业经营管理方式的转变。 二、电子商务对传统商业会计理论的影响 1、电子商务环境下的会计目标 传统会计理论中,会计目标主要是指:在一定的时间、空间条件下,各会计主体作用在会计客体上期望达到的目的或要求,是各企业会计运行的主要方向。电子商务环境下会计的目标是建立在电子化、网络化、信息化的基础上的,一方面,要重视受托责任观的基础性作用,这主要是由于虽然会计环境由于电子商务的产生而发生

清华大学研究生答辩流程提示

清华大学研究生答辩流程提示 一.检查培养要求完成情况 1.研究生自查是否达到学科培养要求 2.研究生教务根据研究生入学时的培养方案以及学校和院系的相关要求,检查研究 生是否达到学科培养要求 3. 注意事项虽已达到培养要求、但仍有在学课程未获学分的,不能进入答辩程序 二.论文送审 (一)论文送审前 1.研究生1)向导师提交学位论文,并根据导师意见修改 2)与导师讨论确定学位论文密级 3)按照院系规定时间提交论文进行学术规范检查初检 4)向院系提交学位论文做格式审查 5)登录“论文评审与答辩”系统维护答辩申请相关信息、打印材料2.研究生导师1)审查研究生学位论文,提出修改意见,表明是否同意送审 2)拟定学位论文评阅人名单(涉密论文按保密规定送审) 3)初拟博士学位论文答辩委员会名单 (硕士学位论文实行集中答辩,答辩委员会组成由院系确定) 3.研究生教务1)检查研究生培养方案完成情况 2)向研究生发布学位论文抽查通知并落实抽查工作 3)学术规范检查、发布研究生论文查重的时间节点 (各院系可按照本单位规定在论文送审前或分委员会前进行学术规范检查) 4)进行学位论文格式审查(一般是先规范检查,后格式审查) 5)检查学位论文评阅人、答辩委员会组成是否符合学校和院系的要求 6)指定硕士集中答辩秘书,安排硕士学位论文集中答辩事宜 7)对答辩秘书进行培训 4. 注意事项1)经导师同意论文送审的博士生,至少于答辩前6周向所在院系研究 生管理部门提出送审申请

2)经导师同意论文送审的硕士生,至少于答辩前4周提出送审申请(二)论文送审至答辩前 答辩秘书1)协助送审论文(涉密论文的送审需符合保密规定) 2)回收并检查学位论文学术评议书 三、论文答辩 (一)论文答辩前 1.研究生在“论文评审与答辩”系统中维护答辩信息 2.研究生导师填写“指导教师对研究生学位论文的学术评语” 拟定答辩委员会组成名单 3.答辩秘书1)协助导师检查论文评阅人以及答辩委员会组成是否符合学校规定 2)整理、填写学位论文学术评议书意见并汇总 3)检查审批材料填写是否规范、准确、齐备 4)审批材料报所在单位院系主管领导审批 5)审批材料报学位分委员会主席审批(提示:于答辩前至少1周时间完成) 6)领取答辩表决票(加盖学位评定分委员会公章有效) 7)准备答辩横幅,张贴答辩公告 4.分会主席1)审查学位论文评阅是否符合要求 2)审查答辩委员会成员的专业特长与申请答辩学生论文研究内容是 否相关 3)审查答辩委员会组成是否符合学校规定 ?博士学位论文答辩委员会规定: ●答辩委员会由五至七人组成,成员应是具有博士生指导资格的教师或正 高职称专家,其中:(1)半数以上应具有本学科或相关学科博士生指导 资格;(2)至少包含一位论文评阅人;(3)有校外专家二至三人,校内 专家不少于三人;(4)属于学科交叉研究的论文,应聘一至二位相关学 科的专家;(5)至少包含一位学位分委员会委员(特殊情况可由分委员 会指定教师代替)。 ●答辩委员会主席应由具有正高职称的博士生指导教师担任。论文答辩委 员会秘书应由我校具有中级以上职称或我校具有相关学科博士学位的专 业人员担任。初次担任秘书工作的,院系须对其进行专门培训。 ●指导教师(最多一人)可作为委员参加论文答辩会,但不能担任主席; 申请人的论文答辩被抽查时,其指导教师不得担任答辩委员会成员。

本科生毕业设计(论文)模板2017

论文) 题 目: 线性表的设计和实现 专业年级: 2012级信息与计算科学专业 指导教师: 李四 年 月 日

中国石油大学胜利学院本科毕业设计(论文) 摘 要 数据结构算法设计和演示(C++)树和查找是在面向对象思想和技术的指导下,采用面向对象的编程语言(C++)和面向对象的编程工具( Borland C++ Builder 6.0)开发出来的小型应用程序。它的功能主要是将数据结构中链表、栈、队列、树、查找、图和排序部分的典型算法和数据结构用面向对象的方法封装成类,并通过类的对外接口和对象之间的消息传递来实现这些算法,同时利用 C++ Builder 6.0中丰富的控件资学中帮助理解、辅助教学和自我学习的作用。 关键词:毕业设计;格式;规范

ABSTRACT Xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx Keywords :Xxxx ;Xxxx ;Xxxx

目录 2.2.2 三级标题名 (2) 2.3线性链表 (2) 第三章设计的主体内容 (3) 3.1系统结构的设计 (3) 3.2交互界面的设计和实现 (3) 3.3线性表的00P序设计 (3) 3.3.1线性表的顺序存储的实现 (3) 第四章结果分析与讨论 (4) 第五章结论 (6) 参考文献 (7) 致谢 (8) 附录 (9) 附录A名词术语及缩略词 (9)

第一章 计算机与网络技术的高速发展,特别是面向对象技术的出现,使得 C++的软件开发得到了迅速普及。 本课题主要………………

清华大学本科毕设论文

清华大学 综合论文训练 题目:基于四旋翼无人机的PM2.5测量 系别:电子工程系 专业:电子信息科学与技术

中文摘要 近年来,随着无人航空技术发展的日趋完善与成熟,无人机逐渐受到重视并且得到广泛应用。无人机凭借其机动强、经济上较为实惠、方便起飞、降落等方面的优势,越来越受到人们的青睐。同时,无线遥感技术的飞速发展与日趋完善,也在很大程度推动了无人机的应用,无人搭载平台在空气检测、环境监测、恶劣条件侦探、航拍等方面都得到广泛应用。 本课题以无人机作为搭载平台,搭载空气传感器与GPS模块,实现对PM2.5与PM10数据的采集,在PC端通过单片机编程,实现SD卡存储所采集的数据,达到空气质量检测的目的。 本文依次介绍系统的硬件部分、软件部分。之后,对传感器的可信度进行评估,介绍如何通过单片机编程实现用SD卡存储PM2.5(PM10)值。最后对采集的数据进行处理,绘制PM2.5(PM10)随着不同的经纬度、高度、风速的变化趋势曲线图,得出结论。 关键词:四旋翼无人机;SDS011激光传感器;STM32单片机;数据储存与显示

ABSTRACT With the rapid development of UAV technology, its application has become more and more widespread together. With its advantage in mobility, fastness, economy, convenience and so on, the UAV has been used more widespread. With the development of wireless remote sensing technology, the UAV has been used in meteorological monitoring, resource surveys, aerial survey and respond to emergencies widely. This topic uses the UAV as carrying platform, and equips UAV with air sensor and GPS module, implementation of PM2.5 and PM10 data collection, through the microcontroller programming to achieve the data stored on the SD card, and finally achieve the purpose of air quality testing. This paper firstly introduces the hardware part and software part of the system. And the evaluates the reliability of the sensor, describes how to use the microcontroller to store the value of PM2.5(PM10) in the SD card. Finally deal with the data collected, and then draw the trends and graph of the values of PM2.5(PM10) change with the latitude and longitude, altitude, wind speed. Keywords: Four-rotor UAV;SDS011 laser sensor;STM32 microcontroller;Data storage and display

清华大学博士学位论文word自动格式模板()

v1.0 可编辑可修改 清华大学博士论文——Word格式自动调整模板(申请清华大学哲学博士学位论文) 培养单位:人文社会科学学院 学科:哲学 研究生:姓名名 指导教师:姓名名教授 二○某某年某月

v1.0 可编辑可修改 清华大学博士论文——Word 格式自动调整模板 姓名名

v1.0 可编辑可修改 3 Auto Word Model for Tsinghua Dissertation Dissertation Submitted to Tsinghua University in partial fulfillment of the requirement for the degree of by Your Name ( Philosophy ) Dissertation Supervisor :Professor Name Andname

v1.0 可编辑可修改 April, 2011 4

v1.0 可编辑可修改关于学位论文使用授权的说明 本人完全了解清华大学有关保留、使用学位论文的规定,即:清华大学拥有在著作权法规定范围内学位论文的使用权,其中包括:(1)已获学位的研究生必须按学校规定提交学位论文,学校可以采用影印、缩印或其他复制手段保存研究生上交的学位论文;(2)为教学和科研目的,学校可以将公开的学位论文作为资料在图书馆、资料室等场所供校内师生阅读,或在校园网上供校内师生浏览部分内容;(3)根据《中华人民共和国学位条例暂行实施办法》,向国家图书馆报送可以公开的学位论文。 本人保证遵守上述规定。 (保密的论文在解密后遵守此规定) 作者签名:导师签名: 日期:日期:

清华大学《大学物理》试题及答案

热学部分 一、选择题 1.4251:一定量的理想气体贮于某一容器中,温度为T ,气体分子的质量为m 。根据理想气体的分子模型和统计假设,分子速度在x 方向的分量平方的平均值 (A) (B) (C) (D) [ ] 2.4252:一定量的理想气体贮于某一容器中,温度为T ,气体分子的质量为m 。根据理想气体分子模型和统计假设,分子速度在x 方向的分量的平均值 (A) (B) (C) (D) 0 [ ] 3.4014:温度、压强相同的氦气和氧气,它们分子的平均动能和平均平动动能 有如下关系:(A) 和都相等 (B) 相等,而不相等 (C) 相等,而不相等 (D) 和都不相等 [ ] 4.4022:在标准状态下,若氧气(视为刚性双原子分子的理想气体)和氦气的体积比V 1 / V 2=1 / 2 ,则其内能之比E 1 / E 2为: (A) 3 / 10 (B) 1 / 2 (C) 5 / 6 (D) 5 / 3 [ ] 5.4023:水蒸气分解成同温度的氢气和氧气,内能增加了百分之几(不计振动自由度和化学能)? (A) 66.7% (B) 50% (C) 25% (D) 0 [ ] 6.4058:两瓶不同种类的理想气体,它们的温度和压强都相同,但体积不同,则单位体积内的气体分子数n ,单位体积内的气体分子的总平动动能(EK /V ),单位体积内的气体质量,分别有如下关系:(A) n 不同,(EK /V )不同,不同 (B) n 不同,(EK /V )不同,相同 (C) n 相同,(EK /V )相同,不同 (D) n 相同,(EK /V )相同,相同 [ ] 7.4013:一瓶氦气和一瓶氮气密度相同,分子平均平动动能相同,而且它们都处于平衡状态,则它们 (A) 温度相同、压强相同 (B) 温度、压强都不相同 (C) 温度相同,但氦气的压强大于氮气的压强 (D) 温度相同,但氦气的压强小于氮气的压强 [ ] 8.4012:关于温度的意义,有下列几种说法:(1) 气体的温度是分子平均平动动能的量度;(2) 气体的温度是大量气体分子热运动的集体表现,具有统计意义;(3) 温度的高低反映物质内部分子运动剧烈程度的不同;(4) 从微观上看,气体的温度表示每个气体分子的冷热程度。这些说法中正确的是 (A) (1)、(2)、(4);(B) (1)、(2)、(3);(C) (2)、(3)、(4);(D) (1)、(3) 、(4); [ ] 9.4039:设声波通过理想气体的速率正比于气体分子的热运动平均速率,则声波通过具有相同 温度的氧气和氢气的速率之比为 (A) 1 (B) 1/2 (C) 1/3 (D) 1/4 [ ] 10.4041:设图示的两条曲线分别表示在相同温度下氧气和氢气分子的速率分布曲线;令 和分别表示氧气和氢气的最概然速率,则: (A) 图中a表示氧气分子的速率分布曲线; /=4 (B) 图中a表示氧气分子的速率分布曲线; /=1/4 (C) 图中b表示氧气分子的速率分布曲线; /=1/4 (D) 图中b表示氧气分子的速率分布曲线; /= 4 [ ] m kT x 32= v m kT x 3312 =v m kT x /32=v m kT x /2 =v m kT π8= x v m kT π831=x v m kT π38= x v =x v εw εw εw w εεw ρρρρρ2 2H O /v v ()2 O p v ()2 H p v ()2 O p v ()2 H p v ()2O p v ()2H p v ()2 O p v ()2 H p v ()2 O p v ()2 H p v

清华大学研究生学位论文保密管理规定

清华大学研究生学位论文保密管理规定 (2006年8月第四次修订) 为进一步加强研究生学位论文保密工作,根据《中华人民共和国保守国家秘密法》及《清华大学保密工作规定》,结合我校具体情况,特制定本规定。 一、学位论文密级分类的基本原则 1.研究生学位论文是重要的学术著作。为了促进科学进步、学术繁荣和学术交流,研究生学位论文一般应公开发表。但涉及到专利申请、技术转让、成果推广的内部论文,特别是涉及国家秘密的学位论文,学校各有关部门应密切配合,各尽其责,在学位论文书写、档案管理、学术交流等各个管理环节中按规定做好保密工作。 2.我校研究生学位论文的密级划分为公开、内部、秘密和机密四级。 公开:大多数学位论文应按照学术研究公开和保护知识产权的原则予以公开。 内部:研究成果不列入国家保密范围而又准备申请专利或技术转让以及涉及技术秘密,在一段时间内不宜公开的学位论文。 秘密、机密:研究背景源于已确定密级的科研项目或课题的学位论文。 密级确定为“秘密”、“机密”的学位论文属于涉密学位论文。 二、学位论文密级的申报与审定 1.各院(系、所)保密工作领导小组组长是研究生学位论文的密级审定人,负责研究生学位论文的密级审定工作; 2.“内部”学位论文应在申请学位论文送审前进行,由院(系、所)学位论文密级审定人负责审定;涉密学位论文的密级申请应在论文开题之前进行,研究生须填写“学位论文密级申请表”,由导师签署意见、报所在院(系、所)学位论文密级审定人审核,之后上报学校科研院和保密办公室审批。涉密研究生的学位论文方可申请涉密论文。 3.院(系、所)应严格按照《清华大学科学技术保密工作规定》审定研究生学位论文密级。审定学位论文密级的一般原则为: (1)学位论文的密级不得高于来源研究项目(或课题)的密级。密级为“秘密”的学位论文保密年限一般不超过10年,密级为“机密”的学位论文保密年限一般不超过20年; (2)若学位论文研究来源科研项目(或课题)未定密级、未涉及国家秘密,而学位论文中有部分内容属不宜公开内容(如:涉及专利申请、技术转让以及技术或商业秘密等),则学位论文可定为“内部”,不公开年限一般为确定密级后2年;

相关主题