搜档网
当前位置:搜档网 › 生物软件及数据库复习题完整版

生物软件及数据库复习题完整版

生物软件及数据库复习题完整版
生物软件及数据库复习题完整版

生物软件及数据库复习题

一、名词解释

1. Primary databases: 初级数据库,数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释.

2. Secondary Databases: 二级数据库,对原始生物分子数据进行整理、分类的结果,是在一级数据库、实验数据和理论分析的基础

上针对特定的应用目标而建立的。

3.结构数据库:在结构数据库中记录的数据是实用化的实验数据。它既不同于直接由仪器获得的原始数据,也并非原始数据的

简单数学转换。每一个结构数据库记录都内含着随结构预测技术的进步而不断变化的假设和偏好。

4. Similarity: 相似性,指序列比对过程中用来描述检测序列和目标序列之间相同DNA碱基或氨基酸残基顺序所占比例的高低。

5. Homology: 同源性,指一些数据中推断出的两个基因在进化上曾具有共同祖先的结论。

6. Identity: 同一性,两个序列之间完全相同的匹配残疾数目。

7. Local alignment:局部比对,1981年,由F. Smith 和M.Waterman首次提出局部比对算法,动态规划方法通过较少的改动便可

以用来识别匹配的子序列,并且忽略匹配区域之前或之后的失配和空位

8. Globle alignment:全局比对,是指将参与比对的两条序列里面的所有字符进行比对。

9. Pairewise alignment:双序列比对,是指通过一定算法对2个DNA或蛋白质序列进行比较,找出两者之间最大相似性匹配。

10. Multiple alignment: 多重序列比对,是对三個以上的序列,如蛋白質序列、DNA序列或RNA序列所作的序列比对。

11. Consensus Tree: 一致树用最大简约法可以生成许多类似的简约树,用这种方法生成的集合树是与其他树基本一致的.

12. Synonymous mutation: 同义突变:突变的密码子仍然指令同一氨基酸,因而同义突变是沉默突变。

13. Non-synonymous mutation: 非同义突变: 这类突变可改变密码子的含义,指令一个不同的氨基酸。非同义突变又称错义突变。

14. dN/dS: 异意替换(Ka)和同意替换(Ks)之间的比例,这个比例可以判断是否有选择压力作用于这个蛋白质编码基因。

15. negative (purifying) selection:净化选择,是指物种在长期进化过程中将一些“无用”的基因删除掉,以求基因的“干净”,以免基

因冗沉。

16. positive selection :正向选择,是指将因含有有利突变而提高个体适合度的等位基因固定下来的选择作用。

17. 蛋白质一级结构:是指多肽链的氨基酸残基的排列顺序,也是蛋白质最基本的结构。

18. 蛋白质二级结构: 是指多肽链借助于氢键沿一维方向排列成具有周期性的结构的构象,是多肽链局部的空间结构,是构成

蛋白质结构的要素。

19.蛋白质三级结构: 是指整条多肽链由二级结构元件构建的总三维结构,包括一级结构相距远的肽段之间的几何相互关系,骨

架和侧链在内的所有原子的空间排列。

20. 蛋白质四级结构: 是指亚基和亚基之间通过疏水作用等次级键结合成为有序排列的特定的空间结构。

21. Hydrophobic : 疏水性指的是一个分子(疏水物)与水互相排斥的物理性质。

22. Hydrophilic : 亲水性指分子能够透过氢键和水分子形成短暂键结的物理性质。

23. sequence logos: 序列标记,是核苷酸或氨基酸保守序列的图形表示方法。

24. Phylogenetic tree :系统发生树,是表明被认为具有共同祖先的各物种间演化关系的树。是一种亲缘分支分类方法。在树中,

每个节点代表其各分支的最近共同祖先,而节点闲的线段长度对应演化距离(如估计的演化时间)。

25. N50:覆盖50%所有核苷酸的最大序列重叠群

26. K-mer: 具有指定长度为K的DNA序列。

27. 序列覆盖度:

28. 物理覆盖度:

29. Contig : 叠连群:可以组装成线性序列的一组克隆。

30. Scaffold:支架一组已锚定在染色体上的重叠群, 内部含间隙或不含间隙.

31. 基因组注释:利用生物信息学方法和工具对基因组所有基因的生物学功能,进行高通量注释,包括基因识别和功能注释。

32. GO:(Gene Ontology)是用一套具有动态形式的控制字汇来解释真核生物的基因或蛋白质在细胞内所扮演的角色及生物医学

方面的知识,同时这些字汇随着生命科学研究的进步,一直不断的积累与改变。

33. EST: 表达序列标签(expressed sequence tag)是从一个随机选择的cDNA克隆进行5’端和3’端单一次测序获得的短的cDNA

部分序列,代表一个完整基因的一小部分,在数据库中其长度一般从20到7000 bp不等,平均长度为400bp。

34. GSS:Genome survey sequence基因综述序列,代表了按功能划分的一组数据

35. 置换: 同型碱基的置换,一个嘌呤被另一个嘌呤替换;一个嘧啶被另一个嘧啶置换。

36. 颠换: 异型碱基的置换,即一个嘌呤被另一个嘧啶替换;一个嘧啶被另一个嘌呤置换。

37. 移码突变: 在正常的DNA分子中,1对或少数几对邻接的核苷酸的增加或减少,造成这一位置之后的一系列编码发生移位

错误的改变,这种现象称移码突变。

38. 基因结构: 决定某种多肽链(蛋白质)或酶分子结构基因。正常情况下,在调节基因和操纵基因的控制下,经转录和翻译过程,合

成相应的蛋白质、酶或肽链。若结构基因发生突变,就会产生失去活性的蛋白质,从而造成差错。

39. BLAST: (Basic Local Alignment Search Tool)即基于局部比对算法的搜索工具,能够实现比较两段核算或蛋白质序列之间的

同源性的功能,它能够快速地找到两段序列之间的同源序列并对比对区域进行打分以确定同源性的高低。

40. 直系同源物:源于不同物种的最近的共同祖先的两个基因或者两个物种中的同一基因,一般具有相同的功能。

41. 直系同源物(Ortholog):两个基因通过物种形成的事件而产生,或,源于不同物种的最近的共同祖先的两个基因,或者两个

物种中的同一基因,一般具有相同的功能。

42.旁系同源物:(Paralog ):两个基因在同一物种中,通过至少一次基因复制的事件而产生。

43. SNP:(single nucleotide polymorphysm)即单核苷酸多态性,是指基因组DNA序列中由于单个核苷酸的替换而引起的多态性。

一个SNP位点表示在基因组某个位点上有一个核苷酸的变化。

44. 可变剪切:剪切体可以将RNA中的内含子和外显子进行不同拼接的剪切方式,一个转录单位可以通过这种方式产生多种成

熟的RNA,又称选择性剪切。

二、选择题

1.下列哪个软件可用来转换峰图文件(1 )

(1) phred (2) phrap (3) phd2fasta (4) consed

2.下列哪些数据库是初级数据库( 1 3 )

(1) dbEST (2) HomoloGene (3) GSS (4) gene

3.下列文献数据库可免费提供全文(3 )

(1) PubMed (2) medonline (3) PubMed Center (4) OVID

4.HMMER程序包中哪个程序可用来查询模型库(2 )

(1) hmmsearch (2) hmmalign (3) hmmscan (4) hmmbuild

5.HMMER程序包中哪个程序可用作模型查询序列库( 1)

(1) hmmsearch (2) hmmalign (3) hmmscan (4) hmmbuild

6.Muscle具有什么功能( 1)

(1) 多序列比对(2) 组装(3) 基因组注释(4) 功能分类

7.下列哪些软件可进行基因组组装(1、3)

(1) phrap (2) cap3 (3) SOAPalign (4) Genescan

8.下列哪些软件可用于solexa 序列组装( 3 )

(1) phrap (2) cap3 (3) SOAPdenovo (3)velvet

9.一般选择下列哪个软件进行批量引物设计( 4)

(1) Primer3 (2) oligo 6 (3) MEGA (4) Premier Primer

10.常用的文献管理软件有( 1 )

(1) EndNote (2) Reference Manager (3) DNAman (4) Primer3

11.如果计分规则为:1)完全匹配+1;2)错配-2;3)插入缺失-1。计算下列比对的分值( 2 )

AAGCTGAATT-C-GAA AGGCT-CATTTCTGA- (1) 1 (2) 2 (3) 3 (4) -1

12.PAM100与下列哪个计分矩阵相当( 1)

(1) BLOSUM90 (2) BlOSUM80 (3) BLOSUM60 (4) BLOSUM45

13.PAM系列计分矩阵后面的数字越大,表示(2 )

(1) 序列越相似(2) 序列越不相似(3) 跟序列相似性无关

14.Blastp默认的计分矩阵是( 3 )

(1) BLOSUM80 (2) BLOSUM60 (3) BLOSUM62 (4) BLOSUM45

15.当某个基因处于positive selection 时,其dN/dS为( 1 )

A dN/dS > 1

B dN/dS =1

C dN/dS < 1

D 与dN/dS无关

16.下列哪些数据库属于初级数据库(ABEF )

A .GenBank B. DDBJ C. RefSeq D. GEO E. EMBL F. Unigene

17.下列哪些数据库属于次级数据库(BCDEF )

A. GenBank

B. PROSIT

C. Pfam

D. BLOCK

E. PRINTS

F. PubMed

18.下列哪些属于蛋白数据库(ABCDF )

A. SwissProt

B. Uniprot

C. GenPept

D. TrEMBL

E. GenBank

F. PDB

19.下列哪些数据库是结构数据库(ABC )

A PD

B B SCOP

C MMDB

D PubChem

20.下列哪个数据库是关于microRNA的(AD )

A Mirbase

B wormbase

C MMDB

D Pram

21.查询序列为蛋白序列,数据库为核酸库,可用下列哪个blast程序(D )

A blastn

B tblastx

C blastx

D tblastn

22.查询序列为核酸序列,数据库为蛋白库,可用下列哪个blast程序( C )

A blastn

B tblastx

C blastx

D tblastn

23.查询序列为核酸序列,数据库为核酸库,可用下列哪些blast程序(AB )

A blastn

B tblastx

C blastx

D tblastn

24.下列属于globle alignment算法的是( A )

A Needleman-Wunsch

B Smith-Waterman

25.NCBI中的UniGene数据库主要是用下列哪个程序进行聚类的(D )

A blastp

B blastclust

C bl2seq

D cluster

26.下列哪些程序可用来进行短序列定位( B )

A SOAPalign

B maq

C SOAPdenovo

D trf

27.短序列拼装软件有(ABC )

A phrap

B cap3

C velvet

D SOAPdenovo

28.下列程序可用作原核生物基因预测的有哪些(AB )

A. Glimmer

B. Genemark

C. SNAP

D. FGENESH

E. Genescan

F. AUGUSTUS

29.下列程序可用作真核生物基因预测的有哪些(ADEF )

A. Glimmer-HMM

B.Genemark-AS

C.SNAP

D.FGENESH

E.Genescan

F. AUGUSTUS

30.计算下列比对的分值(score),打分矩阵如图所示,gap costs –G 5 –E 2 ( C)

CA-GGTAGCAAGCTTGCATGTCA

| | | | | | | | | | | | | | | | | | |

CATCGTAGCAAGCTTG-GTGTCA A 6 B -1 C 3 D 9

31. A G C T

A +1 –3 –3 -3

G –3 +1 –3 -3

C –3 –3 +1 -3

T –3 –3 –3 +1 (打分矩阵) GFF格式数据包括多少列数据( D )

A 6

B 7

C 8

D 9

四、简答题

1.三大核酸数据库是指哪几个,各自的序列查询系统分别是什么?

NCBI(美国国家生物技术信息中心):Entrez检索系统

EMBL(欧洲分子生物学实验室):SRS序列检索系统

DDBJ (日本核酸数据库):SRS工具进行数据库检索和序列分析

2.真核生物与原核生物的基因结构有何不同,试分别列出4 种真核生物基因预测软件,3种原核生物基因预测软件。

真核生物基因组:1) 结构松弛,含有大量重复顺;2)基因大多为断裂基因,由内含子和外显子构成;

3) 由线性、DNA与蛋白质组成染色体结构;4) 含有细胞器基因组。

原核生物基因组:1) 结构紧凑,一般不存在内含子(古细菌除外);2) 大小在5 Mb以下;

3) 缺少重复顺序; 4 ) 很少非编码顺序。

4 种真核生物基因预测软件: Genscan, HMMgene, Fgenesh, Twinscan

3种原核生物基因预测软件:Genemark,Glimmer,Fgenes。

3.什么是基因组组装,常用真核生物基因组组装软件有哪些?

定义:把已测序的序列map到基因组。

软件:PHRAD、PREP、SOAPDENOVE

4.什么是EST,NCBI 中的EST 数据库名称是什么?与Nucleotide 库中的mRNA 有什么不同?

EST:表达序列标签数据库名称:dbEST

不同:EST只能测一次,自身的局限性集中体现在序列分析中的精确程度,另外还有由高丰度与低丰度序列之间的巨大差异造成的重复测定与漏测;而mRNA是由实验室通过克隆测序得到,实验结果更准确,更可靠。

5.BLAST指的是什么?有哪几个常见的BLAST程序,各自的用途有哪些?

BLAST全称Basic Local Alignment Search Tool 即“局部相似性基本查询工具”, 是由美国国立生物技术信息中心(NCBI)开发的一个基于序列相似性的数据库搜索程序。

分类:Blastn:核酸序列搜索核酸库,直接对比核酸序列而得同源性

Blastp:蛋白质序列搜索蛋白质库,直接比较蛋白质序列的同源性

Blastx:核酸序列搜索蛋白质库,先将核酸序列翻译成蛋白质序列,然后再与蛋白质库做比较

Tblastn:蛋白质序列搜索核酸库,将库中的核酸翻译成蛋白质序列,然后进行对比

Tblastx:核酸序列搜索核酸库,核酸序列翻译成蛋白质序列,与核酸数据库中核酸序列翻译成的蛋白质序列比对。6.BLAST中的E 值指的是什么?代表什么含义?

E(期望值):表示因为随机性造成获得比对结果的可能次数,是一个统计学意义的数。可以找到同样分值hit。期望值越小,说明比对结果越可靠。当E值小于10-5时,表明两序列有较高的同源性,而不是因为计算错误。

当E值小于10-6时,表时两序列的同源性非常高,几乎没有必要再做确认。

7.BLAST输出结果的Result, hit和hsp分别代表什么意思?

Result:每个查询序列所返回的结果:hit:两个序列比对上的片段:hsp:一些得分较高的片段

8.试述直系同源与旁系同源对进化分析的影响,一般作进化分析用哪种比较合适。

直系同源:指的是不同物种之间的同源性,例如蛋白质的同源性,DNA序列的同源性。是指来自于不同物种的由垂直家系)进化而来的蛋白,并且典型的保留与原始蛋白有相同的功能。

旁系同源:是那些在一定物种中的来源于基因复制的蛋白,可能会进化出新的与原来有关的功能。

进化分析:直系。旁系同源是通过基因的复制而来,选择中性即无基因多效性;而直系同源保留了与原始蛋白有相同的功能9.Scaffold中的gap大小一般可依据什么来估计?

PAIR-END 双碱基末段

10.什么是生物信息学所谓的二次数据库,你所知的核酸、蛋白质、结构二次数据库有哪些?

根据生命科学不同研究领域的实际需要,对基因组图谱、核酸和蛋白质序列、蛋白质结构以及文献等数据进行分析、整理、归纳、注释而构建的具有特殊生物学意义和专门用途的数据库就是生物信息学中的二次数据库。

核酸:调控转录因子数据库TransFac,真核生物启动子数据库EPD,克隆载体数据库Vector,密码子使用表数据库CUTG;

蛋白质:蛋白质功能位点数据库Prosite,蛋白质功能位点序列片段数据库Prints,同源蛋白家族数据库Pfam,同源蛋白结构域数据库Blocks;以具有特殊功能的蛋白为基础构建的二次数据库有免疫球蛋白数据库Kabat,蛋白激酶数据库PKinase等;以三维结构原子坐标为基础构建的数据库如蛋白质二级结构构象参数数据库DSSP,已知空间结构的蛋白质家族数据库FSSP,已知空间结构的蛋白质及其同源蛋白数据库HSSP等。

11.简述同源性与相似性的区别。

相似性和同源性是两个完全不同的概念。同源序列是指从某一共同祖先经过趋异进化而形成的不同序列。相似性是指序列比对过程中检测序列和目标序列之间相同碱基或氨基酸残基序列所占比例的大小。当两条序列同源时,它们的氨基酸或核苷酸序列通常有显著的一致性(identity)。如果两条序列有一个共同的进化祖先,那么它们是同源的。这里不存在同源性(homology)的程度问题,两条序列要么是同源的要么是不同源的。

12.序列质量Q20 表示什么含义。

Q20:测序标准,Q=20=10*(-logE)->E=1%.即允许1%的错误率

13.什么是Unigene,它与组装中的contig有什么关系?

UniGene :是基因结合,被整理成簇的EST和全长mRNA序列,每一个代表一种特定已知的或假设基因,有定位图和表达信息以及同其它资源的交叉参考

UniGene对GeneBank中的序列数据进行适当处理,剔除冗余部分,将同一基因的序列,包括EST序列片段搜集到一起,以便研究基因的转录图谱。包含代表单一基因的序列和相关的信息。

Contig(重叠群)是可以组装成线性序列的一组克隆。一个UniGene不一定代表一个contig,一个UniGene可有多个contig。

14.简述Glimmer 预测原核基因步骤

(1)long-orfs 找到没有交叠的编码区

(2)extract 提取训练序列

(3)build-icm 建立统计模型

(4)glimmer 预测整个基因组基因、

(5)处理结果。

15.Megablast与Discontiguous megaBLAST主要区别是什么,为什么说后者比前者的敏感性更好,如何选择?

Megablast的窗口是连续的,megablast)多用于比较相似性比较高(相似性在95%以上)的序列,速度快,主要用来在非常相似的序列之间(来自同一物种)比对同源性的;而Discontiguous megaBLAST窗口是非连续的适合于相似性稍低于megablast的比对,但是灵敏度和精确度更高,多用于不同物种间的同源比对。它使用非重叠群字段匹配算法来进行核酸比对,速度很快,同时他在比较编码区时也具有相当高的敏感度。

因为密码子的简并性,由于核酸与核酸之间的比对并不是发现同源蛋白编码区域的最佳方法

五、方案设计

1.如果你手里有一未知细菌的16S rRNA序列,如何鉴定该细菌的分类地位?

16S rRNA是细胞所共有,是高度保守序列,又具有高变性,保守性能够反映物种的亲缘关系,高变性能揭示出生物物种的特征核酸序列,是属种鉴定的分子基础.NCBI——BLAST(各类生物的16S rRNA),从序列之间的差异计算对比对结果分析做进化树。一般97%>认为是同一属——构树(构树的步骤) ——验证属种——根据树的分枝确定分类

2.假设你手里有一段DNA序列,已知该序列是编码蛋白的,如何利用该段序列进行相关进化分析?

找出核酸CDS (编码区)——与蛋白质库中的蛋白质比对——找出相关蛋白质——转化为DNA构树

3.试设计基于某一特定基因构建不同物种之间的亲缘关系树。

(1)序列中有摸板时(相似性>30%)即认为是同源序列,然后用同源建模,利用同一个家族的蛋白质结构为模板来预测未知蛋白质的结构(2)若相似性<30%,则采用从头预测,折叠识别

4.试设计分析某一蛋白质三级结构预测方案。

蛋白质三级结构的预测方法:同源建模,从头预测,折叠识别

同源建模:目标序列与模板序列的匹配; 根据同源蛋白质的多重序列匹配结果, 确定同源蛋白质的结构保守区及相应的框架构; 目标蛋白质结构保守区的主链模建; 目标蛋白质结构变异区的主链模建; 侧链的安装和优化; 对模建结构进行优化和评估

5.设计如何用EST数据找可变剪切模式方案。

可变剪切:剪切体可以将RNA中的内含子和外显子进行不同拼接的剪切方式,一个转录单位可以通过这种方式产生多种成熟的RNA,又称选择性剪切

6.设计如何用HMMER构建基因家族模型方案。

1.多序列比对生成clastalw格式的比对文件

2.所得文件转换为stockholm格式perl aln2sto 输入文件.aln 输出文件.sto

3.用hmmbuild建HMM模型hmmbuild 输出文件.hmm 输入文件

六、论述

1.什么是生物信息学所谓的基本数据库,你所知的核酸、蛋白质、结构基本数据库有哪些?

生物信息学中的数据是指生物分子的信息,具体表现为DNA序列数据、蛋白质序列数据、生物分子结构数据、生物分子功能数据(包括蛋白质功能的定性描述、蛋白质之间的相互作用描述、基因表达数据、代谢路径、调控网络等)。所有类型的数据中,序列与结构是基本的数据,储存这些数据的数据库,就是生物信息学中的基本数据库。

核酸序列数据库:EBI的EMBL数据库、NCBI的GenBank数据库、日本国立遗传学研究所的DDBJ数据。这三者间数据共享,每天更新。

蛋白质数据库:SWISS-PROT蛋白质序列数据库、PDB生物大分子结构数据库、HSSP蛋白质二级结构数据库。

2.试述生物试验、计算生物及生物数据库之间的关系。

计算生物中的对象数据来源于生物试验而管理则依赖于生物数据库

3.试述高通量测序最新进展,高通量测序技术的发展对生物信息学提出了哪些新的要求。

发展:SANGER测序(第一代)——DOLEXA/454(第二代) ——SOLD

READS短——提升READS的长度, 海量数据测序错误率高费用高

4.什么是云计算,试述云计算在生物信息中的应用。

云端运算(英文:Cloud computing,),是一种基于互联网的计算新方式,通过互联网上异构、自治的服务为个人和企业用户提供按需即取的计算。由于资源是在互联网上,而在电脑流程图中,网际网路常以一个云状图案来表示,因此可以形象地类比为云端,『云端』同时也是对底层基础设施的一种抽象概念。

应用:只需用户递交一个任务,就可以通过云计算直接得出结果,看不到它的计算过程, 服务提供商根据客户所定软件的时间时间的长短等因素收费,并且通过浏览器向客户提供软件的模式。这种服务模式的优势是,由服务提供商维护和管理软件、提供软件运行的硬件设施,不需专门维护.

6.从进化角度试述为什么结构较功能和序列更保守。

序列是基于结构的,当序列变化时,结构不一定变化,而根据趋同进化(不同的生物,甚至在进化上相距甚远的生物,如果生活在条件相同的环境中,在同样选择压的作用下,有可能产生功能相同或十分相似的形态结构,以适应相同的条件)表明结构决定功能7.如果知道一个蛋白的氨基酸序列,试设计一个研究其功能和作用位点的流程。

1.同源蛋白比对(同源功能已知),且位点保守;

2.检验位点上的一个突变,检查有无功能

8.试述基因树与物种树的关系。

基因树(genetree)和物种树(specie5tree)基因树是由一个基因所构建的系统树,这种树代表的仅仅是单个基因的进化历史,而不是它所在物种的进化历史。物种树则表达了某一特定类群的进化路径(evol山ionarypathway)。虽然基因树和物种树同属系统树,但两者至少在两个方面存在差异:①从两个不同的物种巾获取的两个基因,其分化可能早于物种的分化;②基因树的拓扑结构可能与物种树不一致,因为两个或多个基因树之间很可能存在不一致之处。如何将由多个基因或基因组建立的基因树综合成为一个物种树,是分子系统学目前所面临的一个难题。

全国自考数据库系统原理历年试题及答案

2008年1月高等教育自学考试全国统一命题考试 数据库系统原理试卷 4735 一、单项选择题(本大题共15小题,每小题2分,共30分) 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。 1.数据库在磁盘上的基本组织形式是( B ) A.DB B.文件 C.二维表D.系统目录 2.ER(实体联系模型)模型是数据库的设计工具之一,它一般适用于建立数据库的( A ) A.概念模型B.逻辑模型 C.内部模型D.外部模型 3.数据库三级模式中,用户与数据库系统的接口是( B ) A.模式B.外模式 C.内模式D.逻辑模式 4.在文件系统中,所具有的数据独立性是( D ) A.系统独立性

B.物理独立性 C.逻辑独立性 D.设备独立性 5.在DB技术中,“脏数据”是指( D ) A.未回退的数据 B.未提交的数据 C.回退的数据 D.未提交随后又被撤消的数据 6.关系模式至少应属于( A ) A.1NF B.2NF C.3NF D.BCNF 7.设有关系模式R(ABCD),F是R上成立的FD集,F={A→B,B→C},则属性集BD的闭包(BD)+为( B ) A.BD B.BCD C.BC D.CD 8.设有关系R如题8图所示:(C)

R 则 专业,入学年份(R)的元组数为 A.2 B.3 C.4 D.5 9.集合R与S的交可以用关系代数的基本运算表 示为( A ) A.R-(R-S) B.R+(R-S) C.R-(S-R) D.S-(R-S) l0.已知SN是一个字符型字段,下列SQL查询语 句( C ) SELECT SN FROM S WHERE SN LIKE′AB%′;的执行结果为 A.找出含有3个字符′AB%′的所有SN字段 B.找出仅含3个字符且前两个字符为′AB′的SN字段 C.找出以字符′AB′开头的所有SN字段

分布式大数据库系统复习题

一、何为分布式数据库系统?一个分布式数据库系统有哪些特点? 答案:分布式数据库系统通俗地说,是物理上分散而逻辑上集中的数据库系统。分布式数据库系统使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位连接起来,共同组成一个统一的数据库系统。因此,分布式数据库系统可以看成是计算机网络与数据库系统的有机结合。一个分布式数据库系统具有如下特点: 物理分布性,即分布式数据库系统中的数据不是存储在一个站点上,而是分散存储在由计算机网络连接起来的多个站点上,而且这种分散存储对用户来说是感觉不到的。 逻辑整体性,分布式数据库系统中的数据物理上是分散在各个站点中,但这些分散的数据逻辑上却构成一个整体,它们被分布式数据库系统的所有用户共享,并由一个分布式数据库管理系统统一管理,它使得“分布”对用户来说是透明的。 站点自治性,也称为场地自治性,各站点上的数据由本地的DBMS管理,具有自治处理能力,完成本站点的应用,这是分布式数据库系统与多处理机系统的区别。 另外,由以上三个分布式数据库系统的基本特点还可以导出它的其它特点,即:数据分布透明性、集中与自治相结合的控制机制、存在适当的数据冗余度、事务管理的分布性。 二、简述分布式数据库的模式结构和各层模式的概念。 分布式数据库是多层的,国分为四层: 全局外层:全局外模式,是全局应用的用户视图,所以也称全局试图。它为全局概念模式的子集,表示全局应用所涉及的数据库部分。 全局概念层:全局概念模式、分片模式和分配模式 全局概念模式描述分布式数据库中全局数据的逻辑结构和数据特性,与集中式数据库中的概念模式是集中式数据库的概念视图一样,全局概念模式是分布式数据库的全局概念视图。分片模式用于说明如何放置数据库的分片部分。分布式数据库可划分为许多逻辑片,定义片段、片段与概念模式之间的映射关系。分配模式是根据选定的数据分布策略,定义各片段的物理存放站点。 局部概念层:局部概念模式是全局概念模式的子集。局部层:局部模式 局部模式是分布式数据库中关于物理数据库的描述,类同集中式数据库中的模式,但其描述的容不仅包含只局部于本站点的数据的存储描述,还包括全局数据在本站点的存储描述。 三、简述分布式数据库系统中的分布透明性,举例说明分布式数据库简单查询的 各级分布透明性问题。 分布式数据库中的分布透明性即分布独立性,指用户或用户程序使用分布式数据库如同使用集中式数据库那样,不必关心全局数据的分布情况,包括全局数据的逻辑分片情况、逻辑片段的站点位置分配情况,以及各站点上数据库的数据模型等。即全局数据的逻辑分片、片段的物理位置分配,各站点数据库的数据模型等情况对用户和用户程序透明。

数据库系统概论期末试题及答案(重点知识)

试题十 一、单项选择题 (本大题共15小题,每小题2分,共30分) 在每小题列出的四个备选项中只有一个是符合题目要 求的,错选、多选或未选均无分。 1. 数据库系统的特点是( )、数据独立、减少数据冗余、避免数据不一致和加强了数据保护。 A .数据共享 B .数据存储 C .数据应用 D .数据保密 2. 数据库系统中,物理数据独立性是指( )。 A .数据库与数据库管理系统的相互独立 B .应用程序与DBMS 的相互独立 C .应用程序与存储在磁盘上数据库的物理模式是相互独立的 D .应用程序与数据库中数据的逻辑结构相互独立 3. 在数据库的三级模式结构中,描述数据库中全体数据的全局逻辑结构和特征的是( )。 A .外模式 B .内模式 C .存储模式 D .模式 4. E-R 模型用于数据库设计的哪个阶段( )? A .需求分析 B .概念结构设计 C .逻辑结构设计 D .物理结构设计 5. 现有关系表:学生(宿舍编号,宿舍地址,学号,姓名,性别,专业,出生日期)的主码是( )。 A .宿舍编号 B .学号 C .宿舍地址,姓名 D .宿舍编号,学号 6. 自然连接是构成新关系的有效方法。一般情况下,当对关系R 和S 使用自然连接时,要求R 和S 含有一个或多个共有的( )。 A .元组 B .行 C .记录 D .属性 7. 下列关系运算中,( )运算不属于专门的关系运算。 A .选择 B .连接 C .广义笛卡尔积 D .投影 8. SQL 语言具有( )的功能。 ( 考 生 答 题 不 得 超 过 此 线 )

A.关系规范化、数据操纵、数据控制 B.数据定义、数据操纵、数据控制 C.数据定义、关系规范化、数据控制 D.数据定义、关系规范化、数据操纵 9.如果在一个关系中,存在某个属性(或属性组),虽然不是该关系的主码或只是主码的一部分,但却是另一个关系的主码时,称该属性(或属性组)为这个关系的() A.候选码 B.主码 C. 外码 D. 连接码 10.下列关于关系数据模型的术语中,()术语所表达的概念与二维表中的 “行”的概念最接近? A.属性 B.关系 C. 域 D. 元组 11.假定学生关系是S(S#,SNAME,SEX,AGE),课程关系是C(C#,CNAME, TEACHER),学生选课关系是SC(S#,C#,GRADE)。 要查找某个学生的基本信息及其选课的平均成绩,将使用关系()A.S和SC B.SC和C C.S和C D.S、SC和C 12.在SQL语言的SELECT语句中,用于对结果元组进行排序的是()子句。 A. GROUP BY B.HAVING C.ORDER BY D.WHERE 13.设有关系SC(SNO,CNO,GRADE),主码是(SNO,CNO)。遵照实体完整性规则,下面()选项是正确的。 A.只有SNO不能取空值B.只有CNO不能取空值 C.只有GRADE不能取空值D.SNO与CNO都不能取空值 14.下面关于函数依赖的叙述中,()是不正确的。 A.若X→Y,WY→Z,则XW→Z B.若Y X,则X→Y C.若XY→Z,则X→Z,Y→Z D.若X→YZ,则X→Y,X→Z 15.设有关系R(A,B,C)和S(C,D)。与SQL语句select A,B,D from R,S where R.C=S.C等价的关系代数表达式是() A.σR.C=S.C(πA,B,D(R×S)) B.πA,B,D(σR,C= S.C(R×S)) C.σR.C=S.C((πA,B(R))×(πD(S))) D.σR,C=S.C(πD((πA,B(R))×S))

最新生物信息学名词解释(个人整理)

一、名词解释: 1.生物信息学:研究大量生物数据复杂关系的学科,其特征是多学科交叉,以互联网为媒介,数据库为载体。利用数学知识建立各种数学模型; 利用计算机为工具对实验所得大量生物学数据进行储存、检索、处理及分析,并以生物学知识对结果进行解释。 2.二级数据库:在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来,是对生物学知识和信息的进一步的整理。 3.FASTA序列格式:是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨基酸字符串,大于号(>)表示一个新文件的开始,其他无特殊要求。 4.genbank序列格式:是GenBank 数据库的基本信息单位,是最为广泛的生物信息学序列格式之一。该文件格式按域划分为4个部分:第一部分包含整个记录的信息(描述符);第二部分包含注释;第三部分是引文区,提供了这个记录的科学依据;第四部分是核苷酸序列本身,以“//”结尾。 5.Entrez检索系统:是NCBI开发的核心检索系统,集成了NCBI的各种数据库,具有链接的数据库多,使用方便,能够进行交叉索引等特点。 6.BLAST:基本局部比对搜索工具,用于相似性搜索的工具,对需要进行检索的序列与数据库中的每个序列做相似性比较。P94 7.查询序列(query sequence):也称被检索序列,用来在数据库中检索并进行相似性比较的序列。P98 8.打分矩阵(scoring matrix):在相似性检索中对序列两两比对的质量评估方法。包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如PAM)两类方法。P29 9.空位(gap):在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位。P29 10.空位罚分:空位罚分是为了补偿插入和缺失对序列相似性的影响,序列中的空位的引入不代表真正的进化事件,所以要对其进行罚分,空位罚分的多少直接影响对比的结果。P37 11.E值:衡量序列之间相似性是否显著的期望值。E值大小说明了可以找到与查询序列(query)相匹配的随机或无关序列的概率,E值越接近零,越不可能找到其他匹配序列,E 值越小意味着序列的相似性偶然发生的机会越小,也即相似性越能反映真实的生物学意义。P95 12.低复杂度区域:BLAST搜索的过滤选项。指序列中包含的重复度高的区域,如poly(A)。 13.点矩阵(dot matrix):构建一个二维矩阵,其X轴是一条序列,Y轴是另一个序列,然后在2个序列相同碱基的对应位置(x,y)加点,如果两条序列完全相同则会形成一条主对角线,如果两条序列相似则会出现一条或者几条直线;如果完全没有相似性则不能连成直线。 14.多序列比对:通过序列的相似性检索得到许多相似性序列,将这些序列做一个总体的比对,以观察它们在结构上的异同,来回答大量的生物学问题。 15.分子钟:认为分子进化速率是恒定的或者几乎恒定的假说,从而可以通过分子进化推断出物种起源的时间。 16.系统发育分析:通过一组相关的基因或者蛋白质的多序列比对或其他性状,可以研究推断不同物种或基因之间的进化关系。 17.进化树的二歧分叉结构:指在进化树上任何一个分支节点,一个父分支都只能被分成两个子分支。 系统发育图:用枝长表示进化时间的系统树称为系统发育图,是引入时间概念的支序图。 18.直系同源:指由于物种形成事件来自一个共同祖先的不同物种中的同源序列,具有相似或不同的功能。(书:在缺乏任何基因复制证据的情况下,具有共同祖先和相同功能的同源基因。)

数据库系统原理(2018年版)课后习题参考答案解析

答案仅供参考 第一章数据库系统概述 选择题 B、B、A 简答题 1.请简述数据,数据库,数据库管理系统,数据库系统的概念。 P27 数据是描述事物的记录符号,是指用物理符号记录下来的,可以鉴别的信息。 数据库即存储数据的仓库,严格意义上是指长期存储在计算机中的有组织的、可共享的数据集合。 数据库管理系统是专门用于建立和管理数据库的一套软件,介于应用程序和操作系统之间。数据库系统是指在计算机中引入数据库技术之后的系统,包括数据库、数据库管理系统及相关实用工具、应用程序、数据库管理员和用户。 2.请简述早数据库管理技术中,与人工管理、文件系统相比,数据库系统的优点。 数据共享性高 数据冗余小 易于保证数据一致性 数据独立性高 可以实施统一管理与控制 减少了应用程序开发与维护的工作量 3.请简述数据库系统的三级模式和两层映像的含义。 P31 答: 数据库的三级模式是指数据库系统是由模式、外模式和内模式三级工程的,对应了数据的三级抽象。 两层映像是指三级模式之间的映像关系,即外模式/模式映像和模式/内模式映像。 4.请简述关系模型与网状模型、层次模型的区别。 P35 使用二维表结构表示实体及实体间的联系 建立在严格的数学概念的基础上 概念单一,统一用关系表示实体和实体之间的联系,数据结构简单清晰,用户易懂易用 存取路径对用户透明,具有更高的数据独立性、更好的安全保密性。

第二章关系数据库 选择题 C、C、D 简答题 1.请简述关系数据库的基本特征。P48 答:关系数据库的基本特征是使用关系数据模型组织数据。 2.请简述什么是参照完整性约束。 P55 答:参照完整性约束是指:若属性或属性组F是基本关系R的外码,与基本关系S的主码K 相对应,则对于R中每个元组在F上的取值只允许有两种可能,要么是空值,要么与S中某个元组的主码值对应。 3.请简述关系规范化过程。 答:对于存在数据冗余、插入异常、删除异常问题的关系模式,应采取将一个关系模式分解为多个关系模式的方法进行处理。一个低一级范式的关系模式,通过模式分解可以转换为若干个高一级范式的关系模式,这就是所谓的规范化过程。 第三章数据库设计 选择题 B、C、C 简答题 1. 请简述数据库设计的基本步骤。 P66 需求分析设计;概念结构设计;逻辑结构设计;物理结构设计;数据库设计;数据库的运行和维护。 2. 请分别举例说明实体之间联系的三种表现情形。 P74 一对一联系:对于实体集A中的每个实体,实体集B中最多只有一个实体与之联系,反之亦然。举例:班级与班长,每个班只有一个班长,每个班长也只在一个班内任职。 一对多联系:对于实体集A中的每个实体,实体集B中有N个实体与之联系,反之,对于实体集B中的每个实体,实体集A中最多只有一个实体与之联系。举例:班级与班级成员,每个班级对应多个班级成员,每个班级成员只对应一个班级。 多对多联系:对于实体集A中的每个实体,实体集B中有N个实体与之联系,反之,对于实体集B中的每个实体,实体集A中有M个实体与之联系。举例:授课班级与任课教师,每个

数据库系统概论复习题及答案

第一学期期末考试试卷和答案 试卷代码:03115 授课课时:96 课程名称:数据库系统原理A 适用对象:本科选课班 一、选择题(从下列各题四个答案中选出一个正确答案,每小题1分,共10分) 1、在数据库技术发展的几个阶段中,数据独立性最高的是__A___阶段。 A、数据库系统 B、文件系统 C、人工管理 D、数据项管理 2、在SQL的SELECT语句中,与选择运算对应的命令动词是__C___。 A、SELECT B、FROM C、WHERE D、ORDER BY 3、在数据库中,下列说法_A__是不正确的 A、数据库避免了一切数据的重复 B、若系统是完全可以控制的,则系统可确保更新是的一致性 C、数据可以共享 D、数据库减少了冗余 4、在数据库系统中,模式/外模式映像用于解决数据的_C__ A、结构独立性 B、物理独立性 C、逻辑独立性 D、分布独立性 5、关系代数的5种基本运算是__D_。 A、并、差、选择、投影、自然连接 B、并、差、交、选择、投影 C、并、差、交、选择、笛卡尔积 D、并、差、选择、投影、笛卡尔积 6、在SQL语句中,谓词“EXISTS”的含义是_B___。 A、全称量词 B、存在量词 C、自然连接--在连接条件中使用等于(=)运算符比较被连接列的列值,但它使用选择列表指出查询结果集合中所包括的列,并删除连接表中的重复列 D、等值连接--在连接条件中使用等于号(=)运算符比较被连接列的列值,其查询结果中列出被连接表中的所有列,包括其中的重复列 7、规范化过程主要为克服数据库逻辑结构中的插入异常、删除异常、更新异常以及_C__的缺陷 A、数据不一致性 B、结构不合理 C、冗余度大 D、数据丢失 8、数据库数据的正确性和相容性是数据库的__B____。 A、安全性 B、可维护性 C、完整性 D、并发控制 9、数据库三级模式体系结构主要的目标是确保数据库的_B__。 A、数据安全性 B、数据独立性

生物信息学名词解释

1.计算生物信息学(Computational Bioinformatics)是生命科学与计算机科学、数理科学、化学等领域相互交叉而形成的一门新兴学科,以生物数据作为研究对象,研究理论模型和计算方法,开发分析工具,进而达到揭示这些数据蕴含的生物学意义的目的。 2.油包水PCR (Emulsion PCR) : 1) DNA片段和捕获磁珠混合; 2) 矿物油和水相的剧烈震荡产生油包水环境; 3) DNA片段在油包水环境中扩增;4) 破油并富集有效扩增磁珠。 3.双碱基编码技术:在测序过程中对每个碱基判读两遍,从而减少原始数据错误,提供内在的校对功能。代表测序方法:solid 测序。 4.焦磷酸测序法:焦磷酸测序技术是由4种酶催化的同一反应体系中的酶级联化学发光反应,适于对已知的短序列的测序分析,其可重复性和精确性能与SangerDNA测序法相媲美,而速度却大大的提高。焦磷酸测序技术不需要凝胶电泳,也不需要对DNA样品进行任何特殊形式的标记和染色,具备同时对大量样品进行测序分析的能力。在单核苷酸多态性、病原微生物快速鉴定、病因学和法医鉴定研究等方面有着越来越广泛的应用。例如:454测序仪 :用蛋白质序列查找核苷酸序列。 :STS是序列标记位点(sequence-tagged site)的缩写,是指染色体上位置已定的、核苷酸序列已知的、且在基因组中只有一份拷贝的DNA短片断,一般长200bp -500bp。它可用PCR方法加以验证。将不同的STS依照它们在染色体上的位置依次排列构建的图为STS图。在基因组作图和测序研究时,当各个实验室发表其DNA测序数据或构建成的物理图时,可用STS来加以鉴定和验证,并确定这些测序的DNA片段在染色体上的位置;还有利于汇集分析各实验室发表的数据和资料,保证作图和测序的准确性。 :表达序列标签技术(EST,Expressed Sequence Tags)EST技术直接起源于人类基因组计划。 :生物信息学数据库。UniGene试图通过计算机程序对GeneBank中的序列数据进行适当处理,剔除冗余部分,将同一基因的序列,包括EST序列片段搜集到一起,以便研究基因的转录图谱。UniGene除了包括人的基因外,也包括小鼠、大鼠等其它模式生物的基因。 :开放阅读框(ORF,open reading frame )是基因序列的一部分,包含一段可以编码蛋白的碱基序列,不能被终止子打断。编码一个蛋白质的外显子连接成为一个连续的ORF。 10.分子钟检验:只有分子钟的,没听过分子钟检验。一种关于分子进化的假说,认为两个物种的同源基因之间的差异程度与它们的共同祖先的存在时间(即两者的分歧时间)有一定的数量关系

数据库系统原理试题答案3

全国2008年10月自学考试 一、单项选择题(本大题共15小题,每小题2分,共30分) 1.数据库是长期存储在计算机内、有组织的、统一管理的相关( B ) A.文件的集合 B.数据的集合 C.命令的集合 D.程序的集合 2.在数据库的三级模式中,描述数据库中全部数据的整体逻辑结构的是( C ) A.外模式 B.内模式 C.逻辑模式 D.存储模式 3.数据库系统中存放三级结构定义的DB称为( B )A.DBS B.DD C.DDL D.DBMS 4.教师实体中有教师号、姓名、部门、任教时间、教龄等属性,其中教龄是一个( A ) A.派生属性 B.多值属性 C.复合属性 D.NULL属性 5.对关系的描述不正确的是( C ) A.关系是一个集合 B.关系是一张二维表 C.关系可以嵌套定义 D.关系中的元组次序可交换 6.若属性X函数依赖于属性Y时,则属性X与属性Y之间具有( B ) A.一对一联系 B.一对多联系 C.多对一联系 D.多对多联系 7.设F是关系模式R的FD集,如果对F中每个非平凡的FD X—Y,都有X是R的超键,则( C ) A.R属于2NF,但不一定属于3NF B.R属于3NF,但不一定属于BCNF C.R属于BCNF,但不一定属于4NF D.R属于4NF 8.关系Rl和R2如下表所示: A.1 B.3 C.6 D.9 9.设四元关系R(A,B,C,D),则下面不正确的是( ) A. )R(B D, ∏ 为取属性D,B的两列组成新关系B. )R( 4,2 ∏ 为取属性的值是4,2的两列组成新关系 C. )R(B D, ∏ 与 )R( 4,2 ∏ 是等价的D. )R(B D, ∏ 与 )R( 2,4 ∏ 是相同关系 10.下列叙述正确的是( ) A.在ORDER BY子句后只能有一个属性 B.ORDER BY子句所产生的输出只是逻辑排序效果,并没有影响表的实际内容 C.进行有序输出时,如果列中有空值则在升序输出时首先列出空值项,而在降序时最后列出空值项 D.ORDER BY子句中必须指明是升序或降序,不能缺省 12.现要查找缺少成绩(G)的学生学号(S#)和课程号(C#),下面SQL语句中WHERE子句的条件表达式应是:SELECT S#,C# FROM SC WHERE( )A.G=0 B.G<=0 C.G=NULL D.G IS NULL 12.数据库恢复的主要依据是( D )A.DBA B.DD C.文档 D.事务日志 13.不能激活触发器执行的事件是( )A.SELECT B.UPDA TE C.INSFRT D.DELETE 14.SQL Server 2000的主要工具中,执行T-SQL的最佳轻量级工具是( A ) A.查询分析器 B.服务管理器 C.企业管理器 D.事件探查器 15.在ODBC体系结构中,为应用程序加载、调用和卸载DB驱动程序的是( B ) A.ODBC数据库应用程序 B.驱动程序管理器 C.DB驱动程序 D.数据源 二、填空题(本大题共10小题,每小题1分,共10分) 请在每小题的空格上填上正确答案。错填、不填均无分。 16.能惟一标识实体的属性或属性集称为___ 实体标识符_____。 17.数据独立性使得修改数据结构时,尽可能不修改外部应用程序________。 18.数据库的物理结构主要指数据库的存储记录格式、存储记录安排和__存取方法______。 19.由于数据的冗余,在对数据操作时常会引起__修改异常______、插入异常、删除异常。 20.关系代数运算中,专门的关系操作有:选择、投影、除和_连接_______。 21.SQL语言的条件表达式中字符串匹配操作符是__like______。 22.DBS运行的最小逻辑工作单位是____数据项____。 23.SQL的基本表约束主要有三种形式:候选键定义、外键定义、__域______定义。 24.在复合数据类型中,相同类型元素的有序集合,并且允许有重复的元素,称为__列表类型______。 25.SQL Server 2000引擎对外使用Net-Library抽象层来支持不同的__网络协议______。 1

数据库原理与应用期末复习总结含试题及其答案

数据库原理综合习题答案 1.1名词解释 (1) DB:即数据库(Database),是统一管理的相关数据的集合。DB能为各种用户共享,具有最小冗余度,数据间联系密切,而又有较高的数据独立性。 (2) DBMS:即数据库管理系统(Database Management System),是位于用户与操作系统之间的一层数据管理软件,为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。DBMS总是基于某种数据模型,可以分为层次型、网状型、关系型、面向对象型DBMS。 (3) DBS:即数据库系统(Database System),是实现有组织地、动态地存储大量关联数据,方便多用户访问的计算机软件、硬件和数据资源组成的系统,即采用了数据库技术的计算机系统。 (4) 1:1联系:如果实体集E1中的每个实体最多只能和实体集E2中的一个实体有联系,反之亦然,那么实体集E1对E2的联系称为“一对一联系”,记为“1:1”。 (5) 1:N联系:如果实体集E1中每个实体与实体集E2中任意个(零个或多个)实体有联系,而E2中每个实体至多和E1中的一个实体有联系,那么E1对E2的联系是“一对多联系”,记为“1:N”。 (6) M:N联系:如果实体集E1中每个实体与实体集E2中任意个(零个或多个)实体有联系,反之亦然,那么E1对E2的联系是“多对多联系”,记为“M:N”。 (7) 数据模型:模型是对现实世界的抽象。在数据库技术中,表示实体类型及实体类型间联系的模型称为“数据模型”。它可分为两种类型:概念数据模型和结构数据模型。 (6) 概念数据模型:是独门于计算机系统的模型,完全不涉及信息在系统中的表示,只是用来描述某个特定组织所关心的信息结构。 (9) 结构数据模型:是直接面向数据库的逻辑结构,是现实世界的第二层抽象。这类模型涉及到计算机系统和数据库管理系统,所以称为“结构数据模型”。结构数据模型应包含:数据结构、数据操作、数据完整性约束三部分。它主要有:层次、网状、关系三种模型。 (10) 层次模型:用树型结构表示实体类型及实体间联系的数据模型。 (11) 网状模型:用有向图结构表示实体类型及实体间联系的数据模型。 (12) 关系模型:是目前最流行的数据库模型。其主要特征是用二维表格结构表达实体集,用外鍵表示实体间联系。关系模型是由若干个关系模式组成的集合。 (13) 概念模式:是数据库中全部数据的整体逻辑结构的描述。它由若干个概念记录类型组成。概念模式不仅要描述概念记录类型,还要描述记录间的联系、操作、数据的完整性、安全性等要求。 (14) 外模式:是用户与数据库系统的接口,是用户用到的那部分数据的描述。 (15) 内模式:是数据库在物理存储方面的描述,定义所有的内部记录类型、索引和文件的组成方式,以及数据控制方面的细节。 (16) 模式/内模式映象:这个映象存在于概念级和内部级之间,用于定义概念模式和内模式间的对应性,即概念记录和内部记录间的对应性。此映象一般在内模式中描述。 (17) 外模式/模式映象:这人映象存在于外部级和概念级之间,用于定义外模式和概念模式间的对应性,即外部记录和内部记录间的对应性。此映象都是在外模式中描述。 (18) 数据独立性:在数据库技术中,数据独立性是指应用程序和数据之间相互独立,不受影响。数据独立性分成物理数据独立性和逻辑数据独立性两级。 (19) 物理数据独立性:如果数据库的内模式要进行修改,即数据库的存储设备和存储方法有所变化,那么模式/内模式映象也要进行相应的修改,使概念模式尽可能保持不变。也就是对模式的修改尽量不影响概念模式。

数据库系统概论各章复习试题及答案

数据库系统概论复习资料: 第一章: 一、选择题: 1.在数据管理技术的发展过程中,经历了人工管理阶段、文件系统阶段和数据库系统阶段。在这几个阶段中,数据独立性最高的是 A 阶段。 A.数据库系统 B.文件系统 C.人工管理 D.数据项管理 2.数据库的概念模型独立于 A 。 A.具体的机器和DBMS B.E-R图 C.信息世界 D.现实世界 3.数据库的基本特点是 B 。 A.(1)数据可以共享(或数据结构化) (2)数据独立性 (3)数据冗余大,易移植 (4)统一管理和控制 B.(1)数据可以共享(或数据结构化) (2)数据独立性 (3)数据冗余小,易扩充 (4)统一管理和控制 C.(1)数据可以共享(或数据结构化) (2)数据互换性 (3)数据冗余小,易扩充 (4)统一管理和控制 D.(1)数据非结构化 (2)数据独立性 (3)数据冗余小,易扩充 (4)统一管理和控制 4. B 是存储在计算机内有结构的数据的集合。 A.数据库系统B.数据库 C.数据库管理系统 D.数据结构 5.数据库中存储的是 C 。 A.数据 B.数据模型C.数据以及数据之间的联系 D.信息 6. 数据库中,数据的物理独立性是指 C 。 A.数据库与数据库管理系统的相互独立 B.用户程序与DBMS的相互独立 C.用户的应用程序与存储在磁盘上数据库中的数据是相互独立的 D.应用程序与数据库中数据的逻辑结构相互独立 7. 数据库的特点之一是数据的共享,严格地讲,这里的数据共享是指 D 。 A.同一个应用中的多个程序共享一个数据集合 B.多个用户、同一种语言共享数据 C.多个用户共享一个数据文件 D.多种应用、多种语言、多个用户相互覆盖地使用数据集合 8.数据库系统的核心是 B 。 A.数据库 B.数据库管理系统 C.数据模型 D.软件工具 9. 下述关于数据库系统的正确叙述是 A 。 A.数据库系统减少了数据冗余 B.数据库系统避免了一切冗余 C.数据库系统中数据的一致性是指数据类型一致 D.数据库系统比文件系统能管理更多的数据 10. 数将数据库的结构划分成多个层次,是为了提高数据库的①和②。 ①A.数据独立性 B.逻辑独立性 C.管理规范性 D.数据的共享 ②A.数据独立性 B.物理独立性 C.逻辑独立性 D.管理规范性 【答案:】①B ②B 11. 数据库(DB)、数据库系统(DBS)和数据库管理系统(DBMS)三者之间的关系是 A 。 A.DBS包括DB和DBMS B.DDMS包括DB和DBS C.DB包括DBS和DBMS D.DBS就是DB,也就是DBMS

《数据库系统原理》复习题(答案)

(一)填空题 1.数据管理经历了_______阶段、________阶段到________阶段的变迁。(手工管理、 文件管理、数据库管理) 2.实体之间联系的基本类型有______、_______、_______。(一对一、一对多、多对多) 3.在E-R图中,用____表示实体,用______表示联系,用______表示属性。(矩形框、菱形框、椭圆框) 4.数据库的三层模式结构是________、_________、_______。(外模式、逻辑模式、内模式) 5.关系模型中一般讲数据完整性分为三类:_________、___________、__________。 (实体完整性、参照完整性、用户定义完整性) 6.数据模型由三部分组成:数据结构、数据操作和____________。(数据的约束条件或数据完整性规则) 7.SQL语言是一种标准的数据库语言, 包括数据的查询、定义、操纵和______四部分功能。(控制) 8.视图是从其它________或视图导出的虚表。(基本表) 9.在关系模式R 中,若属性或属性组X 不是关系R 的关键字,但X 是其他关系模式的关键字,则称X 为关系R 的___________。(外关键字) 10.访问SQL server数据库对象时,需要经过身份验证和_________两个阶段,其中身份验证分为Windows验证模式和_______验证模式。(权限验证、混合) 11._______是存储在文件中的一系列SQL语句,即一系列按顺序提交的批处理。(脚本) 12.SQL语言中行注释的符号为_________;块注释的符号为_________。(--、/**/) 13.SQL server中的变量分为两种,全局变量和局部变量。其中全局变量的名称以_______字符开始,有系统定义和维护。局部变量以__________字符开始,由用户自己定义和赋值。(@@、@) 14.在SQL server中,其权限分为三类,即_________权限、_________权限和_________权限。(对象、语句、隐含) 15.用户对数据进行添加、修改和删除时,自动执行的存储过程称为_________。(触发器) 16.角色是一组用户所构成的组,可以分为服务器角色和_______角色。(数据库) 17.触发器有3种类型,即INSERT类型、_______和_______。(UPDATE类型、DELETE类型) 18.如果要计算表中的行数,可以使用聚合函数______。(COUNT()) 19.在SQL Server中修改表的结构应使用关键字,修改表中的数据应使用关键字。(ALTER 、UPDA TE) (二)单项选择题 1.一个仓库可以存放多种产品,而一种产品只能存放于一个仓库中。仓库与产品之间的联系类型是 (C )。 A、一对一的联系 B、多对一的联系 C、一对多的联系 D、多对多的联系 2.不属于传统数据模型的是(D)。 A、层次数据模型 B、网状数据模型 C、关系数据模型 D、面向对象数据模型 3.声明了变量:declare @i int,@c char(4),现在为@i赋值10,为@c赋值'abcd',正确的语句是(C)。 A、set @i=10,@c='abcd' B、set i=10 , set @c='abcd' C、select @i=10,@c='abcd' D、select @i=10, select @c='abcd' 4.长期存储在计算机内的有组织、可共享的数据集合是(C)。 A、数据库管理系统 B、数据库系统 C、数据库 D、文件组织

生物信息学数据库或软件

一、搜索生物信息学数据库或者软件 数据库是生物信息学的主要内容,各种数据库几乎覆盖了生命科学的各个领域。 核酸序列数据库有GenBank,EMBL,DDB等,核酸序列是了解生物体结构、功能、发育和进化的出发点。国际上权威的核酸序列数据库有三个,分别是美国生物技术信息中心(NCBI)的GenBank ,欧洲分子生物学实验室的EMBL-Bank(简称EMBL),日本遗传研究所的DDBJ 蛋白质序列数据库有SWISS-PROT,PIR,OWL,NRL3D,TrEMBL等, 蛋白质片段数据库有PROSITE,BLOCKS,PRINTS等, 三维结构数据库有PDB,NDB,BioMagResBank,CCSD等, 与蛋白质结构有关的数据库还有SCOP,CATH,FSSP,3D-ALI,DSSP等, 与基因组有关的数据库还有ESTdb,OMIM,GDB,GSDB等, 文献数据库有Medline,Uncover等。 另外一些公司还开发了商业数据库,如MDL等。

生物信息学数据库覆盖面广,分布分散且格式不统一, 因此一些生物计算中心将多个数据库整合在一起提供综合服务,如EBI的SRS(Sequence Retrieval System)包含了核酸序列库、蛋白质序列库,三维结构库等30多个数据库及CLUSTALW、PROSITESEARCH等强有力的搜索工具,用户可以进行多个数据库的多种查询。 二、搜索生物信息学软件 生物信息学软件的主要功能有: 分析和处理实验数据和公共数据,加快研究进度,缩短科研时间; 提示、指导、替代实验操作,利用对实验数据的分析所得的结论设计下一阶段的实验;寻找、预测新基因及预测其结构、功能; 蛋白高级结构预测。 如:核酸序列分析软件BioEdit、DNAClub等;序列相似性搜索BLAST;多重系列比对软件Clustalx;系统进化树的构建软件Phylip、MEGA等;PCR 引物设计软件Primer premier6.0、oligo6.0等;蛋白质二级、三级结构预测及三维分子浏览工具等等。 NCBI的网址是:https://www.sodocs.net/doc/2213437327.html,。 Entrez的网址是:https://www.sodocs.net/doc/2213437327.html,/entrez/。 BankIt的网址是:https://www.sodocs.net/doc/2213437327.html,/BankIt。 Sequin的相关网址是:https://www.sodocs.net/doc/2213437327.html,/Sequin/。 数据库网址是:https://www.sodocs.net/doc/2213437327.html,/embl/。

数据库技术与应用-复习题答案

一、填空题 1.在关系模型中,实体及实体之间的联系都用二维表来表示。在数据库的物理组织中,它 以文件形式存储。 2.数据库中的选择、投影、连接等操作均可由数据库管理系统实现。 3.在关系数据库模型中,二维表的列称为字段,行称为记录。 4.在Access中,查询可作为窗体、报表和数据访问页的数据源。 5.子查询“包含于”对应的谓词是In。 6.参数查询中的参数要用[]中括号括起来,并且设置条件提示。 7.绑定文本框可以从表、查询或SQL语言中获取所需的内容。 8.在创建主/子窗体之前,必须设置主窗体和子窗体(主表和子表)之间的关系。 9.表A中的一条记录可以与表B中的多条记录匹配,但是表B中的一条记录至多只能与表 A中的一条记录匹配,这样的关系是“一对多”。 10.两个实体之间的联系有3种,分别是一对一、一对多和多对多。 11.在关系数据库中,唯一标识一条记录的一个或多个字段称为主键。 12.参照完整性是一个准则系统,Access使用这个系统用来确保相关表中记录之间的关系 有效性,并且不会因意外删除或更改相关数据。 13.在数据表中,记录是由一个或多个字段组成的。 14.在关系数据库的基本操作中,把由一个关系中相同属性值的元组连接到一起形成新的二 维表的操作称为连接。 15.关系规范化是指关系模型中的每一个关系模式都必须满足一定的要求。 16.数据表之间的联系常通过不同表的共同字段名来体现。 17.表是Access数据库的基础,是存储数据的地方,是查询、窗体、报表等其他数据库对 象的基础。 18.在Access中数据表结构的设计是在设计器中完成的。 19.在查询中,写在“条件”行同一行的条件之间是并的逻辑关系,写在“条件”行不同行 的条件之间是或的逻辑关系。 20.窗体的数据来源主要包括表和查询。 21.计算型控件一般来说用表达式/公式作为数据源。 22.主窗体和子窗体通常用多个表或查询的数据,这些表或查询中的数据具有一对一/一对 多的关系。 23.在报表中可以根据字段、表达式对记录进行排序或分组。 24.DBMS/数据库管理系统软件具有数据的安全性控制、数据的完整性控制、并发控制和故 障恢复功能。 25.数据库系统体系结构中三级模式是模式、外模式、内模式。 26.实体完整性是对关系中元组的唯一性约束,也就是对关系的主码的约束。 27.若想设计一个性能良好的数据库,就要尽量满足关系规范化原则。

数据库系统概论试题及答案整理版

数据库系统概论复习资料 第一章绪论 一、选择题 1.在数据管理技术的发展过程中,经历了人工管理阶段、文件系统阶段和数据库系统阶段。在这几个 阶段中,数据独立性最高的是 A 阶段。 A.数据库系B.文件系统C.人工管理D.数据项管理 2.数据库的概念模型独立于 A 。 A.具体的机器和DBMS B.E-R图C.信息世界D.现实世界 3.数据库的基本特点是 B 。 A.(1)数据结构化(2)数据独立性 (3)数据共享性高,冗余大,易移植 (4)统一管理和控制 B.(1)数据结构化(2)数据独立性 (3)数据共享性高,冗余小,易扩充 (4)统一管理和控制 C.(1)数据结构化(2)数据互换性 (3)数据共享性高,冗余小,易扩充 (4)统一管理和控制 D.(1)数据非结构化 (2)数据独立性 (3)数据共享性高,冗余小,易扩充 (4)统一管理和控制 4. B 是存储在计算机内有结构的数据的集合。 A.数据库系统B.数据库C.数据库管理系统D.数据结构 5.数据库中存储的是 C 。 A. 数据 B. 数据模型 C.数据及数据间的联系 D. 信息 6.数据库中,数据的物理独立性是指 C 。 A.数据库与数据库管理系统的相互独立 B.用户程序与DBMS的相互独立 C.用户的应用程序与存储在磁盘上数据库中的数据是相互独立的 D.应用程序与数据库中数据的逻辑结构相互独立 7.数据库的特点之一是数据的共享,严格地讲,这里的数据共享是指 D 。 A.同一个应用中的多个程序共享一个数据集合 B.多个用户、同一种语言共享数据 C.多个用户共享一个数据文件 D.多种应用、多种语言、多个用户相互覆盖地使用数据集合

《数据库原理与应用》复习题及参考答案

数据库原理与应用复习资料: 第一章:绪论 一、选择题: 1.在数据管理技术的发展过程中,经历了人工管理阶段、文件系统阶段和数据库系统阶段。在这几个阶段中,数据独立性最高的是阶段。 A.数据库系统 B.文件系统 C.人工管理 D.数据项管理 2.数据库的概念模型独立于。 A.具体的机器和DBMS B.E-R图 C.信息世界 D.现实世界 3.数据库的基本特点是。 A.(1)数据可以共享(或数据结构化) (2)数据独立性 (3)数据冗余大,易移植 (4)统一管理和控制 B.(1)数据可以共享(或数据结构化) (2)数据独立性 (3)数据冗余小,易扩充 (4)统一管理和控制 C.(1)数据可以共享(或数据结构化) (2)数据互换性 (3)数据冗余小,易扩充 (4)统一管理和控制D.(1)数据非结构化 (2)数据独立性 (3)数据冗余小,易扩充 (4)统一管理和控制 4. 是存储在计算机内有结构的数据的集合。 A.数据库系统 B.数据库 C.数据库管理系统 D.数据结构 5.数据库中存储的是。 A.数据 B.数据模型 C.数据以及数据之间的联系 D.信息 6. 数据库中,数据的物理独立性是指。 A.数据库与数据库管理系统的相互独立 B.用户程序与DBMS的相互独立 C.用户的应用程序与存储在磁盘上数据库中的数据是相互独立的 D.应用程序与数据库中数据的逻辑结构相互独立 7. .数据库的特点之一是数据的共享,严格地讲,这里的数据共享是指。 A.同一个应用中的多个程序共享一个数据集合 B.多个用户、同一种语言共享数据 C.多个用户共享一个数据文件 D.多种应用、多种语言、多个用户相互覆盖地使用数据集合 8.数据库系统的核心是。 A.数据库 B.数据库管理系统 C.数据模型 D.软件工具 9. 下述关于数据库系统的正确叙述是。 A.数据库系统减少了数据冗余 B.数据库系统避免了一切冗余 C.数据库系统中数据的一致性是指数据类型一致 D.数据库系统比文件系统能管理更多的数据 10. 数将数据库的结构划分成多个层次,是为了提高数据库的①和②。

数据库系统概论期末试题及答案

《数据库原理及应用》试题1 一、选择题 1、数据库系统的基本特征是。_________A、数据的统一控制 B、数据共享 性和统一控制 C、数据共享性、独立性和冗余度小 D、数据共享性和数据独立性 (难度系数C)正确答案:C 2、DB、DBMS和DBS三者之间的关系是。_________ A、DBS与DB和DBMS无关 B、 DBMS包括DBS和DB C、DB包括DBMS和DBS D、DBS包括DB和DBMS (难度系数B)正确答案:D R?(R?S) S,关系代数表示的是3、设有关系R和。_________A、R∩S B、R―S C、R÷S D、R∪S (难度系数B)正确答案:A 4、自然连接是构成新关系的有效方法。一般情况下,当对关系R和S使用 自然连接时,要求R和S含有一个或多个共有的__________。 A、行 B、属性 C、记录 D、元组 (难度系数C)正确答案:B 5、以下是信息世界的模型,且实际上是现实世界到机器世界的一个中间层次的是_________。 A、数据模型 B、概念模型 C、关系模型 D、E-R图 (难度系数C)正确答案:C 6、构成E—R模型的三个基本要素是。_________A、实体、属性值、关系; B、实体、 属性、联系; C、实体、实体集、联系; D、实体、实体集、属性; (难度系数C)正确答案:B 7、在关系代数运算中,五种基本运算为_________。 A、并、差、选择、投影、连接 B、并、交、选择、投影、笛卡尔积 C、并、差、选择、投影、笛卡尔积 D、并、除、投影、笛卡尔积、选择 (难度系数B)正确答案:C 8、在下列关于规范化理论的叙述中,不正确的是。_________、任何一个关系模式一定有键。 A. B、任何一个包含两个属性的关系模式一定满足3NF。 C、任何一个包含两个属性的关系模式一定满足BCNF。 D、任何一个包含三个属性的关系模式一定满足2NF。 (难度系数B)正确答案:D 9、设有关系模式R(A,B,C)和S(C,D)。与SQL语句“SELECT A,B,D FROM R,S WHERE =”等价的关系代数表达式为。_________π(σ(R?S))σ(π(R?S))、 B、

相关主题