搜档网
当前位置:搜档网 › DNA序列分析技术

DNA序列分析技术

DNA序列分析技术
DNA序列分析技术

DNA 序列分析技术

物种的遗传多样性在本质上是DNA 一级序列的多样性。近年来,随着DNA 测序技术的迅速发展和日益普及,DNA 测序在遗传多样性的研究中正在起着越来越大的作用。本章将介绍目前在遗传多样性研究中常用的一种手动和一种全自动双链DNA 测序方法。

1 DNA 模板的制备

在遗传多样性的研究中,由于样本量一般都较庞大,因而DNA 测序的速度就成了很关键的因素。因此,这类研究中常常直接测定纯化的PCR 双链产物而不大采用克隆技术。本节介绍本实验室常用的从PCR 产物制备测序模板的方法,即低熔点胶回收法。

(1)制备1.5%~2.0%的琼脂糖凝胶,待其充分凝固后,在离点样线5cm 左右处切下宽约1cm 的胶条,在切出的槽中倒入预先煮沸的低熔点琼脂糖胶。

(2)低熔点胶凝固后,将待纯化的PCR 反应液全部点样,恒压100V 左右进行电泳,直至扩增片段进入到低熔点胶中部。在360nm 紫外光下,将已进入低熔点胶的条带切下,放入1.5ml离心管中。

(3)离心,将胶块压缩到管底,然后补加TE 至500μl。于68℃水浴,将低熔点胶熔化,再迅速加入等体积的水饱和酚并混匀。

(4)室温下振荡抽提10 分钟,再12 000r/min 离心10 分钟。取上清液再用氯仿-异戊醇(24:1)抽提5 分钟。

(5)12 000r/min 离心10 分钟,取上清液,在其中加入1/10 体积的10 mol/

dm3NH4Ac和2 倍体积的无水乙醇,置—70℃下沉淀半小时以上。

(6)再12 000r/min 离心10 分钟,沉淀用70%的冷乙醇洗涤;再次短暂离心后小心地倒去乙醇液。沉淀干燥后,加入20~50μlTE 缓冲液或无菌去离子水中溶解,即为制好的DNA模板。

目前还有一些非常有效的商售试剂盒可用于纯化PCR 产物,如Oiagen PCR 产物纯化试剂盒等,但成本较高。

2 手动DNA 序列分析技术

2.1 测序胶的制备

按以下配方制备测序电泳胶:

6%胶工作液70ml

10%过硫酸胺(APS)70μl(新鲜配制)

TEMED 70μl

将上述溶液混合后,灌入准备好的胶板中,将“鲨鱼齿”梳子反插入胶,深约0.5~1.0cm。室温下聚合1 小时左右。

12.2.2 测序反应

测序试剂盒购自美国USB 公司,测序酶为Sequenase Version 2.0;α35S-dATP 购自美国

DuPont 公司(1mCui/100μl)。测序反应按USB 推荐的方法进行:

(1)DNA 模板混合液(0.5ml Eppendorf 管):

DNA 模板7μl

测序引物1μl

5 倍Reaction buffer 2μl

NP4O 1μl

(2)标记混合液(每一反应的量):

DTT(0.1mol/dm3)1μl

1/5dGT P labelling mix 2μl

Enzyme dilution buffer 1.75μl

NP4O 0.55μl

去离子水0.375μl

测序酶0.125μl

35S-dATP 0.5μl

(3)ddNTP(ddA、ddG、ddC、ddT)2.5μl

(4)退火反应(annealing):将DNA 模板混合液煮沸3 分钟,迅速放入乙醇和干冰的混合冰浴箱中退火30 秒左右(如无干冰,则用冷冻于-20℃~-70℃下的无水乙醇,临用前由冰箱中取出)。在进行标记反应之前,反应液需保存于干冰或碎冰中。

(5)标记反应(labelling):由干冰或冰中取出经退火的DNA 模板混合液,放在手中使其融化,然后加入5.5μl 的标记混合液。在微型离心机上离心10~15 秒后,置室温中1 分钟。(6)链终止反(termination):将上一步骤制成的混合液以每管3.3μl 分装入预先在37℃下温浴的加有ddNTP 的管中,并在37℃下反应4~5 分钟。

(7)每管加入4μl 终止液(stop solution)。

2.3 电泳

电极缓冲液1 倍TBE(pH 值8.0)

预电泳 30 分钟至1 小时

恒温方式测序胶板上夹盖铝恒温板

电泳温度50℃左右

电泳条件恒功率90~110W

电泳时间2.5 小时至5 小时

2.4 干胶制备和压片

电泳结束后取下胶板,用工具撬开玻璃板,使胶留在其中一块板上。将裁剪好的新华3 号滤纸在胶上贴紧,使胶粘在滤纸上,然后将胶放置于干胶器中制备干胶1~1.5 小时。制好的干胶放入压片盒中,放于暗室中,将X 光片压于胶上曝光2~3 天。

2.5 X 光片的冲洗

将曝光后的X 光片显影4~8 分钟(根据显影液的使用时间长短而定);定影5~10 分钟,冲洗后即可读取DNA 序列。

3 自动DNA 序列分析技术

本节描述运用Perkin-Elmer 公司的373 和377 型全自动DNA 测序仪进行双链DNA 测序的方法。热循环测序反应使用Applied Biosystems Inc.的DyeDeoy TM Terminator Cycle Sequencing Kit(#401434)或FS-DNA Sequencing Kit(#402079)进行。操作过程主要根据厂家推荐的方法进行。具体操作方法如下。

3.1 混合反应物

(1)取2.5μl 纯化好的PCR 产物[相对于2.5μl 测序试剂盒中的pGEM-3Zf(+)DNA],进行琼脂糖凝胶电泳。

(2)凝胶用溴化乙锭染色,用流水冲洗脱色后,在紫外光下进行照相记录。参照pGEM-3Zf (十)DNA 估测待测DNA 模板的浓度,以确定测序反应中应取的模板量。

(3)在一个标记的0.5ml Eppendorf 管中,混合以下反应物:

DNA 模板适量

引物(10pmol/ml)0.5μl

加水至5.25μl 或6.0μl(FSKit)

100℃下变性2 分钟,再冰浴2 分钟后短暂离心,然后加:

DyeDeoy TM Terminator Cycle Sequencing Kit 中测序液4.75μl

或FS-DNA Sequencing Kit 中测序液4.0μl

终体积10μl

(4)用微量取样器将反应物充分混合后,加20μl 石蜡油覆盖。

3.2 热循环反应

该反应中降温时间非常关键(约1℃/s)。因此,可使用Perkin-Elmer 序列的热循环仪(PCR 仪,如480,2400 或9600)。以下所描述的操作均基于Perkin-Elmer Model 480 热循环仪。将反应管放入热循环仪中,按以下程序进行热循环反应:

(1)96℃1 秒钟

96℃30 秒钟

(2)50℃1 秒钟

50℃1 分钟

(3)60℃l 秒钟

60℃4 分钟

共需25 个循环。

3.3 纯化测序产物

纯化测序产物最好的方法是使用Princeton Separations Inc 的Centri SeP 柱(#CS-901)。操作过程如下:

(1)轻弹柱,使Cephadex G-50 胶粉从柱底部扬起。

(2)移去柱上盖,加入800μl 去离子水,再盖上盖振荡,以除去气泡。

(3)在室温下放置30 分钟,以水化凝胶柱。

(4)移去柱上盖和下盖,将凝胶柱放入一个配置好的洗脱管中,让多余液体流出。

(5)倒去液体,将柱连同洗脱管一起在3 000r/min 下离心2 分钟。

(6)将柱放入一个1.5ml 离心管中,用微量取样器将测序反应物取出,注在凝胶柱中央。注意避免带入石蜡油。

(7)3 000r/min 下离心2 分钟。应注意柱的定向必须与第一次离心时一致。

(8)将样品放在真空干燥离心机中干燥。

(9)将干燥后的样品贮存于—70℃下待进行电泳。在此条件下保存1 年之久的样品其荧光也不会猝灭。

应注意的是,Centri-sep 柱体可反复使用多次。每次使用过后,要用自来水洗3 次,蒸馏水洗2 次,然后倒置于一试管架上晾干后,称取50mg Cephadex G-50(Sigma,#9048719)放入其中,即可再行使用。

3.4 电泳

使用ABI 公司的377 型全自动DNA 序列分析仪电泳,并记录序列数据。控制软件为PRIM377 Collection。电泳过程如下。

(1)聚丙烯酚胺凝胶浓度为4.25%,配制过程如下:

尿素18g

Amberlite 离子交换树脂(Sigma,MB-lA)约39g

40%Acry mide:Bis(19:1 )(AMRESCO,#0496-500)5.3ml

去离子水25ml

将混合液在电磁搅拌器上搅拌10 分钟。

(2)取5ml 10 倍TBE,通过2μm 滤膜抽滤后,再抽滤以上胶液。

10 倍TBE 配方:

Tris-base 108g

硼酸55g

Na2 EDTA(2H2O)7.44g

定容至1L

(3)将滤过液定容至50ml,加入35μl TEMED 和250μl 10%过硫酸胺(APS),轻摇混合后,用50ml 无针头注射器将胶注入已装配好的玻璃板中。

(4)1 小时后,将胶安装于全自动序列仪上预电泳30 分钟,恒压1kv,并使温度升至51℃。(5)预电泳的同时,取出36 份—70℃下贮存的样品,各加入5μl 载样液(50μl 试剂盒中配备的loading buffer+250μl 去离子甲酰胺,临用前配制)。

(6)将混合液在旋涡混合器上振荡,94℃下变性2 分钟,冰浴2 分钟后短暂离心。

(7)各取1.5μl 点样,恒压1.68kv 电泳7 小时。机器将自动分析和记录序列结果。常有电泳道识别错误的情况,此时应人为修复。

核酸和蛋白质序列分析

核酸和蛋白质序列分析 在获得一个基因序列后,需要对其进行生物信息学分析,从中尽量发掘信息,从而指导进一步的实验研究。通过染色体定位分析、内含子/外显子分析、ORF分析、表达谱分析等,能够阐明基因的基本信息。通过启动子预测、CpG 岛分析和转录因子分析等,识别调控区的顺式作用元件,可以为基因的调控研究提供基础。通过蛋白质基本性质分析,疏水性分析,跨膜区预测,信号肽预测,亚细胞定位预测,抗原性位点预测,可以对基因编码蛋白的性质作出初步判断和预测。尤其通过疏水性分析和跨膜区预测可以预测基因是否为膜蛋白,这对确定实验研究方向有重要的参考意义。此外,通过相似性搜索、功能位点分析、结构分析、查询基因表达谱聚簇数据库、基因敲除数据库、基因组上下游邻居等,尽量挖掘网络数据库中的信息,可以对基因功能作出推论。上述技术路线可为其它类似分子的生物信息学分析提供借鉴。本路线图及推荐网址已建立超级链接,放在北京大学人类疾病基因研究中心网站 (https://www.sodocs.net/doc/a15911984.html,/science/bioinfomatics.htm),可以直接点击进入检索网站。 下面介绍其中一些基本分析。值得注意的是,在对序列进行分析时,首先应当明确序列的性质,是mRNA序列还是基因组序列?是计算机拼接得到还是经过PCR扩增测序得到?是原核生物还是真核生物?这些决定了分析方法的选择和分析结果的解释。 (一)核酸序列分析 1、双序列比对(pairwise alignment) 双序列比对是指比较两条序列的相似性和寻找相似碱基及氨基酸的对应位置,它是用计算机进行序列分析的强大工具,分为全局比对和局部比对两类,各以Needleman-Wunsch算法和Smith-Waterman算法为代表。由于这些算法都是启发式(heuristic)的算法,因此并没有最优值。根据比对的需要,选用适当的比对工具,在比对时适当调整空格罚分(gap penalty)和空格延伸罚分(gap extension penalty),以获得更优的比对。 除了利用BLAST、FASTA等局部比对工具进行序列对数据库的搜索外,我们还推荐使用EMBOSS软件包中的Needle软件 (http://bioinfo.pbi.nrc.ca:8090/EMBOSS/),和Pairwise BLAST

基因序列分析word版

南开大学数学院“学而思”杯数学建模比赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国统一编号(由赛区组委会送交全国前编号): 全国评阅编号(由全国组委会评阅前进行编号):

A 题:基因序列分析 摘要 本文通过对比HIV病毒基因序列,找出不同阶段的DNA基因序列的异同,进而分析基因位点的相关性,从而对比找出HIV病毒基因序列中较为重要的位点,为HIV病毒研究提供更多的研究方法与思路。 针对问题一:我们利用点矩阵分析及统计各碱基含量的百分比的方法,对比两文件中具有相同序列名的基因序列及具有不同序列名的基因序列,找出两者的异同,得出结论。两者的相似性表现在:同名序列具有子序列关系,不同名序列具有相当的相似性,各种碱基的含量具有稳定性。两者的不同点表现在:基因规模有很大差异,不同名序列出现了具有突变特点的基因序列差异。 针对问题二:我们首先利用DNAwalk法对HIV病毒基因序列位点进行分析,在分析的过程中发现由于基因和基因组序列中存在着高度的不均一性,即不同位置的碱基密度存在着很大的差异,因而DNAwalk法不太适合基因序列的分析,转而使用DFA模型对HIV 基因的相关性进行分析和度量,得出了与DNAwalk模型相同的结论。 针对问题三:在前两问的分析基础上,结合前两问的分析结果及HIV病毒高度变异性的特点,我们得出重要的基因位点应满足下列条件:1、该基因位点位于Ⅱ基因序列,2、该基因位点所在序列的序列名应不同于Ⅰ中的序列名,3、该基因位点在问题二的分析中具有较高的相关性。 关键字:矩阵分析 DNAwalk DFA模型

问题重述 人类免疫缺陷病毒(Human Immunodeficiency Virus,HIV),简称艾滋病病毒,会造成人类免疫系统的缺陷, 导致艾滋病(AIDS). HIV基因组翻译成蛋白的过程相对复杂, 它会重复交叉使用某些基因片段。病毒序列在进化和传播的过程中主要是envelope 基因变化很快。详细描述可见HIV的生活史。由于现有的抗艾滋病病毒药对HIV无法根治,因此就将“责任”归咎高变异性. 目前, 很多的HIV序列已经被测定出来, 附件给出了一些HIV的序列. 我们试图通过对HIV序列的分析来断定这些序列上哪些位置比较重要, 从而给艾滋病的研究一些帮助. 例如, 某些位置上的突变可能会影响到HIV的传播机制, 如果我们瞄准这些位置设计药物, 可能会对艾滋病的传播起到抑制作用. HIV基因组序列大约长10k,HIV1_GENOME_DNA.fasta包含了1400余条基因组的序列,因为在序列突变的过程中,有一些核酸会消失,这些消失的核酸在文件中使用”-“来表示。表示此处发生了一次删除突变。也就是说, 文件中所有序列都是”对齐”的. 这样, 我们可以知道这些序列中某一个特定位点上核酸的分布情况. 另外,HIV基因组中包含了若干个编码蛋白质的基因,编码后的蛋白质可以行使病毒传播,致病等功能。HIV1_ENV_DNA.fasta是其中一个编码蛋白质基因的序列,HIV1_ENV_PRO.fasta是编码后的蛋白序列。它们同样是已经比对好的。基于以上说明,我们来分析如下问题: (1)对于HIV1_ENV和HIV_GENOME的DNA序列,构造数学方法对序列的位点进行分析, 指出这两者之间的异同。 (2)HIV序列位点之间或者某些位点之间是否存在相关性?如果存在,那么如何去度 量这种相关性? (3)对这些序列进行进一步的分析,找到你认为的HIV中较为重要的位点,并说明这 些位点为什么重要。 知识背景 本文通过对HIV病毒的基因信息进行分析,从而得出HIV病毒基因中比较重要的位点,由于本问题专业性较强,所以我们将先对其中相关知识做出阐述: 1、名词解释: 基因组:Genome,生物所携带的遗传信息的总和,即单倍体细胞中包括编码序列和非编码序列在内的全部DNA分子。 基因位点:基因在染色体上占有的特定位置。 染色体:由脱氧核糖核苷酸、蛋白质和少量核糖核酸组成的线状或棒状物,是生物主要遗传物质的载体。因是细胞中可被碱性染料着色的物质而得名。 核糖体:结合着辅助蛋白质因子的多个核糖体RNA(rRNA)亚基组成的细胞器。 碱基:指嘌呤和嘧啶的衍生物,是核酸、核苷、核苷酸的成分。 2、一般细胞遗传信息传递相关原理 DNA转录成RNA,RNA再被翻译成蛋白质执行相应的功能。DNA碱基的序列决定了蛋白质的结构,但DNA并非直接翻译成蛋白质,基因组DNA先通过转录生成信使RNA(mRNA),单链的mRNA随后将离开细胞核,指导蛋白质的合成。这一过程称为翻译,由核糖体负责完成。构成蛋白质的20种氨基酸通过转运RNA(tRNA)的作用到达核糖体,在核糖体的作用下,mRNA分子的核苷酸序列被翻译成相应的氨基酸,形成肽键。

基因序列分析的步骤和方法

基因序列分析的步骤和方法 拖鞋兰,大陆也有叫“鞋兰”的,指的是兰科植物中,它的下花瓣变形成奇特袋状花器一族的总称,中文名称的由来是源自于英文对这一族群的俗称”Lady Slipper Orchids”,当年订定这一花种中文名字的植物学者就将其直译为「拖鞋兰」,说真格的,这名称有点失之粗鄙,实在很难从字义上去意会这一群具观赏价值,又饶富趣味的兰属是甚么样子;做为商品的推广,近年来有不少有心人呼吁为其另立新词,吾人宁愿称其为「仙履兰」,即表达其传奇、趣味,又隐含高贵气质之意,同时也符合其中一属的学名。属于兰科,杓兰亚科,有四种遗产基因:凤仙花、Phragmipedium、Selenipedium和Mexipedium Google图片搜索:Google Image Search 为了访问在美国欧洲的基因数据库肯能要使用twisted,是python2.7的标准库。- 序列分析的步骤: 首先查看科学论文数据库例如,PubMed 从基因数据库例如GenBank中下载序列文件 https://www.sodocs.net/doc/a15911984.html,/DIST/docs/tutorial/examples/ls_orchid.fasta https://www.sodocs.net/doc/a15911984.html,/DIST/docs/tutorial/examples/ls_orchid.gbk 把序列信息转换成python可用的数据结构; 分析阶段:翻译、转录、权计算、k最近邻居、朴素贝叶斯算法等等 >>> from Bio import SeqIO >>> for seq_record in SeqIO.parse("ls_orchid.fasta", "fasta"): ... print seq_record.id ... print repr(seq_record.seq) ... print len(seq_record) ...... Found 94 records The last record Z78439.1 Seq('CATTGTTGAGATCACATAATAATTGATCGAGTTAATCTGGAGGATC

基因序列分析软件DNAStar简介

生物信息 基因序列分析软件DNAStar简介 郑伟文,林营志,刘波,曹宜,苏明星,朱育菁,蓝江林,车建美,郑斯平,陈坚 (福建省农科院生物技术中心) 1.设计公司 Sequence Analysis Software for Macintosh and Windows,GETTING STARTED,Introductory Tour of the LASERGENE System,MAY 2001,L A S E R G E N E f o r W i n d o w s & M a c i n t o s h,DNASTAR, Inc.,1228 South Park Street,Madison, Wisconsin 53715,(608) 258-7420,Copyright . 2001 by DNASTAR, Inc.,All rights reserved. Reproduction, adaptation, or translation without prior written permission is,prohibited,except as allowed under the copyright laws or with the permission of DNASTAR, Inc.,Sixth Edition, May 2001,Printed in Madison, Wisconsin, USA,Trademark Information。 2.应用程序 在安装Lasergene网络系统之前要熟悉以下术语:应用程序:指EditSeq, GeneMan, GeneQuest, MapDraw,MegAlign, PrimerSelect, Protean, and SeqMan II。应用程序服务器:是指存储应用程序的电脑,通常与dongle 服务,器是同一个服务器,但也可以不同,当在局部硬盘上安装网络程序,时,也可以在同一个网络系统中同时存在多个不同的应用程序服务,器,而且应用程序服务器不一定是苹果机,储存应用程序的机器也不一定必须能够运行该程序,仅仅是储存而已。 3.安装方式 3.1通过英特网升级 如果您以前已经安装了Lasergene 而且目前有升级和服务联系,您就可以通过英特网来升级您现有的版本,各种模块(module)都是以自解压形式存储的,你可以选择性的下载安装。 必备条件您的用户名和会员号是必需的,可以在安装盘上找到。 3.2程序升级 备份您已有的Lasergene,找到您要升级的执行程序,并把它转移到备份的文件夹中。连接到DNAstar 网站的主页(https://www.sodocs.net/doc/a15911984.html,),从菜单中的Customers中点击Lasergene Updates点,安提示输入密码和用户名(与会员名相同),这样就会打开下载页面。找到windows软件(Windows 95/98/NT Software.),就可以下载您想要的模块了。模块下载完毕以后,双击文件将其解压缩完毕。 看到“Application name”has been updated.说明升级完毕。 3.3软件安装 从CD在PC机(Windows)上安装Lasergene。注意安装是尽量关闭所有其它程序以保证安装顺利进行。必备条件,一张个人的Lasergene安装盘;一张Lasergene软件光碟;足够的硬盘空间和内存:至少30Mb的硬盘,32Mb的RAM。从光盘安装Lasergene,插入安装盘和安装光盘,双击安装图标,则出现下面的窗口,点击继续,则出现安装窗口。随后一次出现下面窗口,请按照提示做出选择然后点击Next,直至完成安装(图1)。

Gene 序列分析

Gene 序列分析 原文https://www.sodocs.net/doc/a15911984.html,/vionit/blog/item/98edb0dc706167a2cc116651.html 核酸和蛋白质序列分析 在获得一个基因序列后,需要对其进行生物信息学分析,从中尽量发掘信息,从而指导进一步的实验研究。通过染色体定位分析、内含子/外显子分析、ORF分析、表达谱分析等,能够阐明基因的基本信息。通过启动子预测、CpG岛分析和转录因子分析等,识别调控区的顺式作用元件,可以为基因的调控研究提供基础。通过蛋白质基本性质分析,疏水性分析,跨膜区预测,信号肽预测,亚细胞定位预测,抗原性位点预测,可以对基因编码蛋白的性质作出初步判断和预测。尤其通过疏水性分析和跨膜区预测可以预测基因是否为膜蛋白,这对确定实验研究方向有重要的参考意义。此外,通过相似性搜索、功能位点分析、结构分析、查询基因表达谱聚簇数据库、基因敲除数据库、基因组上下游邻居等,尽量挖掘网络数据库中的信息,可以对基因功能作出推论。上述技术路线可为其它类似分子的生物信息学分析提供借鉴。本路线图及推荐网址已建立超级链接,放在北京大学人类疾病基因研究中心网站(https://www.sodocs.net/doc/a15911984.html,/science/bioinfomatics.htm),可以直接点击进入检索网站。 下面介绍其中一些基本分析。值得注意的是,在对序列进行分析时,首先应当明确序列的性质是mRNA序列还是基因组序列?是计算机拼接得到还是经过PCR扩增测序得到?是原核生物还是真核生物?这些决定了分析方法的选择和分析结果的解释。 (一)核酸序列分析 1、双序列比对(pairwise alignment) 双序列比对是指比较两条序列的相似性和寻找相似碱基及氨基酸的对应位置,它是用计算机进行序列分析的强大工具,分为全局比对和局部比对两类,各以Needleman-Wunsch算法和Smith-Waterman算法为代表。由于这些算法都是启发式(heuristic)的算法,因此并没有最优值。根据比对的需要,选用适当的比对工具,在比对时适当调整空格罚分(gap penalty)和空格延伸罚分(gap extension penalty),以获得更优的比对。 除了利用BLAST、FASTA等局部比对工具进行序列对数据库的搜索外我们还推荐使用EMBOSS软件包中的Needle软件(http://bioinfo.pbi.nrc.ca:8090/EMBOSS/),和Pairwise BLAST (https://www.sodocs.net/doc/a15911984.html,/BLAST/)。以上介绍的这些双序列比对工具的使用都比较简单,一般输入所比较的序列即可。 (1)BLAST和FASTA FASTA(https://www.sodocs.net/doc/a15911984.html,/fasta33/)和BLAST(https://www.sodocs.net/doc/a15911984.html,/BLAST/)是目前运用较为广泛的相似性搜索工具。这两个工具都采用局部比对的方法,选择计分矩阵对序列计分,通过分值的大小和统计学显著性分析确定有意义的局部比对。使用FASTA和BLAST,进行数据库搜索,找到与查询序列有一定相似性的序列。一般认为,如果蛋白的序列一致性为25-30%,则可认为序列同源。 BLAST根据搜索序列和数据库的不同类型分为5种(表2),另外PSI-BLAST通过迭代搜索,可以搜索到与查询序列相似性较低的序列。其中BLASTN、BLASTP在实践中最为常用,TBLASTN 在搜索相似序列进行新基因预测时特别有用。 使用BLAST时,先选择需要使用的BLAST程序,然后提供相应的查询序列,选择所比对的数据库即可。 (2)Needle和Pairwise BLAST:其中Needle适用于蛋白质和DNA序列,而Pairwise BLAST仅适用于DNA序列(3)相似性和同源性:必须指出,相似性(similarity)和同源性( homology)是两个完全不同的概念。同源序列是指从某一共同祖先经过趋异进化而形成的不同序列。相似性是指序列比对过程中检测序列和目标序列之间相同碱基或氨基酸残基序列所占比例的

DNAMAN 是一种常用的核酸序列分析软件

DNAMAN 是一种常用的核酸序列分析软件。由于它功能强大,使用方便,已成为一种普遍使用的DNA 序列分析工具。本文以DNAMAN 5.2.9 Demo version 为例,简单介绍其使用方法。打开DNAMAN,可以看到如下界面: 第一栏为主菜单栏。除了帮助菜单外,有十个常用主菜单,第二栏为工具栏: 第三栏为浏览器栏: 在浏览器栏下方的工作区左侧,可见Channel 工具条,DNAMAN 提供20 个Channel,(如左所示:)点击Channel 工具条上相应的数字,即可击活相应的Channel。每个Channel 可以装入一个序列。将要分析的序列(DNA 序列或氨基酸序列)放入Channel 中可以节约存取序列时间,加快分析速度。此版本DNAMAN 提供自动载入功能,用户只需激活某个Channel,然后打开一个序列文件,则打开的序列自动载入被激活的Channel 中。 本文以具体使用DNAMAN 的过程为例来说明如何使用DNAMAN 分析序列。 1.将待分析序列装入Channel (1)通过File Open 命令打开待分析序列文件,则打开的序列自动装入默认Channel。(初始为channel1)可以通过激活不同的channel (例如:channel5)来改变序列装入的Channel。(2)通过Sequence/Load Sequence 菜单的子菜单打开文件或将选定的部分序列装入Channel 。通过Sequence/Current Sequence/Analysis Defination 命令打开一个对话框,通过此对话框可以设定序列的性质(DNA 或蛋白质),名称,要分析的片段等参数。 2.以不同形式显示序列 通过Sequence//Display Sequence 命令打开对话框,如下图所示:根据不同的需要,可以选择显示不同的序列转换形式。对话框选项说明如下:Sequence &Composition 显示序列和成分 Reverse Complement Sequence 显示待分析序列的反向互补序列 Reverse Sequence 显示待分析序列的反向序列 Complement Sequence 显示待分析序列的互补序列 Double Stranded Sequence 显示待分析序列的双链序列 RNA Sequence 显示待分析序列的对应RNA 序列 3.DNA 序列的限制性酶切位点分析 将待分析的序列装入Channel,点击要分析的Channel,然后通过Restriction/Analysis 命令打开对 话框,如下所示: 参数说明如下: Results 分析结果显示 其中包括: Show summary(显示概要) Show sites on sequence(在结果中显示酶切位点) Draw restriction map(显示限制性酶切图)Draw restriction pattern(显示限制性酶切模式图) Ignore enzymes with more than(忽略大于某设定值的酶切位点) Ignore enzymes with less than(忽略小于某设定值的酶切位点) Target DNA (目标DNA 特性) circular(环型DNA),dam/dcm methylation(dam/dcm 甲基化) all DNA in Sequence Channel(选择此项,在Sequence Channel 中的所有序列将被分析,如果 选择了Draw restriction pattern,那么当所有的channel 中共有两条DNA 时,则只能选择两个酶

DNA序列分析技术

DNA 序列分析技术 物种的遗传多样性在本质上是DNA 一级序列的多样性。近年来,随着DNA 测序技术的迅速发展和日益普及,DNA 测序在遗传多样性的研究中正在起着越来越大的作用。本章将介绍目前在遗传多样性研究中常用的一种手动和一种全自动双链DNA 测序方法。 1 DNA 模板的制备 在遗传多样性的研究中,由于样本量一般都较庞大,因而DNA 测序的速度就成了很关键的因素。因此,这类研究中常常直接测定纯化的PCR 双链产物而不大采用克隆技术。本节介绍本实验室常用的从PCR 产物制备测序模板的方法,即低熔点胶回收法。 (1)制备1.5%~2.0%的琼脂糖凝胶,待其充分凝固后,在离点样线5cm 左右处切下宽约1cm 的胶条,在切出的槽中倒入预先煮沸的低熔点琼脂糖胶。 (2)低熔点胶凝固后,将待纯化的PCR 反应液全部点样,恒压100V 左右进行电泳,直至扩增片段进入到低熔点胶中部。在360nm 紫外光下,将已进入低熔点胶的条带切下,放入1.5ml离心管中。 (3)离心,将胶块压缩到管底,然后补加TE 至500μl。于68℃水浴,将低熔点胶熔化,再迅速加入等体积的水饱和酚并混匀。 (4)室温下振荡抽提10 分钟,再12 000r/min 离心10 分钟。取上清液再用氯仿-异戊醇(24:1)抽提5 分钟。 (5)12 000r/min 离心10 分钟,取上清液,在其中加入1/10 体积的10 mol/ dm3NH4Ac和2 倍体积的无水乙醇,置—70℃下沉淀半小时以上。 (6)再12 000r/min 离心10 分钟,沉淀用70%的冷乙醇洗涤;再次短暂离心后小心地倒去乙醇液。沉淀干燥后,加入20~50μlTE 缓冲液或无菌去离子水中溶解,即为制好的DNA模板。 目前还有一些非常有效的商售试剂盒可用于纯化PCR 产物,如Oiagen PCR 产物纯化试剂盒等,但成本较高。 2 手动DNA 序列分析技术 2.1 测序胶的制备 按以下配方制备测序电泳胶: 6%胶工作液70ml

基因序列分析

基因序列分析 核酸和蛋白质序列分析 在获得一个基因序列后,需要对其进行生物信息学分析,从中尽量发掘信息,从而指导进一步的实验研究。通过染色体定位分析、内含子/外显子分析、ORF分析、表达谱分析等,能够阐明基因的基本信息。通过启动子预测、CpG岛分析和转录因子分析等,识别调控区的顺式作用元件,可以为基因的调控研究提供基础。通过蛋白质基本性质分析,疏水性分析,跨膜区预测,信号肽预测,亚细胞定位预测,抗原性位点预测,可以对基因编码蛋白的性质作出初步判断和预测。尤其通过疏水性分析和跨膜区预测可以预测基因是否为膜蛋白,这对确定实验研究方向有重要的参考意义。此外,通过相似性搜索、功能位点分析、结构分析、查询基因表达谱聚簇数据库、基因敲除数据库、基因组上下游邻居等,尽量挖掘网络数据库中的信息,可以对基因功能作出推论。上述技术路线可为其它类似分子的生物信息学分析提供借鉴。本路线图及推荐网址已建立超级链接,放在北京大学人类疾病基因研究中心网站(https://www.sodocs.net/doc/a15911984.html,/science/bioinfomatics.htm),可以直接点击进入检索网站。 下面介绍其中一些基本分析。值得注意的是,在对序列进行分析时,首先应当明确序列的性质,是mRNA序列还是基因组序列?是计算机拼接得到还是经过PCR扩增测序得到?是原核生物还是真核生物?这些决定了分析方法的选择和分析结果的解释。 (一)核酸序列分析 1、双序列比对(pairwise alignment)双序列比对是指比较两条序列的相似性和寻找相似碱基及氨基酸的对应位置,它是用计算机进行序列分析的强大工具,分为全局比对和局部比对两类,各以Needleman-Wunsch算法和Smith-Waterman算法为代表。由于这些算法都是启发式(heuristic)的算法,因此并没有最优值。根据比对的需要,选用适当的比对工具,在比对时适当调整空格罚分(gap penalty)和空格延伸罚分(gap extension penalty),以获得更优的比对。 除了利用BLAST、FASTA等局部比对工具进行序列对数据库的搜索外,我们还推荐使用EMBOSS软件包中的Needle软件(http://bioinfo.pbi.nrc.ca:8090/EMBOSS/),和Pairwise BLAST (https://www.sodocs.net/doc/a15911984.html,/BLAST/)。 以上介绍的这些双序列比对工具的使用都比较简单,一般输入所比较的序列即可。 (1)BLAST和FASTA FASTA(https://www.sodocs.net/doc/a15911984.html,/fasta33/)和BLAST(https://www.sodocs.net/doc/a15911984.html,/BLAST/)是目前运用较为广泛的相似性搜索工具。这两个工具都采用局部比对的方法,选择计分矩阵对序列计分,通过分值的大小和统计学显著性分析确定有意义的局部比对。使用FASTA 和BLAST,进行数据库搜索,找到与查询序列有一定相似性的序列。一般认为,如果蛋白的序列一致性为25-30%,则可认为序列同源。BLAST 根据搜索序列和数据库的不同类型分为5种(表2),另外PSI-BLAST通过迭代搜索,可以搜索到与查询序列相似性较低的序列。其中BLASTN、BLASTP在实践中最为常用,TBLASTN在搜索相似序列进行新基因预测时特别有用。使用BLAST时,先选择需要使用的BLAST程序,然后提供相应的查询序列,选择所比对的数据库即可。

核酸序列分析总结

核酸序列分析 1、核酸序列检索 可通过NCBI使用Entrez系统进行检索,也可用EBI的SRS服务器进行检索。在同时检索多条序列时,可通过罗逻辑关系式按照GenBank接受号进行批量检索。如用“AF113671 [ac] OR AF113672 [ac]”可同时检索这两条序列。其中“[ac]”是序列接受号的描述字段。 2、核酸序列的基本分析 (1)分子质量、碱基组成、碱基分布 分子质量、碱基组成、碱基分布可通过一些常用软件等直接获得。如: BioEdit(https://www.sodocs.net/doc/a15911984.html,/BioEdit/bioedit.html), DNAMAN(https://www.sodocs.net/doc/a15911984.html,)。 (2)序列变换 进行序列分析时,经常需要对DNA序列进行各种变换,例如反向序列、互补序列、互补反向序列、显示DNA双链、转换为RNA序列等。这些用DNAMAN软件可很容易实现,这些功能集中在Sequence→Display,从中可选择不同的序列变换方式对当前通道的序列进行转换。 (3)限制性酶切分析 该方面最好的资源是限制酶数据库(Restriction Enzyme Database,REBASE)。REBASE数据库(https://www.sodocs.net/doc/a15911984.html,,https://www.sodocs.net/doc/a15911984.html,/rebase)中含有限制酶的所有信息,包括甲基化酶、相应的微生物来源、识别序列位点、裂解位点、甲基化特异性、酶的商业来源及公开发表的和未发表的参考文献。其它资源还有: WebGene:https://www.sodocs.net/doc/a15911984.html,/~tjyin/WebGene/RE.html, https://www.sodocs.net/doc/a15911984.html,/personal/tyin.html WebCutter2:http://www/https://www.sodocs.net/doc/a15911984.html,/firstmarkert/firstmarket/cutter/cut2.html 同时,很多软件也能够识别REBASE限制酶数据库。强烈推荐使用集成化的软件如BioEdit和DNAMAN等。所得出的结果给出指定DNA序列的酶切位点信息,为克隆鉴定和亚克隆提供了重要信息。 在实际进行分子生物学实验中,有时需要对多条相关序列(如发生突变的一批序列)同时进行酶切分析,以便为后续的克隆鉴定提供参考。此时DNAMAN软件是一个良好的选择。在对所有序列进行多重对齐后,其输出项“Output”中即有“Restriction Analysis”选项,执行后即可完成对所有参与对齐序列的酶切分析,能够得到所有序列的差异酶切图谱和一致酶切图谱。 (4)克隆测序分析 得到测序结果后,需要对所测序列进行后续分析,其中主要包括对测序峰图的查看和载体序列的去除等过程。 a. 测序峰图的查看 最简单的程序是澳大利亚的Conor McCarthy(https://www.sodocs.net/doc/a15911984.html,.au./~conor/)开发的Chromas.exe 程序,但该程序不支持Windows 95以上的长文件名。其实,集成化的软件如BioEdit和DNAMAN也具有此功能。 b. 载体序列的去除 许多数据库中收集了常用的测序载体序列,如: vector-ig: ftp://https://www.sodocs.net/doc/a15911984.html,/repository/vector-ig ftp://https://www.sodocs.net/doc/a15911984.html,/repository/vector UniVec数据库: https://www.sodocs.net/doc/a15911984.html,/VecScreen/VecScreen.html https://www.sodocs.net/doc/a15911984.html,/blast/db/vector.Z VectorDB: https://www.sodocs.net/doc/a15911984.html,/vectordb/ 如果用户面对的是大批量序列的分析任务,则需要将这些载体数据库下载后进行分析。使用Blast程序

相关主题