搜档网
当前位置:搜档网 › 引物设计流程之基因编码区(CDS)扩增引物设计

引物设计流程之基因编码区(CDS)扩增引物设计

PCR引物设计流程

(以扩增鹅PHIP基因编码区序列为例)

一.流程图

二.确定模板

1.确定模板来源物种

近亲物种:原鸡,绿头野鸭,鸽,雀,鹦鹉,蜂鸟等

常用物种:灵长类(人,大猩猩,恒河猴),哺乳类(大鼠,小家鼠,猪,牛,羊,狗),爬行类(鳄,龟),两栖类(蛙,蟾蜍),鱼类(斑马鱼,亚马逊帆鱼)

一般在每一类常用物种中选择一个物种,在近亲物种中选择2种以上作为模板。如,扩增鹅PHIP基因选择以下物种序列为引物设计模板:鸡,鸭,人,小鼠,蟾蜍,斑马鱼。

2.利用NCBI得到各物种需扩增基因的模板序列

A.进入NCBI主页https://www.sodocs.net/doc/0f19490921.html,/,选定搜索范围为“Gene”,关键词为“PHIP”,得到

如下图搜索结果(也可在关键词中包含物种名,如“PHIP Anser”,物种的英文名和拉丁学名在搜索时都可使用)。

B.点击所需物种的PHIP基因,进入该基因的报告页面(以人PHIP基因为例)。基因报告页面中部Refseq

条目中显示该基因在NCBI中的参考序列,该条目下可得到mRNA序列。如下图。另,关于RefSeq条目的相关名词解释参考https://www.sodocs.net/doc/0f19490921.html,/refseq/about/。

C.需注意:对于同一基因的mRNA可能具有不同长度的剪切异构体,选择模板时不同物种应尽量选择同

一异构体(一般选择最长的异构体)。

D.如需得到该基因所在基因组的序列信息(如扩增启动子区域时),在基因报告页面上部Genomic regions,

transcripts,and products 条目下,点击Go to nucleotide选项下FASTA按钮可进入基因组(组装)序列页面。

E.在基因组(组装)序列页面中,默认仅显示跳转前基因的序列,在Change region show 条目中修改设置

为Whole sequence得到基因组序列,在Send选项下保存即可。

3.整理下载的模板序列

三.寻找保守区域

保守区域的意义:基因的保守区域是指不同来源的同一个基因在某些区域没有差别或者差别很小。在扩增基因序列时,选择在保守区域设计引物能够更有效的扩增未知的基因。因此,在引物设计前需先找出目的序列中的保守区域。在引物设计时,则首先应在保守区域内设计引物。

1.制作mega标准序列

A.用ClustalX软件打开整理好的TXT文件(菜单File →Load Sequences),然后在菜单Alignment选项下选

择Do Complement Alignment,此时将保存两种格式文件:.dnd和.aln(序列较长时耗时较长,需数分钟)。

B.将以上.aln文件用DAMBE软件打开(File→Open standard sequence file),注意选择恰当的序列类型。打

开后的文件可直接转存为.meg或.fas格式文件(File→Save or Convert Sequence Format)。

注1:此时在Sequence Info对话框应选择Binary选项,否则在转换格式时T碱基会被替换为U。

2.Mega分析同源性

A.用Mega软件打开以上保存的.meg或.fas格式文件,新建一个序列对齐分析窗口(Align→Edit/Build

Alignment→Retrieve sequences from a file)。

B.在新窗口中以默认设置将序列集进行序列对齐分析(Alignment→Align by muscle(Codons)),结果保存

为.fas文件(Data →Export Alignment)。

C.打开网址http://mobyle.pasteur.fr/cgi-bin/portal.py#forms::boxshade进入在线软件BOXShade,在选择文

件按钮下载入以上已对齐的模板.fas文件。

点击advanced options按钮展开选项,将默认设置进行如下图修改。其余选项保持默认即可,也可根据实际需要进行调整。设置完后点击Run提交任务。

注2:should sequence name be printed项的默认设置为YES,此时将把序列名同时打印。需再输出的富文本文件中将字体全部改为中文字体,才能保持序列的对齐。如需英文字体,此项可以改为no,序列名可以通过其他方式添加。

在软件输出结果的报告页面中保存.rtf格式的富文本文件,该文件可用Microsoft Word编辑。

3.保守区域的分析

如下图,consenus行表示序列间的一致性,*号表示在序列间完全一致的碱基,.号表示在序列间高度相似的碱基,空格表示在序列间;consenus行之上每一行分别代表一个物种的PHIP基因序列,蓝色背景的碱基为在物种间保守的碱基。首先观察consenus行,*号比例在50%以上且空格很少的区域可视作保守区域,具体分析中应灵活处理。以PHIP基因为例,保守区域可划分为:190-1240bp,1260-1980bp,2000-2290bp,2540-4920bp,5340-5740bp。

注3:出现连续的长的不保守区域(大于数百bp),因为引物设计产物的最佳长度上限在1000左右。此时可以只考虑近亲物种序列的保守性,降低保守区域的分析标准。

4.绘制引物设计示意图

注4:对于PHIP基因,我们顺利的得到了保守性区域分析结果。但是,对于某些进化较快的基因,保守性区域可能不足够用于设计引物。此时,可以逐渐减少用于分析的远缘物种,采用渐进性的分析,直到得到能够设计引物的保守性区域。

注5:为什么是mega ?保守性区域的分析用其他软件(如DNAMAN)也可进行。采用mega的原因在于其分析方法的可靠性更高,同时该软件在进化分析等中也非常常用,所以将mega可读序列的制作一并说明。四.用Primer5 软件设计引物

1.新建文件,导入模板

确定一条序列为设计引物的模板序列。本例中根据进化关系,选择鸭的PHIP基因序列为模板。在Primer5软件中新建一个窗口(File →New →DNA Sequnce),将模板序列粘贴(ctrl+v)在窗口内(一般选择as is 表示粘贴原序列,也可根据需要粘贴反向序列等)。

2.设置参数,搜索引物

在新序列窗口中点击按钮进入引物设计窗口,如下图。

在引物设计窗口中点击按钮进入引物搜索窗口,如下图。引物类型为PCR Primers ,搜索类型一般选择成对引物,在搜索范围内限制搜索上下游引物的序列区域(参考前面的保守区域进行设置),产物长度,引物长度设置详见后续介绍。搜索模式分为自动的Automatic和手动的Manual,在自动模式下引物搜索由严格标准往宽松标准执行,直至引物条数/对数达到设定值,其搜索参数设置如下图,搜索参数为

在搜索过程中排除不合格引物的筛选条目;在手动模式下,可设置搜索的严格程度,并可修改搜索参数条目下的限定数值。

在引物搜索窗口设置好后点击按钮开始搜索,搜索结果如下图。在搜索结果中可分别查看上下游引物或成对引物的情况。Rating值代表系统对引物的(产物)打分,分值越高说明引物越优秀,但并不是

绝对的评价标准。引物具体信息在点击引物所在行后在引物设计窗口显示,其中:按钮为选择显示上游或下游引物信息;Seq No表示引物第一个碱基在序列中的位置;Length表示引物/产物长度;Tm表示引物/产物的熔解温度;GC%表示引物/产物的GC含量;△G表示引物结合模板过程的自由能;Activity表示引物与结合的效率;Degeneracy表示引物的多义性;Ta Opt表示Primer5软件建议的成对引物扩增时的最佳退火温度。

Hairpin表示引物可能形成的二级结构;Dimer表示引物自身可能形成的二聚体;False Priming引物与模板的错频;Cross Dime引物间可能形成的二聚体表示。以上项目即为分析引物时的参考条目,引物设计的一些原则整理见后续。参照引物设计的原则即可根据Primer5中上述参数对引物对进行选择。

另,对于一些引物,可能出现大多数指标都较为优秀,但个别指标严重影响扩增反应的情况。这种引物可

使用按钮,手动的对其进行修改以提高其性能。

3.引物设计原则

1)引物长度:一般为15-30bp,常用的是18-27bp,但不能大于38,因为过长会导致其延伸温度大于75℃,

即Taq酶的最适温度。总的说来,每增加一个核苷酸引物特异性提高4倍,这样,大多数应用的最短引物长度为18个核苷酸。引物长度的上限并不很重要,主要与反应效率有关。由于熵的原因,引物越长,它退火结合到靶DNA上形成供DNA聚合酶结合的稳定双链模板的速率越小。

2)产物长度:扩增片段长度取决于酶的活性和保真性能。对于普通Taq聚合酶,PCR产物一般不超过2000bp,

而在100-1000bp范围效果较佳,超过1000bp的产物就可能出现产物量降低甚至无法扩增的情况。对于其他酶,应根据相关说明使用。

3)引物Tm值:引物的Tm值,指的是50%的引物分子和其互补序列表现为双链时的温度,PCR时的退火温

度一般都要比Tm值低5℃左右以确保有效退火。引物的Tm值一般控制在55-65度, 一般需保证上下游引物的Tm值差不超过4-6度。如果引物中的G+C含量相对偏低,则可以使引物长度稍长,而保证一定的退火温度。许多软件可以对Tm进行计算,其计算原理各有不同,因此有时计算出的数值可能会有少量差距。

4)GC%:有效引物中(G+C)的比例为40-60%,GC含量太低导致引物Tm值较低,使用较低的退火温度不利

于提高PCR的特异性,GC含量太高也易于引发非特异扩增。上下游引物的GC含量不能相差太大。GC%对扩增的影响主要通过Tm值来体现,当Tm值符合要求时,对于GC%不必做严格要求。另,引物序列中同一碱基连续出现不应超过5个。

5)引物3’端:引物3’端是延伸开始的地方,最好不存在错配。同时3’端不应超过3个连续的G或C,

因这样会使引物在G+C富集序列区错误引发。同时,3’端有形成二级结构/二聚体的可能对于PCR扩增的影响将大于5’端。在扩增编码区域时,引物3′端最好不要终止于密码子的第3位,因密码子的第3位易发生简并,会影响扩增特异性与效率。

6)△G值:引物5′端和中间△G值应该相对较高,而3′端△G值较低。△G值是指DNA双链形成所需的

自由能,它反映了双链结构内部碱基对的相对稳定性,△G值越大,则双链越稳定。应当选用5′端和中间△G值相对较高,而3′端△G值较低的引物,即3’端尽可能选用A或T,少用G或C。引物3′端的△G值过高,容易在错配位点形成双链结构并引发DNA聚合反应(寡核苷酸3′末端最后5个核苷酸的稳定性小于-9 kcal/mol,通常就是专一性的探针或引物)。

7)引物的二级结构/二聚体:引物自身不应存在互补序列,否则引物自身会折叠成发夹状结构,这种二级结

构会因空间位阻而影响引物与模板的复性结合。另外,尽可能避免两个引物分子之间3’端有有较多碱基互补,否则两个引物分子可能通过互补碱基而结合形成引物二聚体。一般情况下,引物形成的发夹结构和二聚体中不应多于4个连续碱基的同源性或互补性(实际常用自由能△G判断,△G为负值时,其绝对值越大不利影响越大,一般以小于绝对值4.5为标准(应远小于引物与模板结合的△G),为正值时则几乎无影响)(Oligo分析时的一般标准则为引物效率小于100或小于目的产物效率的三分之一)。个人观点认为,引物的二级(发夹)结构对于目的片段扩增的不利影响要大于引物二聚体(因为引物位置的二级结构在模板序列中是同样存在的。模板序列形成二级结构,在PCR过程中如果无法完全解链则将直接导致引物与模板结合的失败)。

8)引物5’端:可以有与模板DNA不配对碱基。其应用有:5’端加上限制性核酸内切酶位点序列(酶切位

点5’端加上适当数量的保护碱基),5’端的某一位点修改某个碱基,人为地在产物中引入该位点的点突变以作研究,5’端标记放射性元素或非放射性物质(如生物素、地高辛等)等。因此,在无法避免的情况下,引物5’端的出现的错配在一定程度上可以接受(也用自由能△G判断,标准与“引物的二级结构/二聚体”条目相同)。

4.保存引物

通过File →Print可以保存引物的报告文件.pdf(需安装虚拟打印机)。

注6:以上是Primer 5使用的基本流程。更详细的说明参照本文相关文件夹内“Primer Premier 5.0中文使用说明书”文件。

注7:部分资料中对于引物形成二级结构的预测提到了用单独的软件进行检测(如RNA Structure)。该软件可在其官网网址免费注册后下载https://www.sodocs.net/doc/0f19490921.html,/register.html,也可在线使用http://rna.urmc.roche https://www.sodocs.net/doc/0f19490921.html,/RNAstructureWeb/。其使用说明可参照官方网站,也可参照本文相关文件夹内“RNA Structure 3.2 中文使用说明书”文件。

注8:在引物设计软件中,Oligo软件也是一款很常用的软件。其软件的使用技巧,详见本文相关文件夹内“使用Oligo 6和Primer Premier 5.0等软件设计PCR引物”文件。一般情况下,单独使用一个软件已足够;本文建议使用Primer搜索和筛选引物后,备选引物在Oligo中逐一分析。

注9:引物设计是一项复杂的工作,限于篇幅和时间等原因,本部分的介绍还很粗略。在本文相关文件夹内“引物设计相关论文”文件夹中有一些关于引物设计的论文(大多选取来源于CSCD等数据库的优秀期刊),是对本文内容的补充。同时,大家也可以自行下载和搜集更多的论文和资料,希望有精力的同学可以继续完善和提升本文。

五.用NCBI Blastn程序比对引物

目的:检测设计的引物是否在其他非目的基因(模板)上存在非特异性的结合。

1.Blastn的使用

由网址https://www.sodocs.net/doc/0f19490921.html,/Blast.cgi?PROGRAM=blastn&PAGE_TYPE=BlastSearch&LINK_LOC=bla sthome进入Blastn在线程序。在Enter Query Sequence条目下输入或粘贴备选的引物序列。

在Choose Search Set条目下Database中选择搜索的数据库,一般选择Nucleotide collection数据库。其余设置为默认值。

注10:选择Nucleotide collection数据库原因在于其包括的序列完整,既包括预测序列也包括实验获得序列。

同时,该数据库并未区分dna序列和mRNA序列。因此,在分析比对结果时应根据引物设计目的进行分析(扩增dna序列时,引物与mRNA的非特异性结合对扩增并无影响;反之亦然)。

Program Selection条目下可选择比对的严格程度,建议选择最低的严格程度(Somewhat similar sequences),因为在结果页面将按序列的相似性由高到低排列比对结果,如果选择高的比对标准可能导致漏掉对PCR扩增有较大影响的比对结果。

其余设置一般保持默认,在页面下部点击按钮即开始比对。

2.结果分析

Blastn的结果输入页面主要包括三个部分。第一部分是图形式的汇总,用于初步了解给定序列与数据库序列的匹配情况。

第二部分是列表式的描述。覆盖率即是给定序列与数据库序列形成的匹配占给定序列长度的比例。

第三部分是逐个显示详细的匹配情况。匹配率即匹配序列中匹配碱基的比例。匹配数量是指两段匹配序列能可能的匹配方式,给定序列可能与数据库序列的不同区段发生匹配,因此该数量可能大于1。Blastn进行序列比对时将自动考虑序列的方向,并同时考虑序列和互补序列,因此查看结果时可能需要查看“Strand”

项,并查看“序列匹配情况”中的碱基数标号以确定两端序列匹配的方式(匹配,反向匹配,互补匹配,反向互补匹配)。

3.将上下游引物均进行以上分析,保存错配模板信息,将上下游引物与目的物种或近亲物种中同一非目的模

板存在匹配的引物对剔除,处理后如剩余引物对较多,在只存在单向引物错配的序列中灵活处理和剔除(该尺度可比设计引物时考虑“错配”时的标准适当放宽)。

注11:以上是Blastn的简单使用说明,详细介绍参考ftp://https://www.sodocs.net/doc/0f19490921.html,/pub/factsheets/HowTo_NewBL AST.pdf。

六.备选引物的保守性检查

已设计好的备选引物应该再次对照基因的保守区域分析结果,根据其具体的保守性情况,在不影响扩增性能的情况下,选择保守性较好的引物。

七.完整编码区的引物设计

完成一段模板的引物设计后即可以进行下一段引物的设计,直至完成全部序列的引物设计。在设计下一段引物时应注意与上一段引物扩增区域保留一段重叠序列(至少需要数十bp,条件允许时最好在100-200bp。尤其在每段引物扩增模板序列长度较长时,因为测序时的末端序列常易出现可靠性降低的情况),以便于完整序列的拼接。以PHIP基因为例,其编码区5端前200bp序列保守性较差。对于编码区两端序列保守性较差的情况,可根据该物种的基因组序列,参考其他物种的基因组序列或具有完整mRNA序列的物种,寻找基因两端UTR (非翻译区)中保守区域设计跨域起始/终止密码子的引物。如果由于模板质量原因,或是无法设计设计跨域

起始/终止密码子的引物时,也可先设计引物扩增基因的dna序列,确认起始/终止密码子附件的序列后,再设计引物扩增mRNA序列。(对于序列两端保守的基因则可以直接将第一个和最后一个引物设计在起始/终止密码子上)。建议在完成完整编码区的引物设计后再绘制一个具体的引物设计示意图(其他区域的扩增也是一样)。

注12:在引物设计出现困难时,也可考虑进行简并引物的设计。简并引物设计的说明详见本文相关文件夹内“简并引物设计”文件内,其相关论文见“简并引物相关论文”文件夹内。简并引物设计的具体方法暂未见详细的介绍,有精力和兴趣的同学可以进行搜集和整理。

引物设计步骤与要点

引物设计step by step 1、在NCBI上搜索到目的基因,找到该基因的mRNA,在CDS选项中,找到编码区所在位置,在下面的origin中,Copy该编码序列作为软件查询序列的候选对象。 2、用Primer Premier5搜索引物 ①打开Primer Premier5,点击File-New-DNA sequence, 出现输入序列窗口,Copy目的序列在输入框内(选择As),此窗口内,序列也可以直接翻译成蛋白。点击Primer,进入引物窗口。 ②此窗口可以链接到“引物搜索”、“引物编辑”以及“搜索结果”选项,点击Search按钮,进入引物搜索框,选择“PCR primers”,“Pairs”,设定搜索区域和引物长度和产物长度。在Search Parameters里面,可以设定相应参数。一般若无特殊需要,参数选择默认即可,但产物长度可以适当变化,因为100~200bp的产物电泳跑得较散,所以可以选择300~500bp. ③点击OK,软件即开始自动搜索引物,搜索完成后,会自动跳出结果窗口,搜索结果默认按照评分(Rating)排序,点击其中任一个搜索结果,可以在“引物窗口”中,显示出该引物的综合情况,包括上游引物和下游引物的序列和位置,引物的各种信息等。 ④对于引物的序列,可以简单查看一下,避免出现下列情况:3’不要出现连续的3个碱基相连的情况,比如GGG或CCC,否则容易引起错配。此窗口中需要着重查看的包括:Tm 应该在55~70度之间,GC%应该在45%~55%间,上游引物和下游引物的Tm值最好不要相差太多,大概在2度以下较好。该窗口的最下面列出了两条引物的二级结构信息,包括,发卡,二聚体,引物间交叉二聚体和错误引发位置。若按钮显示为红色,表示存在该二级结构,点击该红色按钮,即可看到相应二级结构位置图示。最理想的引物,应该都不存在这些二级结构,即这几个按钮都显示为“None”为好。但有时很难找到各个条件都满足的引物,所以要求可以适当放宽,比如引物存在错配的话,可以就具体情况考察该错配的效率如何,是否会明显影响产物。对于引物具体详细的评价需要借助于Oligo来完成,Oligo自身虽然带有引物搜索功能,但其搜索出的引物质量感觉不如Primer5. ⑤在Primer5窗口中,若觉得某一对引物合适,可以在搜索结果窗口中,点击该引物,然后在菜单栏,选择File-Print-Current pair,使用PDF虚拟打印机,即可转换为Pdf文档,里面有该引物的详细信息。 3、用Oligo验证评估引物 ①在Oligo软件界面,File菜单下,选择Open,定位到目的cDNA序列(在primer中,该序列已经被保存为Seq文件),会跳出来两个窗口,分别为Internal Stability(Delta G)窗口和Tm窗口。在Tm窗口中,点击最左下角的按钮,会出来引物定位对话框,输入候选的上游引物序列位置(Primer5已经给出)即可,而引物长度可以通过点击Change-Current oligo length来改变。定位后,点击Tm窗口的Upper按钮,确定上游引物,同样方法定位下游引物位置,点击Lower按钮,确定下游引物。引物确定后,即可以充分利用Analyze 菜单中各种强大的引物分析功能了。

引物设计步骤

1、在NCBI上搜索到目的基因,找到该基因的mRNA,在CDS选项中,找到编码区所在位置,在下面的origin中,Copy该编码序列作为软件查询序列的候选对象。 2、用Primer Premier5搜索引物 ①打开Primer Premier5,点击File-New-DNA sequence, 出现输入序列窗口,Copy目的序列在输入框内(选择As),此窗口内,序列也可以直接翻译成蛋白。点击Primer,进入引物窗口。 ②此窗口可以链接到“引物搜索”、“引物编辑”以及“搜索结果”选项,点击Search按钮,进入引物搜索框,选择“PCR primers”,“Pairs”,设定搜索区域和引物长度和产物长度。在Search Parameters里面,可以设定相应参数。一般若无特殊需要,参数选择默认即可,但产物长度可以适当变化,因为100~200bp的产物电泳跑得较散,所以可以选择300~500bp. ③点击OK,软件即开始自动搜索引物,搜索完成后,会自动跳出结果窗口,搜索结果默认按照评分(Rating)排序,点击其中任一个搜索结果,可以在“引物窗口”中,显示出该引物的综合情况,包括上游引物和下游引物的序列和位置,引物的各种信息等。 ④对于引物的序列,可以简单查看一下,避免出现下列情况:3’不要出现连续的3个碱基相连的情况,比如GGG或 CCC,否则容易引起错配。此窗口中需要着重查看的包括:Tm应该在55~70度之间,GC%应该在45%~55%间,上游引物和下游引物的Tm值最好不要相差太多,大概在2度以下较好。该窗口的最下面列出了两条引物的二级结构信息,包括,发卡,二聚体,引物间交叉二聚体和错误引发位置。若按钮显示为红色,表示存在该二级结构,点击该红色按钮,即可看到相应二级结构位置图示。最理想的引物,应该都不存在这些二级结构,即这几个按钮都显示为“None”为好。但有时很难找到各个条件都满足的引物,所以要

引物设计流程之基因编码区(CDS)扩增引物设计

PCR引物设计流程 (以扩增鹅PHIP基因编码区序列为例) 一.流程图 二.确定模板 1.确定模板来源物种 近亲物种:原鸡,绿头野鸭,鸽,雀,鹦鹉,蜂鸟等 常用物种:灵长类(人,大猩猩,恒河猴),哺乳类(大鼠,小家鼠,猪,牛,羊,狗),爬行类(鳄,龟),两栖类(蛙,蟾蜍),鱼类(斑马鱼,亚马逊帆鱼) 一般在每一类常用物种中选择一个物种,在近亲物种中选择2种以上作为模板。如,扩增鹅PHIP基因选择以下物种序列为引物设计模板:鸡,鸭,人,小鼠,蟾蜍,斑马鱼。 2.利用NCBI得到各物种需扩增基因的模板序列 A.进入NCBI主页https://www.sodocs.net/doc/0f19490921.html,/,选定搜索范围为“Gene”,关键词为“PHIP”,得 到如下图搜索结果(也可在关键词中包含物种名,如“PHIP Anser”,物种的英文名和拉丁学名在搜索时都可使用)。

B.点击所需物种的PHIP基因,进入该基因的报告页面(以人PHIP基因为例)。基因报告页面中部Refseq 条目中显示该基因在NCBI中的参考序列,该条目下可得到mRNA序列。如下图。另,关于RefSeq条目的相关名词解释参考https://www.sodocs.net/doc/0f19490921.html,/refseq/about/。 C.需注意:对于同一基因的mRNA可能具有不同长度的剪切异构体,选择模板时不同物种应尽量选择同一 异构体(一般选择最长的异构体)。 D.如需得到该基因所在基因组的序列信息(如扩增启动子区域时),在基因报告页面上部Genomic regions, transcripts,and products 条目下,点击Go to nucleotide选项下FASTA按钮可进入基因组(组装)序列页面。 E.在基因组(组装)序列页面中,默认仅显示跳转前基因的序列,在Change region show 条目中修改设 置为Whole sequence得到基因组序列,在Send选项下保存即可。 3.整理下载的模板序列

引物设计与检测全过程

primer5和Oligo结合设计引物步骤及心得 一、引物设计step by step 1、在NCBI上搜索到目的基因,找到该基因的mRNA,在CDS选项中,找到编码区所在位置,在下面的origin中,Copy该编码序列作为软件查询序列的候选对象。 2、用Primer Premier5搜索引物 ①打开Primer Premier5,点击File-New-DNA sequence, 出现输入序列窗口,Copy目的序列在输入框内(选择As),此窗口内,序列也可以直接翻译成蛋白。点击Primer,进入引物窗口。 ②此窗口可以链接到“引物搜索”、“引物编辑”以及“搜索结果”选项,点击Search按钮,进入引物搜索框,选择“PCR primers”,“Pairs”,设定搜索区域和引物长度和产物长度。在Search Parameters里面,可以设定相应参数。一般若无特殊需要,参数选择默认即可,但产物长度可以适当变化,因为100~200bp的产物电泳跑得较散,所以可以选择 300~500bp. ③点击OK,软件即开始自动搜索引物,搜索完成后,会自动跳出结果窗口,搜索结果默认按照评分(Rating)排序,点击其中任一个搜索结果,可以在“引物窗口”中,显示出该引物的综合情况,包括上游引物和下游引物的序列和位置,引物的各种信息等。 ④对于引物的序列,可以简单查看一下,避免出现下列情况:3’不要出现连续的3个碱基相连的情况,比如GGG或 CCC,否则容易引起错配。此窗口中需要着应该在55~70度之间,GC%应该在45%~55%间,上游引物重查看的包括:T m 和下游引物的T 值最好不要相差太多,大概在2度以下较好。该窗口的最下面 m 列出了两条引物的二级结构信息,包括,发卡,二聚体,引物间交叉二聚体和错误引发位置。若按钮显示为红色,表示存在该二级结构,点击该红色按钮,即可看到相应二级结构位置图示。最理想的引物,应该都不存在这些二级结构,即这几个按钮都显示为“None”为好。但有时很难找到各个条件都满足的引物,所以要求可以适当放宽,比如引物存在错配的话,可以就具体情况考察该错配的效率如何,是否会明显影响产物。对于引物具体详细的评价需要借助于Oligo来完成,Oligo自身虽然带有引物搜索功能,但其搜索出的引物质量感觉不如Primer5. ⑤在Primer5窗口中,若觉得某一对引物合适,可以在搜索结果窗口中,点击该引物,然后在菜单栏,选择File-Print-Current pair,使用PDF虚拟打印机,即可转换为Pdf文档,里面有该引物的详细信息。

全基因扩增的引物设计步骤

全基因扩增的引物设计步骤 全基因扩增是一种常用的基因组测序方法,它可以同时扩增整个基因组或某些特定区域的DNA序列。在进行全基因扩增前,需要设计适合的引物。下面将详细介绍全基因扩增的引物设计步骤。 一、确定目标基因组或区域 首先需要确定要扩增的目标基因组或区域。这可以通过文献资料、数据库查询、实验经验等方式获得。在确定目标基因组或区域时,需要考虑以下几个方面: 1. 目标基因组或区域的大小:全基因扩增需要设计一对引物,其长度通常为20-30个碱基对,能够覆盖目标序列的全部或大部分区域。 2. 目标序列的GC含量:GC含量高于50%或低于30%时,引物设计会更具挑战性。 3. 目标序列中是否存在重复序列:重复序列会使得引物无法特异性地结合到目标DNA上,从而导致非特异性扩增。 二、获取参考序列

获取参考序列是进行引物设计的关键步骤之一。常用的参考序列包括已知基因组测序数据、转录本数据和EST(表达顺反转录本)序列。在获取参考序列时,需要注意以下几个方面: 1. 确定参考序列的来源:不同来源的参考序列可能存在差异,需要根据实际情况选择合适的来源。 2. 确定参考序列的版本:同一基因组或转录本可能存在多个版本,需要选择最新、最全面、最准确的版本作为参考序列。 3. 确定参考序列的长度:通常选择包含目标区域或基因组全部或大部分区域的参考序列。 三、引物设计 引物设计是全基因扩增中最重要和最复杂的步骤之一。引物设计需要满足以下几个要求: 1. 引物长度:引物长度通常为20-30个碱基对,太短会导致特异性不足,太长则会影响扩增效率。 2. 引物特异性:引物应该特异性地结合到目标DNA上,避免非特异

引物设计流程

2010级动科2班杨教童222010328210151 1.引物设计的原理和步骤 PCR引物设计的目的是为了找到一对合适的寡核苷酸片段,其中在扩增的DNA片断5'端的引物对应于有意链DNA序列,3'端的引物对应于无意链DNA序列,使其能有效地扩增模板DNA序列。因此,引物的优劣直接关系到PCR的特异性与成功与否。要设计引物首先要找到DNA序列的保守区。同时应预测将要扩增的片段单链是否形成二级结构。如这个区域单链能形成二级结构,就要避开它。如这一段不能形成二级结构,那就可以在这一区域设计引物。现在可以在这一保守区域里设计一对引物。一般引物长度为15~30碱基,扩增片段长度为100~600碱基对。 1.引物设计的原则 (1)碱基组成: GC含量应在40%-60%(45%-55% )之间,4中碱基在引物中分配均匀。没有多聚嘌呤或多聚嘧啶序列,如AAAAA等,没有二核苷酸重复序列,如GCGCGC等; (2)引物长度: 引物中与模板互补的区应为18-25个核苷酸长度,上下引物长度差别不能大于3bp,如上游引物为19bp,下游引物为24bp等。 (3)重复或自身互补序列:

形成发夹结构,会阻止引物和模板之间的复性。 (4)上下引物的互补性: 一个引物的3'末端序列不允许结合到另一个引物的任何位点上,因为PCR中引物浓度较高,会形成引物二聚体。 当一个PCR有多对引物时,注意检查任何一个3'末端都不能和其他任何引物互补。 (5)解链温度(Tm 值): 计算出来的两个引物的Tm 值相差不能大于5 ℃,扩增产物的Tm 值与引物的Tm 值相差不能大于10 ℃;引物的Tm 值一般为50-70℃。 这些特性保证了扩增产物在每一个PCR 循环可有效变性。 (6)3’末端 3’末端的性质非常关键。如果可能的话,每个引物的3’末端碱基为G或C;最好不要A,或AA等多聚A; (7)5’端序列添加限制性酶切位点: 2.用Primer Premier 5.0 软件设计两对引物 (1)在网页上找到要制作引物的一段序列,最好在1000左右,比如:ORIGIN 1 atgaatccaa atcaaaagat aataacaatt ggttctgttt ctctcatcat tgccacaata 61 tgtttcctta tgcaaattgc tatcctagta actactgtaa cattacattt caagcagcat

引物设计原则(最全汇总)

引物设计原则(汇总) 普通引物设计(适用于从载体上扩增模板): 1. 普通引物长度一般在20-30bp之间,常用24-28bp左右以保证基因特异性; 2. 下载基因序列到Vector NTI; 3. 找到所需安装载体序列; 4. 将基因序列的CDS高亮标记; 5. 寻找载体序列中常用酶切位点,一般为EcoRI、BamHI、HindIII、XhoI等等,比对检测基因序列中是否有这些位点,有的话舍弃,最后选择两个酶切位点,最好离得远一点,并且最好buffer用一样的。酶切位点一般是6bp的回文序列; 6. 从基因ATG开始往后选择10-20bp均可(我的习惯是27bp-6bp酶切位点-2bp保护碱基-xbp 补齐序列),但最好保证最后两个是G或者C,以减少错配率; 7. 将上游酶切位点序列补在ATG前方,并根据载体对框情况补足两者之间的空缺,再根据序列的GC含量和TM值在酶切位点前补足保护碱基,以保证GC和AT的含量不能过高。注意,所有的补齐不能用到终止密码子; 8. 检测上游序列的结构情况,理论上不要太多二级结构以及3’端匹配即可;不过重复的序列也不能太多,以免移码; 9. 从下游终止密码子开始向前选择10-20bp均可,但最好保证最后两个是G或者C,以减少错配率; 10. 选择complementary sequence,在N端补齐下游酶切位点,如果tag在C端(即下游),则在第9点中应该从终止密码子前开始选择(即舍弃终止密码子),并且下游引物也要对框,如果tag在N端,则下游引物不需要对框,只要在N端加上下游酶切位点,再根据情况加上2个保护碱基,然后检测二级结构,原则上3’端部匹配即可。不过重复的序列也不能太多,以免移码; 11. 将设计好的上下游引物放在一起检测二级结构,原则上3’端部匹配即可。不过重复的序列也不能太多,以免移码; 12. 最后在NCBI的primer Blast网站上比对引物序列,看是否基因特异性的。 2011年10月18日左洁 1. 引物的长度一般为15-30 bp,常用的是18-27 bp,但不应大于38,因为过长会导致其延伸温度大于74℃,不适于Taq DNA聚合酶进行反应。 2. 引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导致错配。引物3’端出现3个以上的连续碱基,如GGG或CCC,也会使错误引发机率增加。 3. 引物3’端的末位碱基对Taq酶的DNA合成效率有较大的影响。不同的末位碱基在错配位置导致不同的扩增效率,末位碱基为A的错配效率明显高于其他3个碱基,因此应当避免在引物的3’端使用碱基A。另外,引物二聚体或发夹结构也可能导致PCR反应失败。5’端序列对PCR影响不太大,因此常用来引进修饰位点或标记物。 4. 引物序列的GC含量一般为40-60%,过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。 5. 引物所对应模板位置序列的Tm值在72℃左右可使复性条件最佳。Tm值的计算有多种方法,如按公式Tm=4(G+C)+2(A+T),在Oligo软件中使用的是最邻近法(the nearest neighbor method)。

引物设计与检测全过程

如何在pubmed上查找一个蛋白质的基因序列 (1)打开https://www.sodocs.net/doc/0f19490921.html,网址(百度上搜索NCBI也可找到此网址)。 (2)在搜索框中输入你要查找的蛋白名称或者序列号 (3)在搜索的选择范围下拉菜单中选择all database,然后点击搜索。 (4)在其中nucleiotide中可以查找你需要的蛋白,的核苷酸序列。 我在NCBI上找到很多C-myc的氨基酸序列,大小不一,不知道你说的C-myc标签的序列的氨基酸个数和具体序列,不知道多少KD. 其中我查到c-myc protein 氨基酸有419个,其mRNA序列为1307个核苷酸。20种氨基酸的平均分子量为128,所以419*128=53632Dalton=54KD。如种属不对,或序列数不对,你可以重新再NCBI上查找或者将你已知的C-MYC蛋白质序列输入到生物分析软件中计算也可以。 primer5和Oligo结合设计引物步骤及心得 一、引物设计step by step 1、在NCBI上搜索到目的基因,找到该基因的mRNA,在CDS选项中,找到编码区所在位置,在下面的origin中,Copy该编码序列作为软件查询序列的候选对象。 2、用Primer Premier5搜索引物 ①打开Primer Premier5,点击File-New-DNA sequence, 出现输入序列窗口,Copy目的序列在输入框内(选择As),此窗口内,序列也可以直接翻译成蛋白。点击Primer,进入引物窗口。 ②此窗口可以链接到“引物搜索”、“引物编辑”以及“搜索结果”选项,点击Search按钮,进入引物搜索框,选择“PCR primers”,“Pairs”,设定搜索区域和引物长度和产物长度。在Search Parameters里面,可以设定相应参数。

引物设计方法与分析

引物设计方法与分析 查找基因相关信息 在NCBI上搜索到目的基因,找到该基因的mRNA,在CDS选项中,找到编码区所在位置,在下面的origin中,Copy该编码序列作为软件查询序列的候选对象。 2.4.2 用Primer Premier5搜索引物 (1) 打开Primer Premier5,点击File-New-DNA sequence, 出现输入序列窗口,Copy目的序列在输入框内(选择As),此窗口内,序列也可以直接翻译成蛋白。点击Primer,进入引物窗口。 (2) 此窗口可以链接到“引物搜索”、“引物编辑”以及“搜索结果”选项,点击Search按钮,进入引物搜索框,选择“PCR primers”,“Pairs”,设定搜索区域和引物长度和产物长度。在Search Parameters里面,可以设定相应参数。一般若无特殊需要,参数选择默认即可,但产物长度可以适当变化,因为100~200bp的产物电泳跑得较散,所以可以选择 300~500bp。 (3) 点击OK,软件即开始自动搜索引物,搜索完成后,会自动跳出结果窗口,搜索结果默认按照评分(Rating)排序,点击其中任一个搜索结果,可以在“引物窗口”中,显示出该引物的综合情况,包括上游引物和下游引物的序列和位置,引物的各种信息等。 82 (4) 对于引物的序列,可以简单查看一下,避免出现下列情况:3’不要出现连续的3个碱基相连的情况,比如GGG或CCC,否则容易引起错配。此窗口中需要着重查看的包括:Tm应该在55~70度之间,GC%应该在45%~55%间,上游引物和下游引物的Tm值最好不要相差太多,大概在2度以下较好。该窗口的最下面列出了两条引物的二级结构信息,包括,发卡,二聚体,引物间交叉二聚体和错误引发位置。若按钮显示为红色,表示存在该二级结构,点击该红色按钮,即可看到相应二级结构位置图示。最理想的引物,应该都不存在这些二级结构,即这几个按钮都显示为“None”为好。但有时很难找到各个

引物设计流程之基因编码区扩增引物设计

引物设计流程之基因编码区扩增引物设计基因编码区(CDS)扩增引物设计是在研究过程中常常使用的一种技术。通过设计合适的引物序列,可以扩增出感兴趣的基因编码区域,进而 进行后续的实验或分析。下面将介绍基因编码区扩增引物设计的流程,并 详细讨论其中的关键步骤。 1. 确定扩增范围:首先,需要明确要扩增的基因编码区域。可以根 据已知的基因序列,选择感兴趣的片段进行扩增。可以使用已有的基因序 列数据库(如GenBank、Ensembl等)进行和筛选,或者利用已有的文献 报道来确定扩增范围。在确定扩增范围时,需要考虑现有的引物设计规则,如避开带有重复序列、剪切位点或调控元件的区域。 2.引物设计:引物设计是基因编码区扩增的关键步骤之一、引物通常 包括两个部分:扩增前端引物和扩增后端引物。前端引物与基因的5'端 序列互补匹配,后端引物与基因的3'端序列互补匹配。在引物的设计中,有几个关键点需要考虑: a.引物长度:一般来说,引物的长度应在18-24个碱基对之间。引物 太短可能导致扩增特异性下降,引物太长可能导致反应效率降低。 b.GC含量:GC含量是引物设计中重要的考虑因素之一、一般来说, 引物的GC含量应在40-60%之间。GC含量高的引物更稳定,但可能导致特 异性下降;GC含量低的引物则可能导致引物和模板结合的稳定性下降。 c.末端碱基:引物的末端碱基应尽可能选择A或T,以提高引物的特 异性。 d. 引物二聚体和自身结合:在设计引物时,需要检查引物之间是否 存在二聚体和引物与自身之间是否存在结合。可以使用计算工具(如IDT

OligoAnalyzer)进行预测和优化,确保引物之间和引物与自身之间没有相互结合的问题出现。 3.引物特异性和重复性分析:在设计引物后,需要进行引物特异性和重复性分析。特异性分析是为了确保引物只扩增目标基因编码区域,不扩增其他非目标区域的DNA序列。可以使用BLAST等工具进行引物序列的比对和筛选,以确保引物的特异性。重复性分析是为了检查引物序列是否存在过多的重复序列,因为过多的重复序列可能导致扩增的特异性下降,甚至引发假阳性结果。 4.引物合成和验证:设计好的引物需要进行合成,并通过PCR技术进行验证。在PCR反应中,可以使用已有的DNA模板进行扩增试验,以验证引物的效果和特异性。如果引物设计不符合预期,需要进行优化,如调整引物长度、GC含量等,直到获得满意的结果。 总之,基因编码区扩增引物设计涉及多个环节,包括确定扩增范围、引物设计、特异性和重复性分析以及引物合成和验证。在实践中,需要综合考虑多个因素,确保设计的引物具有高度特异性和扩增效率。同时,可以借助计算工具和序列比对软件,提高引物设计的准确性和效率。

全基因扩增的引物设计步骤

全基因扩增的引物设计步骤 引言 全基因扩增(Whole Genome Amplification,WGA)是一种将整个基因组进行扩增的技术,可以从极少量的DNA样本中获得足够的DNA量进行后续实验。在全基因扩增过程中,引物设计是至关重要的一步,它直接影响扩增效率和特异性。本文将详细介绍全基因扩增的引物设计步骤。 引物设计步骤 1. 确定扩增目标 在进行全基因扩增之前,首先需要确定扩增的目标。可以是整个基因组的扩增,也可以是特定区域的扩增。根据扩增目标的不同,可以选择不同的引物设计策略。 2. 引物长度选择 引物的长度对扩增效率和特异性有重要影响。通常,引物的长度在18-30个碱基对之间。较短的引物可以提高扩增效率,但可能会导致非特异性扩增产物的产生;较长的引物可以提高特异性,但可能会降低扩增效率。 3. 引物序列选择 引物序列的选择是引物设计中最关键的一步。以下是引物序列选择的几个要点: - 引物应具有足够的特异性,避免非特异性扩增产物的产生。可以通过比对基因组数据库或使用引物设计软件来评估引物的特异性。 - 引物的GC含量应适中,一般在40-60%之间。过高或过低的GC含量可能会影响扩增效率。 - 引物的3’端应尽量避免出现重复序列或富含AT或GC碱基对的序列,以减少扩增的非特异性。 - 引物的3’端还可以加入一些特定的序列,如限制性酶切位点、引物标签等,以方便后续实验操作。

4. 引物的互补性检查 在引物设计完成后,需要进行引物的互补性检查。引物之间的互补性可能会导致二聚体的形成,影响扩增效率和特异性。可以使用引物设计软件或进行体外实验来检查引物之间的互补性。 5. 引物的合成 合成引物时,可以选择商业合成或自行合成。在合成引物时,需要注意以下几个问题: - 引物的纯度要求较高,以避免污染对扩增结果的影响。 - 引物的浓度要适中,一般在10-100 μM之间。 引物设计实例 以下是一个全基因扩增引物设计的实例: 1.扩增目标:整个基因组的扩增。 2.引物长度选择:选择长度为20个碱基对的引物。 3.引物序列选择:使用引物设计软件进行引物序列选择,确保引物具有足够的 特异性和适当的GC含量。选择的引物序列如下: –引物1:5’-AGCTGATCGATCGATCGATC-3’ –引物2:5’-GATCGATCGATCGATCGATC-3’ 4.引物的互补性检查:使用引物设计软件进行引物的互补性检查,确保引物之 间没有互补性。 5.引物的合成:选择商业合成引物,并确保引物的纯度和浓度符合要求。 结论 全基因扩增的引物设计是全基因扩增技术中至关重要的一步。通过合理选择引物的长度和序列,并进行互补性检查和合成,可以提高扩增效率和特异性。合理的引物设计可以为后续实验提供可靠的基础,并推动全基因扩增技术的应用和发展。 参考文献 1.Paez JG, et al. (2004) Whole genome amplification generates stable and reproducible genotyping data. Genome Res. 14(3): 603-8. 2.Dean FB, et al. (2002) Comprehensive human genome amplification using multiple displacement amplification. Proc Natl Acad Sci U S A. 99(8): 5261-6.

引物设计

一、引物设计step by step 1、在NCBI上搜索到目的基因,找到该基因的mRNA,在CDS选项中,找到编码区所在位置,在下面的origin中,Copy该编码序列作为软件查询序列的候选对象。 2、用Primer Premier5搜索引物 ①打开Primer Premier5,点击File-New-DNA sequence, 出现输入序列窗口,Copy目的序列在输入框内(选择As),此窗口内,序列也可以直接翻译成蛋白。点击Primer,进入引物窗口。 ②此窗口可以链接到“引物搜索”、“引物编辑”以及“搜索结果”选项,点击Search按钮,进入引物搜索框,选择“PCR primers”,“Pairs”,设定搜索区域和引物长度和产物长度。在Search Parameters里面,可以设定相应参数。一般若无特殊需要,参数选择默认即可,但产物长度可以适当变化,因为100~200bp的产物电泳跑得较散,所以可以选择300~500bp. ③点击OK,软件即开始自动搜索引物,搜索完成后,会自动跳出结果窗口,搜索结果默认按照评分(Rating)排序,点击其中任一个搜索结果,可以在“引物窗口”中,显示出该引物的综合情况,包括上游引物和下游引物的序列和位置,引物的各种信息等。 ④对于引物的序列,可以简单查看一下,避免出现下列情况: 3’不要出现连续的3个碱基相连的情况,比如GGG或 CCC,否则容易引起错配。此窗口中需要着重查看的包括:T m应该在55~70度之间,GC%应该在45%~55%间,上游引物和下游引物的T m值最好不要相差太多,大概在2度以下较好。该窗口的最下面列出了两条引物的二级结构信息,包括,发卡,二聚体,引物间交叉二聚体和错误引发位置。若按钮显示为红色,表示存在该二级结构,点击该红色按钮,即可看到相应二级结构位置图示。最理想的引物,应该都不存在这些二级结构,即这几个按钮都显示为“None”为好。但有时很难找到各个条件都满足的引物,所以要求可以适当放宽,比如引物存在错配的话,可以就具体情况考察该错配的效率如何,是否会明显影响产物。对于引物具体详细的评价需要借助于Oligo来完成,Oligo自身虽然带有引物搜索功能,但其搜索出的引物质量感觉不如Primer5. ⑤在Primer5窗口中,若觉得某一对引物合适,可以在搜索结果窗口中,点击该引物,然后在菜单栏,选择File-Print-Current pair,使用PDF虚拟打印机,即可转换为Pdf文档,里面有该引物的详细信息。 3、用Oligo验证评估引物 ①在Oligo软件界面,File菜单下,选择Open,定位到目的cDNA序列(在primer中,该序列已经被保存为Seq文件),会跳出来两个窗口,分别为Internal Stability(Delta G)窗口和Tm窗口。在Tm窗口中,点击最左下角的按钮,会出来引物定位对话框,输入候选的上游引物序列位置(Primer5已经给出)即可,而引物长度可以通过点击Change-Current oligo length来改变。定位后,点击Tm窗口的Upper按钮,确定上游引物,同样方法定位下游引物位置,点击Lower按钮,确定下游引物。引物确定后,即可以充分利用Analyze 菜单中各种强大的引物分析功能了。 ②Analyze中,第一项为Key info,点击Selected primers,会给出两条引物的概括性信息,其中包括引物的T m值,此值Oligo是采用nearest neighbor method计算,会比Primer5中引物的Tm值略高,此窗口中还给出引物的Delta G和3’端的Delta G.3’端的Delta G 过高,会在错配位点形成双链结构并引起DNA聚合反应,因此此项绝对值应该小一些,最好不要超过9。 ③Analyze中第二项为Duplex Formation,即二聚体形成分析,可以选择上游引物或下游引

相关主题