搜档网
当前位置:搜档网 › Blast Chiller Freezer 中文说明书

Blast Chiller Freezer 中文说明书

Blast Chiller Freezer 中文说明书
Blast Chiller Freezer 中文说明书

Blast本地化详细流程

Blast 2.4.0+本地化详细流程(基于Windows系统) 1.程序获得。从NCBI上下载Blast本地化程序,下载地址: ftp://https://www.sodocs.net/doc/ce8190947.html,/blast/executables/blast+/LATEST/ 64×安装版▲ 64×解压(绿色)版▲ 最好安装或解压到X盘根目录:如X:\blast,尽量简短,方便后边命令输入。 2.原始序列获得。方法1:找到转录组测序数据unigene数据库文件:unigene.fasta 或unigene.fa,若为unigene.fa则直接改后缀为.fasta即可。找到或修改后将数据库文件移动至Blast本地化程序目录“X:\blast\bin”。方法2:从NCBI中的ftp 库下载所需要库,链ftp://https://www.sodocs.net/doc/ce8190947.html,/blast/db/FASTA/,其中nr.gz为非冗余的数据库,nt.gz为核酸数据库,month.nt.gz为最近一个月的核酸序列数据。下载的month.nt.gz先用WINRAR解压缩,然后用makeblastdb.exe格式化。方法3:利用新版blast自带的update_blastdb.pl进行下载,这需要安装perl程序。 注释:上述三种方法各有优缺点,前两种下载速度较快,但是每次进行检索都需要对数据库进行格式化(转化成二进制数据),第三种方法下载速度较慢,但是NCBI 中已经格式化好的,在进行本地检索时不需再进行格式化,直接用即可。 3.用文本编辑器(txt文件改名字及后缀)创建一个ncbi.ini文件,文件包含下 面内容:[NCBI]Data="C:\blast\data\" 先新建TXT文件,然后改属性,将ncbi.ini文件存放到C:\Windows 4.将Blast本地化程序目录添加路径中(该步骤非必须,但会给以后的操作带来 方便),方法: a)右击我的电脑选择属性,选择高级,点击环境变量,设置环境变量 b)系统变量中,选择Path,点击“编辑”,在变量值的后面添加Blast本地化 程序所在路径,E:\blast 点击确定,将安装路径添加到path。 5.运行MS-DOC。打开DOC窗口(点击开始,选择运行,打开的输入框中输 入“CMD”,确定),访问Blast本地化程序所在文件夹,依次输入:(1)X: 回车;(2)cd blast\bin,回车。

本地blast的详细用法∷柳城

本地blast的详细用法 Posted on 03 四月 2009 by 柳城,阅读 9,626 本地blast的详细使用方法 blast all -p blastn -i myRNA.fasta -d humanRNA.fasta -o myresult.blastout -a 2 -F F -T T -e 1e-10 解释如下: blastall: 这是本地化/命令行执行blast时的程序名字!(Tips:blastall直接回车就会给出你所有的参数帮助,但是英文的) -p: p 是program的简写,program在计算机领域中是程序的意思。此参数是指定要使用何种子程序,所谓子程序,就是针对不同的需要,如核酸序列和核酸序列进行比对、蛋白质序列和蛋白质序列进行比对、假设翻译后核酸序列于蛋白质序列进行比对,选择相应的子程序: blastn 是用于核酸对核酸 blastp 是蛋白质对蛋白质序列等等,一共5个自程序。 -i: i 是input的简写,意思是输入文件,就是你自己的要进行比对的序列文件(fasta格式) -d: d是database的简写,意思是要比对的目标数据库,在例子中就是humanRNA.fasta (别忘了要formatdb) -o: o是output的简写,意思是结果文件名字,这个根据你自己的习惯起名字,可以带路径,(上边两个参数-i -d 也都可以带路径) *注意以上4个参数是必须的,缺一不可,下面的参数是为了得到更好的结果自己可调的参数,如果你不加也没有关系,blastall程序本身会给一个默认值! -a: 是指计算时要用的CPU个数,我的机器有两个CPU,所以用-a 2,这样可以并行化进行计算,提高速度,当然你的计算机就一个CPU,可以不用这个参数,系统默认值为1,就是一个CPU -F: 是filter的简写,blastall程序中有对简单的重复序列和低复杂度的一些repeats过滤调,默认是T (注意以后的有几种参数就两个选项,T/F T就是ture,真,你可以理解为打开该功能; F就是false,假,理解为关闭该功能) -T: 是HTML的简写,是指blast结果文件是否用HTML格式,默认是F!如果你想用IE看,我建议用-T T -e: 是Expectation value,期望值,默认是10,我用的10-10! BLASTALL 用法 a.格式化序列数据库 格式化序列数据库— —formatdb formatdb简单介绍: formatdb处理的都是格式为 ASN.1和FASTA,而且不论是核苷酸序列数据库,还是蛋白质序列数据库;不论是使用Blastall ,还是Blastpgp,Mega Blast应用程序,这一步都是不可少的。 formatdb命令行参数: formatdb - 得到formatdb 所有的参数显示(见附录二)和介绍, 主要参数的说明:

NCBI在线BLAST使用方法与结果详解

N C B I在线B L A S T使用方法与结果详解 IMB standardization office【IMB 5AB- IMBK 08- IMB 2C】

N C B I在线B L A S T使用方法与结果详解 BLAST(BasicLocalAlignmentSearchTool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。 BLAST采用一种局部的算法获得两个序列中具有相似性的序列。 Blast中常用的程序介绍: 1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。 2、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。 3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。 4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。 5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。 NCBI的在线BLAST: 下面是具体操作方法 1,进入在线BLAST界面,可以选择blast特定的物种(如人,小鼠,水稻等),也可以选择blast所有的核酸或蛋白序列。不同的blast程序上面已经有了介绍。这里以常用的核酸库作为例子。 2,粘贴fasta格式的序列。选择一个要比对的数据库。关于数据库的说明请看NCBI在线blast数据库的简要说明。一般的话参数默认。 3,blast参数的设置。注意显示的最大的结果数跟E值,E值是比较重要的。筛选的标准。最后会说明一下。 4,注意一下你输入的序列长度。注意一下比对的数据库的说明。 5,blast结果的图形显示。没啥好说的。 6,blast结果的描述区域。注意分值与E值。分值越大越靠前了,E值越小也是这样。7,blast结果的详细比对结果。注意比对到的序列长度。评价一个blast结果的标准主要有三项,E值(Expect),一致性(Identities),缺失或插入(Gaps)。加上长度的话,就有四个标准了。如图中显示,比对到的序列长度为1405,看Identities这一值,才匹配到1344bp,而输入的序列长度也是为1344bp(看上面的图),就说明比对到的序列要长一

本地Blast

本地Blast使用说明 一、软件的下载安装 1.1安装流程 建议安装在非系统盘,如将下载的 BLAST 程序安装到 E:\blast,生成bin、doc 两个子目录,其中 bin 是程序目录,doc 是文档目录,这样就安装完毕了。 1.2 设置环境变量 右键点击“我的电脑”-“属性”,然后选择“高级系统设置”标签-“环境变量”(图1),在用户变量下方“Path”随安装过程已自动添加其变量值,即“E:\Blast\bin”。此时点击“新建”-变量名“BLASTDB”,变量值为“E:\Blast\db”(即数据库路径,图2)。 二、查看程序版本信息 点击 Windows 的“开始”菜单下的“运行”,输入“cmd”调出 MS-DOS 命令行,转到 Blast 安装目录,输入命令“blastn -version”即可查看版本,若能显示说明本地blast 已经安装成功。 三、使用 3.1本地数据库的构建 下载所需的数据(Fasta格式),将X 放到E:\blast\db 文件夹下,然后调出MS-DOS 命令行,转到E:\blast\db 文件夹下运行以下命令:格式化

数据库,命令为: makeblastdb -in 数据库文件 -dbtype 序列类型(核酸:nul;蛋白:prot)-title database_title-parse_seqids -out database_name-logfile File_Name 格式化数据库后,创建三个主要的文件——库索引(indices),序列(sequences)和头(headers)文件。生成的文件的扩展名分别是:.pin、.psq、.phr(对蛋白质序列)或.nin、.nsq、.nhr(对核酸序列)。而其他的序列识别符和索引则包含在.psi和.psd(或.nsi 和.nsd)中。 3.2核酸序列相似性搜索 blastn -db database_name -query input_file -out output_file -outfmt "7 qacc sacc qstart qend sstart send length bitscore evalue pident ppos" 备注:qacc:查询序列Acession号;sacc:目标序列Acession号; qstart qend:分别表示查询序列比对上的起始、终止位置; sstart send:分别表示目标序列比对上的起始、终止位置; length:长度; bitscore:得分; evalue:E-Value值; pident:一致性; ppos:相似性 3.3 查看并获取目标序列: blastdbcmd -db refseq_rna -entry 224071016 -out test.fa 可以从数据库中提取gi号为224071016的序列,并且以fasta格式存入文 件 3.4蛋白质序列相似性搜索 Blastp -db database_name-query input_file -out output_file -outfmt "7 qacc sacc qstart qend sstart send length bitscore evalue pident ppos" 3.5 查看并获取目标序列:重复3.3

NCBI中Blast种类及使用简介

NCBI中Blast种类及使用简介 NCBI中Blast种类简介 1. Blast Assembled Genomes 在一个选择的物种基因组序列中去搜索。 2.Basic Blast 2.1 nucleotide blast--- 用核酸序列到核酸数据库中进行搜索,包括3个程序 2.1.1 Blastn----核酸序列(n)到核酸序列数据库中搜索,是一种标准的搜索。 2.1.2 megablast----该程序使用“模糊算法”加快了比较速度,可以用于快速比较两大系列序列。可以用来搜索一匹ESTs序列和大的cDNA或基因组序列, 适用于由于测序或者其他原因形成的轻微的差别的序列之间的比较 2.1.3 discontiguous megablast----与megablast不同的是主要用来比较来自不同物种之间的相似性较低的分歧序列。 2.2 Protein Blast 2.2.1 Blastp ---蛋白质序列到蛋白质序列数据库中搜索,是一种标准的搜索。 2.2.2 psi-blast---位点特异迭代BLAST —用蛋白查询来搜索蛋白资料库的一个程式。所有被BLAST发现的统计有效的对齐被总和起来形成一个多次对齐,从这个对齐,一个位置特异的分值矩阵建立起来。这个矩阵被用来搜索资料库,以找到额外的显著对齐,这个过程可能被反复迭代一直到没有新的对齐可以被发现。 2.2.3 PHI-BLAST---以常规的表达模型为特别位置进行PSI - BLAST检索,找出和待查询序列具有一样的表达模型且具有同源性的蛋白质序列。 2.3 Translating BLAST 2.3.1 blastx----先将待查询的核酸序列按6 种读框翻译成蛋白质序列,然后将翻译出的蛋白质序列与NCBI 蛋白质序列数据库比较。 2.3.2 tblastn-----先将核酸序列数据库中的核酸序列按6 种读框翻译成

Blast本地化安装图解

Blast本地化:window平台下blast软件的安装boyun发表于 2009-07-09 17:08 | 阅读 1 views 1.对于windows 2000/xp 用户,下载blast- 2.2.18-ia32-win32.exe安装文件 ftp://https://www.sodocs.net/doc/ce8190947.html,/blast/executables/LATEST/blast- 2.2.18-ia32-win32.exe 2.创建一个新目录,例如C:\blast,将下载的文件blast-2.2.18-ia32-win32.exe复制到该目录,双击这个文件,自解压产生bin、data、doc 三个目录,bin是程序目录,data是程序使用数据的目录,doc是文档目录。 表:bin目录中的程序 程序说明 bl2seq.exe进行两条序列比对 blastall.exe做普通的blast比对 blastclust.exe blastpgp.exe copymat.exe fastacmd.exe通过gi号,接收号等,在数据库中检索序 列 formatdb.exe格式化数据库 formatrpsdb.exe impala.exe makemat.exe megablast.exe megablast程序 rpsblast.exe seedtop.exe 3.用文本编辑器创建一个ncbi.ini文件,文件包含下面内容:[NCBI] Data="C:\blast\data\" 将ncbi.ini文件存放到系统的Windows 或者 WINNT目录。 4.将”C:\blast\bin”目录添加路径中(该步骤非必须,但会给以后的操作带来方便),方法:

NCBI在线BLAST使用方法与结果详解

N C B I在线B L A S T使用 方法与结果详解 This model paper was revised by the Standardization Office on December 10, 2020

N C B I在线B L A S T使用方法与结果详解 BLAST(Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。 BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。 Blast中常用的程序介绍: 1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。 2、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。 3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。 4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。 5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。 NCBI的在线BLAST: 下面是具体操作方法 1,进入在线BLAST界面,可以选择blast特定的物种(如人,小鼠,水稻等),也可以选择blast所有的核酸或蛋白序列。不同的blast程序上面已经有了介绍。这里以常用的核酸库作为例子。 2,粘贴fasta格式的序列。选择一个要比对的数据库。关于数据库的说明请看NCBI在线blast数据库的简要说明。一般的话参数默认。 3,blast参数的设置。注意显示的最大的结果数跟E值,E值是比较重要的。筛选的标准。最后会说明一下。 4,注意一下你输入的序列长度。注意一下比对的数据库的说明。 5,blast结果的图形显示。没啥好说的。 6,blast结果的描述区域。注意分值与E值。分值越大越靠前了,E值越小也是这样。7,blast结果的详细比对结果。注意比对到的序列长度。评价一个blast结果的标准主要有三项,E值(Expect),一致性(Identities),缺失或插入(Gaps)。加上长度的话,就有四个标准了。如图中显示,比对到的序列长度为1405,看Identities这一值,才匹配到1344bp,而输入的序列长度也是为1344bp(看上面的图),就说明比对到的序

NCBI在线BLAST使用方法与结果详解

NCBI在线BLAST使用方法与结果详解 BLAST(Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA 数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。 BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。 Blast中常用的程序介绍: 1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。 2、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。 3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。 4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。 5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。 NCBI的在线BLAST:https://www.sodocs.net/doc/ce8190947.html,/Blast.cgi 下面是具体操作方法 1,进入在线BLAST界面,可以选择blast特定的物种(如人,小鼠,水稻等),也可以选择blast所有的核酸或蛋白序列。不同的blast程序上面已经有了介绍。这里以常用的核酸库作为例子。

Windows下本地blast安装方法

Windows系统下本地BLAST安装方法 1.下载安装文件: 以blast-2.2.23-ia32-win32.exe为例,将此安装文件放至指定目录,以G:\blast-\为例,如图所示: 2. 运行安装程序: 双击上述安装文件,单击运行: 程序会自动在blast-文件夹下生成3个文件夹:\bin\、\data\和\doc\:

3. 添加配置文件: 在桌面(任意可以新建文件的地方)新建一个.txt文件,然后将其重命名为NCBI.ini,在提示更改后缀名的对话框中点是。打开NCBI.ini,在其中写入如下两行内容: [NCBI] Data="path\data\" 上边的path是你的blast安装路径,在本例中为G:\blast-,因此,NCBI.ini中的内容为: [NCBI] Data="G:\blast-\data\" 写完后保存,然后将该文件复制至C:\Windows目录下: 至此,本地blast-2.2.23-ia32-win32安装完毕。 4. 导入数据库:

从ftp://https://www.sodocs.net/doc/ce8190947.html,/blast/db/上,可下载各类数据库文件,下载完毕后,将其解压至G:\blast-\data\目录下。 注意事项: 1.NCBI.ini中的路径为blast所在安装路径; 2.此安装办法适用与指定版本,对于blast+版本不适用,若想安装新 版本,可自行到网站查阅安装办法; 附:运行示例: 1.打开cmd命令行;

2.通过cd命令到达安装目录的bin\目录下 3.通过dir命令查看全部可执行的子程序: 4.使用blastall.exe进行比对: 输入blastall.exe -d refseq_rna.01 -i G:\blast-\data\test_query.fa -p blastn 该命令各部分的含义为: ①blastall.exe:blast主程序; ②-d refseq_rna.01:选择refseq_rna.01为被搜索的数据库,其数

Blast软件的详细使用方法

Blast软件的详细使用方法 blastall -p blastn -i myRNA.fasta -d humanRNA.fasta -o myresult.blastout -a 2 -F F -T T -e 1e-10 解释如下: blastall: 这是本地化/命令行执行blast时的程序名字!(Tips:blastall直接回车就会给出你所有的参数帮助,但是英文的) -p: p 是program的简写,program在计算机领域中是程序的意思。此参数是指定要使用何种子程序,所谓子程序,就是针对不同的需要,如核酸序列和核酸序列进行比对、蛋白质序列和蛋白质序列进行比对、假设翻译后核酸序列于蛋白质序列进行比对,选择相应的子程序: blastn 是用于核酸对核酸blastp 是蛋白质对蛋白质序列等等,一共5个自程序。 -i: i 是input的简写,意思是输入文件,就是你自己的要进行比对的序列文件(fasta格式)-d: d是database的简写,意思是要比对的目标数据库,在例子中就是humanRNA.fasta (别忘了要formatdb) -o: o是output的简写,意思是结果文件名字,这个根据你自己的习惯起名字,可以带路径,(上边两个参数-i -d 也都可以带路径) *注意以上4个参数是必须的,缺一不可,下面的参数是为了得到更好的结果自己可调的参数,如果你不加也没有关系,blastall程序本身会给一个默认值! -a: 是指计算时要用的CPU个数,我的机器有两个CPU,所以用-a 2,这样可以并行化进行计算,提高速度,当然你的计算机就一个CPU,可以不用这个参数,系统默认值为1,就是一个CPU -F: 是filter的简写,blastall程序中有对简单的重复序列和低复杂度的一些repeats过滤调,默认是T (注意以后的有几种参数就两个选项,T/F T就是ture,真,你可以理解为打开该功能; F就是false,假,理解为关闭该功能) -T: 是HTML的简写,是指blast结果文件是否用HTML格式,默认是F!如果你想用IE看,我建议用-T T -e: 是Expectation value,期望值,默认是10,我用的10-10! BLASTALL 用法 a.格式化序列数据库 格式化序列数据库——formatdb formatdb简单介绍: formatdb处理的都是格式为ASN.1和FASTA,而且不论是核苷酸序列数据库,还是蛋白质序列数据库;不论是使用Blastall ,还是Blastpgp,Mega Blast应用程序,这一步都是不可少的。 formatdb命令行参数: formatdb - 得到formatdb 所有的参数显示(见附录二)和介绍, 主要参数的说明: -i 输入需要格式化的源数据库名称Optional -p 文件类型,是核苷酸序列数据库,还是蛋白质序列数据库 T – protein F - nucleotide [T/F] Optional default = T -a 输入数据库的格式是ASN.1(否则是FASTA) T - True, F - False. [T/F] Optional default = F

本地BLAST+windows本科教学

本地blast的安装及使用 安装: 1.首先进入NCBI 2.点击ALL Resources 3.点击ALL Resources里的Downloads选项卡 4.点击BLAST(Stand-alone)选项 在BLAST+executables中点击 ftp://https://www.sodocs.net/doc/ce8190947.html,/blast/executables/blast+/LATEST/ . 链接(这只是说这个链接如何找到的,可以直接点击这个链接进行下载)。 5点击ncbi-blast-2.2.29+-win32.exe进行下载,大家的电脑一般为32位的, 加入为64 位的则需要点击ncbi-blast-2.2.29+-win64.exe下载,根据个人情况定 6下载好后点击“下一步“进行安装。 运行: 1.点击电脑桌面的“开始“——”运行“,在”打开“中输入” cmd“,(这也就是调取DOS命令,快捷键”windows“+“R“键,然后回车) 2切换到blast的bin目录下,例如我的路径是C:\Program Files\NCBI\blast-2.2.29+\bin,那么我的命令是: 然后回车。

切换后的结果是: 3把你的物种数据和比对的数据文件移动到bin文件夹下,然后做下面的。 1)建库根据你要比对的物种序列建库 dos 命令:makeblastdb -in ~ -dbtype nucl/prot -out ~ in 后面的‘~’里填要建库的序列文件名称,如整个水稻蛋白质组 第二个‘~’里填库的名称(自己命名) nucl :建核苷酸库,prot:建蛋白质库(根据你数据要求任选一个) 2)比对 dos 命令:blastp/blastn -query ~ -db ~ -out ~ -evalue ~ -outfmt blastp 为比对蛋白质序列,blastn比对核苷酸序列 query后面的‘~’填你要比对的序列文件名 db 后面填你第一步建好库的名称 out 输出最终结果名称 evalue 你自己设一个期望值(5) outfmt 输出文件格式填数字6或7 (1)建库 结果 (2)比对:

NCBI本地Blast 安装方法

IN HOUSE LOCAL BLAST SEARCH To get started you need the blastall.exe and formatdb.exe (From NCBI). The rest of the perl and batch programs you might need to change the path of the directories they are pointing to or the blast option they use, could be downloaded from: https://www.sodocs.net/doc/ce8190947.html,/SGMD/software/blast/Blast.htm For the programs to work withou t modifying the paths, the whole folder “Blast.zip” should be unzipped to a folder "Blast"moved under the “C:” directory. For questions or comments please contact: Imed Ben Chouikha bchouikh@https://www.sodocs.net/doc/ce8190947.html, I. Step one: Blasting 1) Download the database that you want to blast against, for example the NT database from NCBI. If you want to use a local database, store all the sequences in a text file. The file provided by NCBI is a zipped (nt.gz) file so you have to unzip it. 2) At the DOS prompt (which you can get to from windows by choosing: Start, Run, then typing: command), run formatdb.exe to create a local database from that text file or the downloaded database. Usage: formatdb –t databasename–i inputfile –p F Examples: 1) formatdb –t nt–i nt –p F 2)formatdb –t snc–i inputfile –p F databasename is the name you want to give to your database inputfile is the name of the text file that contains your sequences or the name of the database that you downloaded from GenBank (technically also a text file of sequences). More about formatdb.exe information and command options can be found here: https://www.sodocs.net/doc/ce8190947.html,/IEB/ToolBox/C_DOC/lxr/source/doc/formatdb.txt 3) Open the file BlastList.pl (using Notepad or your favorite text editor) Make the small changes as instructed in the file then save it. These are the only two changes that should be made to run the program. 4) Run BlastList.pl as follows:

BLAST使用教程

BLAST (Basic Local Alignment Search Tool)NCBI采用的一套对蛋白质数据库或DNA数据库中进行相似性比较的分析工具(当然很多其它生物学数据库都提供了BLAST检索入口)。您只需提交您的序列,通过BLAST查询就顷刻间从公开数据库中无数的的序列里找到相似序列。BLAST结果中的得分是对一种对相似性的统计说明。 BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。如果您想进一步了解BLAST算法,您可以参考NCBI的BLAST Course ,该页有BLAST算法的介绍。 BLAST功能是什么? BLAST对一条或多条序列(可以是任何形式的序列)在一个或多个核酸或蛋白序列库中进行比对。BLAST还能发现具有缺口的能比对上的序列。 BLAST是基于Altschul等人在J.Mol.Biol上发表的方法(J.Mol.Biol.215:403-410(1990)),在序列数据库中对查询序列进行同源性比对工作。从最初的BLAST发展到现在NCBI提供的BLAST2.0,已将有缺口的比对序列也考虑在内了。BLAST可处理任何数量的序列,包括蛋白序列和核算序列;也可选择多个数据库但数据库必须是同一类型的,即要么都是蛋白数据库要么都是核酸数据库。所查询的序列和调用的数据库则可以是任何形式的组合,既可以是核酸序列到蛋白库中作查询,也可以是蛋白序列到蛋白库中作查询,反之亦然。GCG及EMBOSS等软件包中包含有五种BLAST: 1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。 2、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。 3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。 4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。 5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。由于这种比对? 母丛有裕 虼薚BLASTX在比对中对缺口不予以考虑。 通常根据查询序列的类型(蛋白或核酸)来决定选用何种BLAST。假如是作核酸-核酸查询,有两种BLAST供选择,通常默认为BLASTN。如要用TBLASTX也可,但记住此时不考虑缺口。 BLAST适用于本地查询。可以下载公共数据库,对于该数据库的更新和维护是必不可少的。如果要直接到网上查询也可以(即NetBlast),但记住如果你认为

window系统下本地blast+安装与使用教程

window系统下本地blast+安装与使用教程 一、blast的下载与安装 1.程序下载:访问blast本地软件包链接 blast_latest 下载适合自己系统的blast版本,这里我选择 ncbi-blast- 2.2.28+-win64.exe。 2.安装流程:下载完毕后,双击安装到C:\Blast,生成bin和doc两个子目录,其中bin 是程序目录,doc是文档目录,这样就安装完成。 3.用户环境变量设置:右键点击“我的电脑”-属性,然后“高级系统设置”选项-“环境变量”,在用户变量下方点击“新建”-变量名:BLASTDB,变量值:C:\Blast\db(即数据库路径)。在系统变量下方“Path”添加变量值:C:\Blast\bin。 4.查看程序版本信息:点击window的"开始"菜单,在运行中输入cmd,调出MS-DOS 命令行,转到blast安装目录,输入命令“blastn -version"即可查看版本。 二、blast本地数据库的构建 1.数据的获取 1.1直接从NCBI或者其他数据库网站下载所需序列做成数据库,或者自己已有的测序数据(格式必须是fasta,名字可以自己随便命名)。 1.2 从NCBI中的ftp库下载所需要的某一个库或几个库(其链接为 ftp://https://www.sodocs.net/doc/ce8190947.html,/blast/db/FASTA/)其中nr.gz为非冗余的数据库,nt.gz为核酸数据库,month.nt.gz为最近一个月的核酸序列数据。 1.3利用新版blast自带的update_blastdb.pl进行下载,这需要安装perl程序。 上述三种方法各有优缺点:前两种下载速度较快,但是检索前都需要对数据库进行格式化(转化成二进制数据),第三种方法下载速度较慢,但是是NCBI中已经格式化好的,在进行本地检索时不需再进行格式化,直接用即可。 2.数据的格式化 以xk001.fasta作为查询序列,以nr.fasta作为数据库文件为例。首先将nr.fasta放到C:\Blast\db文件夹下,然后调出MS-DOS命令行,转到C:\Blast\db文件夹下运行格式化命令。 格式化nr.fasta命令: C:\Blast\db>makeblastdb -in nr -dbtype prot -title "nr" -out NR Building a new DB, current time: 08/28/2013 08:59:17 New DB name: T New DB title: nr Sequence type: Protein Keep Linkouts: T Keep MBits: T Maximum file size: 1000000000B Adding sequences from FASTA; added 32044604 sequences in 3134.69 seconds. 因此,本地数据库已经建立完毕。 三、blast的使用方法

相关主题