搜档网
当前位置:搜档网 › Blast本地化详细流程

Blast本地化详细流程

Blast本地化详细流程
Blast本地化详细流程

Blast 2.4.0+本地化详细流程(基于Windows系统)

1.程序获得。从NCBI上下载Blast本地化程序,下载地址:

ftp://https://www.sodocs.net/doc/01516963.html,/blast/executables/blast+/LATEST/

64×安装版▲

64×解压(绿色)版▲

最好安装或解压到X盘根目录:如X:\blast,尽量简短,方便后边命令输入。

2.原始序列获得。方法1:找到转录组测序数据unigene数据库文件:unigene.fasta

或unigene.fa,若为unigene.fa则直接改后缀为.fasta即可。找到或修改后将数据库文件移动至Blast本地化程序目录“X:\blast\bin”。方法2:从NCBI中的ftp 库下载所需要库,链ftp://https://www.sodocs.net/doc/01516963.html,/blast/db/FASTA/,其中nr.gz为非冗余的数据库,nt.gz为核酸数据库,month.nt.gz为最近一个月的核酸序列数据。下载的month.nt.gz先用WINRAR解压缩,然后用makeblastdb.exe格式化。方法3:利用新版blast自带的update_blastdb.pl进行下载,这需要安装perl程序。

注释:上述三种方法各有优缺点,前两种下载速度较快,但是每次进行检索都需要对数据库进行格式化(转化成二进制数据),第三种方法下载速度较慢,但是NCBI 中已经格式化好的,在进行本地检索时不需再进行格式化,直接用即可。

3.用文本编辑器(txt文件改名字及后缀)创建一个ncbi.ini文件,文件包含下

面内容:[NCBI]Data="C:\blast\data\" 先新建TXT文件,然后改属性,将ncbi.ini文件存放到C:\Windows

4.将Blast本地化程序目录添加路径中(该步骤非必须,但会给以后的操作带来

方便),方法:

a)右击我的电脑选择属性,选择高级,点击环境变量,设置环境变量

b)系统变量中,选择Path,点击“编辑”,在变量值的后面添加Blast本地化

程序所在路径,E:\blast 点击确定,将安装路径添加到path。

5.运行MS-DOC。打开DOC窗口(点击开始,选择运行,打开的输入框中输

入“CMD”,确定),访问Blast本地化程序所在文件夹,依次输入:(1)X: 回车;(2)cd blast\bin,回车。

6.数据初始化。下载得到的数据库为fasta格式,需要经过格式转化才能建立本

地数据库。上接第5(2)步,回车后,输入格式化数据库命令:(右键可粘贴)makeblastdb.exe –in xxx.fasta -parse_seqids -hash_index -dbtype prot,回车,在原数据库文件所在文件夹生成一系列文件,Blast本地化体系构建完成。

blast本地化命令▲

blast本地化后生成的文件▲

参数注释:-in参数后面接将要格式化的数据库;-parse_seqids,-hash_index两个参数一般都带上,主要是为blastdbcmd取子序列时使用,-dbtype后接所格式化的序列的类型,核酸用nucl,蛋白质用prot。

7.待比对文件建立。在blast\bin文件夹创建test.txt文件,将需要blast的序列以

fasta格式存于该文件中,文件名自己命名即可,这里以test为例。建立fasta 文件注意事项请查看附件1。若有NCBI上下载好的.fasta文件,直接放到blast\bin文件夹即可。

test.fasta格式文件制作▲

8.本地Blast比对。上接第6步,在MS-DOS窗口输入比对命令:blastn.exe -task

blastn -query test.fasta -db xxx.fasta -out text.txt,稍等片刻,Blast结果即存于系统自动生成的out.txt文件中。blastn.exe -task blastn -query RefGene.txt -db Stellera.Unigene.fasta -out RefGene(test).txt -evalue 1e-5 -num_threads 8

参数注释:blastn.exe为程序执行命令,程序根据自己需要而blastn,blatp,tblastx;

-task后面选择你所要用的程序blastn,blatp,tblastx等;-query 后接查询序列的文件名称;-db后接格式化好的数据库名称;-out 后接输出的文件名称及格式。

by malapidan

2016.08.24

附件1FASTA格式说明

1.构建FASTA格式文件

所有TEST序列输入必须是FASTA格式,所谓FASTA是指DNA 序列第一行开始于一个标识符:">",紧接着(没有空格)是对该序列的唯一描述(即ID),然后一个空格,接着是对该序列的描述(也可以没有),从第二行开始就是一行行的序列,中间的空格,换行没有影响。为了方便阅读,每一行序列最好不要超过80个字母。下面是FASTA格式的示例:

>Mus_AQP11 mRNA for aquaporin 11, complete cds GCGGTGAGGGAGCCATGTCCGCGCTACTGGGACTCCGGCCCGAGGTGCAG GACACCTGCATCTCGCTGGGGCTAATGCTG CTGTTCGTGCTGTTCGTGGGGCTGGCCCGCGTGATCGCCCGGCAACAGCT ACACAGGCCCGTGGTCCACGCCTTCGTCCT GGAGTTTCTAGCTACCTTCCAGCTCTGCTGCTGCACCCACGAGCTCCAAGT GCTGAGCGAGCAGGACTCTGCGCACCCCA CCTGGACTCTGACACTGATCTACTTCTTTTCCTTGGTGCATGGCCTGACCC TGGTGGGCACAGCTAGCAACCCGTGCGGC GTGATGATGCAGATGATTCTGGGGGGTATGTCCCCCGAAATGGGTGCCGT GAGGTTGTTGGCTCAGCTGGTTAGCGCCCT GTGCAGCAGGTACTGCATAAGCGCCCTGTGGAGCCTGAGTCTGACCAAGT ACCATTACGACGAAAGGATCTTAGCTTGCA GGAATCCCATCCACACCGACATGTCCAAAGCGATCATCATAGAGGCCATC TGCTCCTTTATTTTCCACAGCGCTCTACTG CACTTCCAGGAGGTCCGAACCAAGCTTCGCATCCACCTGCTGGCTGCACT CATCACCTTTTTGGCCTATGCAGGAGGGAG CCTCACAGGAGCATTGTTTAACCCAGCGCTGGCACTTTCTCTGCACTTTCC GTGCTTTGACGAACTCTTCTATAAGTTTT TTGTAGTATACTGGCTTGCTCCTTCTGTAGGTGTGCTGATGATGATCCTCA TGTTCAGTTTTTTCCTTCCATGGCTGCAT AACAATCAAATGACTAATAAAAAAGAGTAACCACTCCCAAAGACTCGAA CTAAGTCCCAGGACAGTCAAGCTGGATGCGA CAATCTGAGCACCCTCCAAACTCTGGACGCCTCCTGCTTCAGCTTTCTCTG TGGAA

> Mus_AQP12 mRNA for aquaporin 12, complete cds

CCGGGCCCCCCCTCGATTGGCCAAATCGGCCCTCGAGTTAATTAAATTAAT CCCCCCCCCCCCCGTTGGGCTGTGGGACC AGCCAGTCTCCCACACGTCACCAGGTCCTTGCTCCTTGTAGAACCCAGACT GATGGCCAGTCTGAATGTGTCCCTCTGTT TCTTTTTTGCTACTTGTGCCATCTGTGAGGTGGCTAGAAGGGCATCTAAAG CCCTGCTTCCAGCAGGTACCTATGCCAGT TTTGCCCGGGGGGCAGTAGGCGCAGCCCAGCTGGCAGCCTGCTGCCTGGA GATGCGAGTGTTGGTGGAGCTTGGCCCCTG GGCAGGGGGCTTCGGACCCGACCTGTTGCTGACCCTGGTCTTCCTGCTTTT CCTGGTACATGGGGTCACCTTCGATGGGG CCTCTGCCAACCCCACCGTGGCCCTGCAGGAGTTCCTCATGGTGGAGGCA TCGCTGCCCAACACTCTGCTGAAACTGTCG GCCCAGGTGCTGGGTGCACAGGCTGCCTGTGCCCTGACCCAGCGCTGCTG GGCCTGGGAGCTCAGCGAACTACACTTACT ACAGAGCCTCATGGCTGCACACTGCAGCTCAACCCTGCGTACATCCGTGC TGCAGGGCATGCTCGTGGAGGGTGCCTGCA CCTTCTTCTTCCATCTGAGCCTCCTCCACCTGCAGCACAGCCTTCTTGTCTA CAGGGTGCCTGCCCTGGCCCTGCTGGTC ACTCTCATGGCCTACACAGCAGGGCCCTACACATCTGCCTTCTTCAATCCT GCCCTGGCTGCCTCTGTCACATTCCACTG CCCTGGGAACACCTTGCTGGAGTATGCCCACGTGTACTGCCTGGGTCCTGT CGCAGGGATGATCCTGGCTGTCCTCCTCC ATCAGGGCCACCTTCCCCGCCTTTTCCAGAGAAATCTGTTCTACCGGCAGA AAAGCAAATACCGAACTCCCAGGGGGAAG CTGTCCCCAGGTTCTGTGGACGCCAAGATGCACAAAGGGGAGTAGTGGCA AAGGGCCGTGCCCTACAGGTGCCAGGGCAG CAGCCACTGGGGTCCAGCTGCGCTGTCTCACTCACCGCAGCTTCACTCGCC TCCTGAGAGGTCTGGTCTCCCTGCCACAA AATCATTTGCCAATAAACCACTGTTAAGATCAAAAAAAAAAAAAAAAGA GCTCGGCCATAAGGGCCATAGCTCCAGCTTT TGTTCCCTTTAGTGAGGGTTAATTTCCGAGCTTGGCGTAATCA

2. 从NCBI下载FASTA格式的核酸序列。

当我们在NCBI上搜索到目的基因之后,会出现如下图所示的界面,图中红色方框内的链接均可以点击并且会出现如图中红色长箭头所指的下拉菜单,点击红色小箭头所指的链接即可获得相应的FASTA格式的序列。以图中基因为例,点击NC_000014.8之后将获得该基因的基因组DNA序列(未剪接),点击NM_021257.3 之后将获得该基因剪接之后的mRNA序列,点击NP_067080.1 将获得该基因相应的蛋白质序列。

BLAST+本地化

发表于2015年3月23日由chenwen

1、从NCBI下载对应系统的BLAST+程序

NCBI推荐使用BLAST+,老版本的BLAST已经停止更新!BLAST+与BLAST相比,有很多改进和提高。

BLAST+:

ftp://https://www.sodocs.net/doc/01516963.html,/blast/executables/blast+/LATEST/

老版本BLAST:

ftp://https://www.sodocs.net/doc/01516963.html,/blast/executables/release/LATEST/

2、解压,将程序路径添加到环境变量

我的系统是Ubuntu 14.04 64位,选择的程序是

ncbi-blast-2.2.30+-x64-linux.tar.gz。

tar –zxvf ncbi-blast-2.2.30+-x64-linux.tar.gz

vi ~/.bashrc

在末尾添加:

export PATH=/home/biochen/bin/blast/bin:$PATH

这里的路径视具体情况而定。

更新,使配置生效:

source ~/.bashrc

3、从NCBI下载数据库

下载地址:ftp://https://www.sodocs.net/doc/01516963.html,/blast/db/

有关每个文件的含义请阅读README文件。下面摘录几种:

human_genomic.gz 人类基因组序列

nr.gz 来源于GenPept, Swissprot, PIR, PDF, PDB, and RefSeq的非冗余蛋白质序列

nt.gz 除wgs, gss, sts, pat, est, htg以外的核酸序列,注意不是非冗余的htg.gz 来源于GenBank, EMBL, and DDBJ的高通量基因组测序序列

4、格式化数据库

BLAST+使用makeblastdb命令格式化数据库。老版本BLAST使用formatdb命令。makeblastdb -in db.fasta -dbtype prot -parse_seqids -out db_name

参数说明:

-in:待格式化的序列文件

-dbtype:数据库类型,prot或nucl

-out:数据库名

5、BLAST+运行

BLAST+提供多种比对程序:

blastp: 用蛋白质序列搜索蛋白质序列库

balstn: 用核酸序列搜索核酸库

blastx:核酸序列对蛋白库的比对,核酸序列在比对之前自动按照六个读码框翻译成蛋白质序列

tblastn:蛋白质序列对核酸库的比对,核酸库中的序列按照六个读码框翻译后与蛋白质序列进行比对搜索

tblastx:核酸序列对核酸库在蛋白质级别的比对,两者都在搜索之前翻译城蛋白质进行比对

核酸序列比对核酸数据库(blastn):

blastn -query seq.fasta -out out.txt -db dbname -evalue 1e-5 -num_threads 8

参数说明:

-query:输入文件路径及文件名

-out:输出文件路径及文件名

-db:格式化了的数据库路径及数据库名

-evalue:设置输出结果的e-value值

-num_threads:线程数

其他程序比对跟blastn相似,更多参数可以用-help查询。

6、wwwblast

感兴趣的朋友,还可以通过wwwblast将本地化的blast+制作成像NCBI那样的网页版。

下载地址:

ftp://https://www.sodocs.net/doc/01516963.html,/blast/executables/release/LATEST/

按照官方说明,安装Apache 架设网站和对wwwblast进行简单配置。

Blast本地化详细流程

Blast 2.4.0+本地化详细流程(基于Windows系统) 1.程序获得。从NCBI上下载Blast本地化程序,下载地址: ftp://https://www.sodocs.net/doc/01516963.html,/blast/executables/blast+/LATEST/ 64×安装版▲ 64×解压(绿色)版▲ 最好安装或解压到X盘根目录:如X:\blast,尽量简短,方便后边命令输入。 2.原始序列获得。方法1:找到转录组测序数据unigene数据库文件:unigene.fasta 或unigene.fa,若为unigene.fa则直接改后缀为.fasta即可。找到或修改后将数据库文件移动至Blast本地化程序目录“X:\blast\bin”。方法2:从NCBI中的ftp 库下载所需要库,链ftp://https://www.sodocs.net/doc/01516963.html,/blast/db/FASTA/,其中nr.gz为非冗余的数据库,nt.gz为核酸数据库,month.nt.gz为最近一个月的核酸序列数据。下载的month.nt.gz先用WINRAR解压缩,然后用makeblastdb.exe格式化。方法3:利用新版blast自带的update_blastdb.pl进行下载,这需要安装perl程序。 注释:上述三种方法各有优缺点,前两种下载速度较快,但是每次进行检索都需要对数据库进行格式化(转化成二进制数据),第三种方法下载速度较慢,但是NCBI 中已经格式化好的,在进行本地检索时不需再进行格式化,直接用即可。 3.用文本编辑器(txt文件改名字及后缀)创建一个ncbi.ini文件,文件包含下 面内容:[NCBI]Data="C:\blast\data\" 先新建TXT文件,然后改属性,将ncbi.ini文件存放到C:\Windows 4.将Blast本地化程序目录添加路径中(该步骤非必须,但会给以后的操作带来 方便),方法: a)右击我的电脑选择属性,选择高级,点击环境变量,设置环境变量 b)系统变量中,选择Path,点击“编辑”,在变量值的后面添加Blast本地化 程序所在路径,E:\blast 点击确定,将安装路径添加到path。 5.运行MS-DOC。打开DOC窗口(点击开始,选择运行,打开的输入框中输 入“CMD”,确定),访问Blast本地化程序所在文件夹,依次输入:(1)X: 回车;(2)cd blast\bin,回车。

图解blast验证引物教程

图解blast验证引物教程 1、进入网页:https://www.sodocs.net/doc/01516963.html,/BLAST/ 2、点击Search for short, nearly exact matches 3、在search栏中输入引物系列: 注:文献报道ABCG2的引物为5’-CTGAGATCCTGAGCCTTTGG-3’; 5’-TGCCCATCACAACATCATCT-3’ (1)输入方法可先输入上游引物,进行blast程序,同样方法在进行下游引物的blast程序。这种方法叫繁琐,而且在结果分析特异性时要看能与上游引物的匹配的系列,还要看与下游引物匹配的系列——之后看两者的交叉。 (2)简便的做法是同时输入上下游引物:有以下两种方法。输入上下游引物系列都从5’——3’。 A、输入上游引物空格输入下游引物

B、输入上游引物回车输入下游引物 4、在options for advanced blasting中: select from 栏通过菜单选择Homo sapiens【ORGN】Expect后面的数字改为10 5、在format中: select from 栏通过菜单选择Homo sapiens【ORGN】Expect后面的数字填上0 10

6、点击网页中最下面的“BLAST!” 7、出现新的网页,点击Format! 果。

(1)图形格式: 图中①代表这些序列与上游引物匹配、并与下游引物互补的得分值都位于40~50分 图中②代表这些序列与上游引物匹配的得分值位于40~50分,而与下游引物不互补 图中③代表这些序列与下游引物互补的得分值小于40分,而与上游引物不匹配 通过点击相应的bar可以得到匹配情况的详细信息。 (2)结果信息概要: 从左到右分别为: A、数据库系列的身份证:点击之后可以获得该序列的信息 B、系列的简单描述 C、高比值片段对(high-scoring segment pairs, HSP)的字符得分。按照得分的高低由大到小排列。得分的计算公式=匹配的碱基×2+0.1。举例:如果有20个碱基匹配,则其得分为40.1。 D、E值:代表被比对的两个序列不相关的可能性。【The E value decreases exponentially as the Score (S) that is assigned to a match between two sequences increases】。E值最低的最有意义,也就是说序列的相似性最大。设定的E值是我们限定的上限,E值太高的就不显示了 E、最后一栏有的有UEG的字样,其中: U代表:Unigene数据库 E代表:GEO profiles数据库 G代表:Gene数据库

本地化项目的分层质量管理完整版推荐WORD范文

本地化项目的分层质量管理 崔启亮中国翻译协会本地化服务委员会 质量是企业生存和发展的生命线,质量是赢得客户尊重和行业品牌的竞争力。加强本地化项目质量管理是项目经理的主要工作内容,也是企业追求的生产目标。随着本地化项目的复杂性增加,客户对项目质量的要求不断提高,需要应用项目管理的理念与技术,实现项目的预期目标和客户期望。 1. 本地化与本地化项目管理 本地化是“对产品或服务进行修改以适应不同市场中出现的差异的过程”(Arle,2007:14)。本地化是企业全球化的主要部分,没有本地化,其它全球化努力也达不到预期效果,本地化必须与其它业务流程相结合才能实现高效率。国际上本地化服务起源于20 世纪80 年代的计算机软件行业,我国本地化行业发端于20 世纪90 年代。经过了若干年的发展,本地化已经成为语言服务业中最有活力、最富全球性的组成部分。本地化常常仅被视为“高技术翻译”,但是此观点并没有抓住其重要性、复杂性以及在本地化过程中所发生的实际情况。从本地化的工作内容来看,翻译只是本地化工作的内容之一,本地化通常重点在于产品或服务的非文本部分。实际上,尽管文本部分的翻译很重要,但它只是本地化的一个方面或者一个环节而已。本地化对于企业的重要体现在,通过产品本地化解决语言转换问题、产品功能问题、商业文化问题、技术应用问题,使得产品顺利进入国际市场,并且被不同国家的用户接受。在企业全球化和产品本地化规模不断深化的过程中,以本地化服务为组成部分的语言服务业已经形成并且蓬勃发展,本地化服务的内涵和外延正在深化和扩展。本地化不仅限于软件业,已经扩展到汽车、重型设备和消费品、零售业、媒体和娱乐业、法律、制药业、金融、政府和非盈利团体、食品服务业以及许多其它垂直行业中。尽管软件本地化目前仍然是大部分本地化收入的重要来源,但现在的软件常常只是更大项目的一部分,其中可能包括硬件、文档、网站内容、多媒体的本地化以及产品内容的技术写作。此外,游戏、产品手册、市场材料、电子学习材料都是本地化的处理对象。企业产品的本地化是以项目方式实施的,由具有不同专业技能和经验的人员组成项目团队,通过计划、实施和监控,实现本地化质量、进度、成本、风险、资源的最佳组合。其中,质量管理是任何公司、任何项目经理都最为关注的指标之一,质量决定着客户满意度、公司的信誉和发展,质量是企业的生命线。由于本地化项目的对象、内容和要求千差万别,影响项目质量的因素众多,提高本地化项目质量是对项目团队(特别是本地化项目经理)的重大挑战。从语言服务供应商(LSP)的角度看,本地化是语言技术、翻译技术、软件技术和管理技术紧密结合的服务。以实施软件地化为例,本地化项目分为启动阶段、计划阶段、实施阶段和收尾阶段,包含软件资源文件的抽取、格式转换、术语抽取与翻译、预处理、翻译、编辑、校对、后处理、生成软件本地化安装程序、软件本地化测试、修正本地化缺陷、软件用户说明书排版、最终本地化软件质量检查、修改和提交。本地化项目流程和要求的复杂性,决定了仅控制翻译过程的质量,仅从语段和篇章上控制文本翻译的质量,无法保证项目的质量满足客户的要求。控制本地化项目的质量需要分析客户对项目质量的要求,确定影响项目质量的环境、过程、技术等因素,从整体上进行全程、全员、全面的质量控制。 2. 本地化项目的分层质量管理 根据ISO9000:2000 的定义:质量是一组固有特性满足要求的程度。质量不仅包括产品质量,还包括产品生产过程的质量。质量是动态的指标,随着时间和环境而变化。本地化项目质量是项目过程和结果满足客户要求的程度。根据ISO 对质量的定义,我们认为本地化项目 行业研究·81 ·Chinese Translators JournalNO.2 2013·81 ·质量是客户对项目的满意程度,亦即客户对项目越满意,项目的质量越好。经过对众多本地化客户的 分析发现,客户对本地化项目的过程和最终交付物都比较关注,而项目的过程决定了项目最

试论软件本地化工程师的专业知识

软件本地化技术是融合软件工程、翻译技术和桌面印 刷等知识的综合性技术。在软件本地化项目实现过程中, 一般需要下面四种类型的软件工程师:软件翻译、软件编 译、软件排版和软件测试。根据岗位分工的不同,分别要 求掌握软件翻译、软件编译、软件排版和软件测试等具体 的专业知识。 软件翻译 软件翻译是将软件中的用户界面、帮助文档和使用手册等的文字从一种语言转换为另一种语言的过程。 (1)优秀的语言理解和书面表达能力 对软件开发采用的源语言(绝大多数是英语)文字的准确和迅速理解,是正确翻译的前提。良好的书面表达是保证翻译质量的基础。一名优秀的软件本地化翻译,不仅需要良好的外语基础,还要有良好的本地化语言的书面表达能力。 (2)软件翻译的格式要求和术语表达知识 软件翻译和其他普通文字翻译的区别在于,软件翻译对一些词汇和术语的处理要符合软件的特殊要求,符合软件英语领域的行业标准。 (3)常用翻译工具的安装和操作技能 软件翻译需要安装和使用翻译记忆软件,以便提高翻译的效率和质量。因此,需要快速安装、设置和操作常用翻译工具。 (4)可本地化的资源文件类型及其翻译方式 除了翻译在线帮助文档外,翻译软件的界面字符是软件本地化的工作之一。

需要翻译的字符包括菜单、对话框、屏幕提示、版本信息等类型,这些不同的字符要符合特定的翻译格式。 (5)多个行业领域的技术知识 随着软件技术的发展,需要本地化的软件的种类不断增加,如果具备这些软件的应用领域知识,可以提高翻译的效率和质量。 软件编译 软件本地化编译是以源语言软件为基础,使用本地化的资源文件,创建当地语言安装程序的过程。 (1)软件开发环境的使用经验 软件编译就是编译生成本地化的软件版本,修复本地化软件的软件缺陷,需要熟悉常用软件开发工具的使用。例如,Microsoft Visual Studio和Microsoft Visual https://www.sodocs.net/doc/01516963.html,。另外,如果具有软件开发经验,理解资源文件等的功能,对于修复软件缺陷大有裨益。 (2)软件安装技术和软件使用经验 软件编译后首先要测试是否可以顺利正确地安装。如果出现安装错误,应该尽快排除并重新编译。所以,如果具有常用安装程序的使用经验,有助于排除安装错误。另外,如果能够熟练使用当前编译的软件,则可以提高修复软件缺陷的效率。

NCBI在线BLAST使用方法与结果详解

N C B I在线B L A S T使用方法与结果详解 IMB standardization office【IMB 5AB- IMBK 08- IMB 2C】

N C B I在线B L A S T使用方法与结果详解 BLAST(BasicLocalAlignmentSearchTool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。 BLAST采用一种局部的算法获得两个序列中具有相似性的序列。 Blast中常用的程序介绍: 1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。 2、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。 3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。 4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。 5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。 NCBI的在线BLAST: 下面是具体操作方法 1,进入在线BLAST界面,可以选择blast特定的物种(如人,小鼠,水稻等),也可以选择blast所有的核酸或蛋白序列。不同的blast程序上面已经有了介绍。这里以常用的核酸库作为例子。 2,粘贴fasta格式的序列。选择一个要比对的数据库。关于数据库的说明请看NCBI在线blast数据库的简要说明。一般的话参数默认。 3,blast参数的设置。注意显示的最大的结果数跟E值,E值是比较重要的。筛选的标准。最后会说明一下。 4,注意一下你输入的序列长度。注意一下比对的数据库的说明。 5,blast结果的图形显示。没啥好说的。 6,blast结果的描述区域。注意分值与E值。分值越大越靠前了,E值越小也是这样。7,blast结果的详细比对结果。注意比对到的序列长度。评价一个blast结果的标准主要有三项,E值(Expect),一致性(Identities),缺失或插入(Gaps)。加上长度的话,就有四个标准了。如图中显示,比对到的序列长度为1405,看Identities这一值,才匹配到1344bp,而输入的序列长度也是为1344bp(看上面的图),就说明比对到的序列要长一

软件本地化与国际化的入门知识

软件本地化的入门知识 什么是“本地化?” 人们常说的“本地化”是指在另一个国家正式行销某产品之前,对“原始产品”进行的“修订”。本地化通常不包括对原代码的“修订”。(参阅下面的“什么是国际化”。)本地化包括但不限于以下方面:翻译、文化本地化、DTP、图形处理、编译、测试,等等。 “翻译”和“本地化”的区别是什么? 翻译是本地化的子集。翻译包括把源文字从一种语言转换到另一种语言。然而,当文字被翻译后,必然要对产品相应地进行许多其它更改。这些更改包括技术上和文化上的更改。 技术问题包括: 调整大小 重新编排格式 调整默认设置 重新编译 测试 重新创建图标 创建新的图形 重新编排文档格式 文化问题包括避免使用不恰当或冒犯性的语言 包装 图标 宣传 样品 政治敏感的术语,地方规章和宗教信仰 什么是“全球化?” 人们常说的“全球化”是指进入国际市场的全部过程。这一过程通常有四方面需要考虑。即源代码的国际化、本地化、建立国际品牌策略和国际销售实施。 什么是“国际化?”

人们常说的“国际化”是指任何涉及撰写或改变“原始产品”源代码的行为,从而使该产品在另一个国家能够顺利地销售。通常,源代码的国际化必须在本地化之前进行。国际化方面的例子包括: 实现双字节支持 转换到 UNICODE - 消除硬编码文本 国际化用户界面设计 调整默认设置 - 调整尺寸问题 “国际化”有时是指“赋予产品新的生命力。” 怎样能减少全球化的费用? 对内部员工进行培训,使他们对国际化问题有所了解。 确定在国际市场上拓展的产品。 进行适当的外购,缩短上市时间。 在上市时间与产品质量之间选择适当的优先级。 为您的国际化项目指派一个有经验的项目经理。 选择一个出色的本地化供应商。 给您的合作伙伴、供应商和转包商提供充分的支持。 实施恰当的国际行销和分销策略。 成功的全球化涉及那些重要因素? 资金 产品质量 上市时间 内部员工总数(工作能力与工作量) 在全球化过程中最常见的十个问题是什么? 下面的列表包括了大多数 IT 公司在将他们的产品全球化时,面临的最耗费时间和金钱的问题。由于每个公司和产品是不同的,该列表并不适用于所有情况。向专家咨询来帮助您决定那些方面最适合您的特殊情况。 在本地化之前,产品授权或“国际化” 不适当。包括软件用户界面、帮助、文档和行销材

本地化翻译过程

Demystifying the Costs of Localization and Translation (1) https://www.sodocs.net/doc/01516963.html, ?I already understand localization. Or do I? ?What do translators really do with my product? ?Why is localization so expensive? Introduction ―Why is localization so expensive?!‖ We hear this question a lot from our clients, and at one time we had a short answer for it: Words. Our clients usually just scowled at us when we gave that answer, and so we elaborated a bit: The expense-perspective: You paid to create your English-language product, but because your engineers and writers use English words, it looked to you as though you didn’t pay anything to create it. Now you need to write a fat check to somebody in order to create other versions, and you’re annoyed because ―all they’re doing is translating,‖ which feels like child’s play compared to the work you’ve done. The revenue-perspective: Your investment in the English-language product will be returned by lots and lots of English-speaking people who will give you money because you solved their problems. Similarly, localization is an investment in a [German/Japanese/Korean/Russian/ French/...] product, and this investment will be returned by lots and lots of non-English-speaking people who will give you money for solving their problems. In other words, there is an expense-side and a revenue-side to the coin of localization.

软件本地化外包测试流程分析

软件本地化外包测试流程分析 作者:崔启亮 经济的全球化促进了软件产业的国际化,软件国际化生产和全球服务成为更多国际软件公司的发展策略。软件产品要获得更多的国际市场份额,必须进行软件国际化设计、开发、测试和服务。 按照国际化要求生产的软件称为国际化软件,从实现技术和生产过程分析,国际化软件包括软件国际化和软件本地化两个相辅相成的环节。软件国际化保证软件具有“全球可用”的内在特征,而软件本地化可以满足目标市场的用户在语言、文化和功能的需要。 一、国际化软件开发流程 对于国际化软件而言,完整地开发周期将包括需求分析、国际化、本地化、发布和维护等过程。其中国际化包括设计、开发和测试等,在国际化的各个环节都要重视软件的本地化能力。 国际化软件的开发流程包括开发国际化软件需要遵循软件工程的要求,分为需求分析、软件设计、软件编码、软件测试、质量保证、软件发布等过程。国际化软件的开发流程如下图所示: 在需求分析阶段,既要考虑软件的功能需求,也要考虑软件的国际化需求。另外,为了缩短源语言开发的版本和本地化版本的发布时间间隔(甚至达到同步发布),国际化版本的开发应该与软件本地化过程同时进行。在测试方面,对国际化版本的国际化功能测试和对本地化版本的本地化测试尽可能同时进行,以便尽早发现和修改国际化设计错误。 二、软件本地化测试阶段 软件本地化是国际化软件开发的一个重要阶段,软件本地化是将一个软件产品按特定国家 / 地区或语言市场的需要进行加工,使之满足特定市场上的用户对语言和文化的特殊要求的软件生产活动。 为了保证本地化软件在语言、外观和功能方面符合本地用户的最终需要,需要再国际化软件生产过程中后期的软件本地化阶段进行本地化测试。

blast验证引物教程1

图解blast验证引物教程 ——以文献报道的人类的ABCG2的引物为例 1、进入网页:https://www.sodocs.net/doc/01516963.html,/BLAST/ 2、点击Basic BLAST中的nucleotide blast选项 3、完成2操作后就进入了Basic Local Alignment Search Tool界面 (1)在Enter Query Sequence栏中输入引物序列: 注:文献报道ABCG2的引物为5’-CTGAGATCCTGAGCCTTTGG-3’; 5’-TGCCCATCACAACATCATCT-3’ 简便的做法是同时输入上下游引物。输入上下游引物系列都从5’—3’。输入上游引物后,加上≥20个字母n,再输入下游引物,如下图:

(2)在Choose Search Set栏中: Database根据预操作基因的种属定了,本引物可选Human genomic + transcript或 Others (nr etc.)。本人倾向于选后者,觉得此库信息更多。如下图: (3)在Program Selection中:选择Somewhat similar sequences (blastn)项,如下图: (4)在此界面最下面:如下图 Show results in a new window项是显示界面的形式,可选可不选,在此我们选上了。关键要点击Algorithm parameters参数设置,进入参数设置界面。 4. 参数设置: (1)在General Parameters中:Expect thresshold期望阈值须改为1000,大于1000也可以; 在Word size的下拉框将数字改为7。如下图:

图解blast验证引物教程1

图解blast 验证引物教程 ——以文献报道的人类的ABCG2的引物为例 1、 进入网页:https://www.sodocs.net/doc/01516963.html,/BLAST/ 2、 点击Basic BLAST 中的nucleotide blast 选项 3、 完成2操作后就进入了Basic Local Alignment Search Tool 界面 (1)在Enter Query Sequence 栏中输入引物序列: 注:文献报道ABCG2的引物为5’-CTGAGATCCTGAGCCTTTGG-3’; 5’-TGCCCATCACAACATCATCT-3’ 简便的做法是同时输入上下游引物。输入上下游引物系列都从5’— 3’。 输入上游引物后,加上≥20个字母n ,再输入下游引物,如下图: 生 物 秀

(2)在Choose Search Set 栏中: Database 根据预操作基因的种属定了,本引物可选Human genomic + transcript 或Others (nr etc.)。本人倾向于选后者,觉得此库信息更多。如下图: (3)在Program Selection 中:选择Somewhat similar sequences (blastn)项,如下图: (4)在此界面最下面:如下图 生物秀-专心做生物 w w w .b b i o o .c o m

Show results in a new window 项是显示界面的形式,可选可不选,在此我们选上了。关键要点击Algorithm parameters 参数设置,进入参数设置界面。 4. 参数设置: (1)在General Parameters 中:Expect thresshold 期望阈值须改为1000,大于1000也可以;在Word size 的下拉框将数字改为7。如下图: (2)Scoring Parameters 无须修改 (3)Filters and Masking 中,一般来说也没有必要改 5.点击最下面一栏的BLAST 按钮,如图: 6.点击BLAST 按钮后,跳转出现如下界面: 7. 等待若干秒之后,自动跳转出现显示BLAST 结果的网页。该网页用三种形式来显示blast 的结果。 生物秀-专心做生物 w w w .b b i o o .c o m

Blast本地化安装图解

Blast本地化:window平台下blast软件的安装boyun发表于 2009-07-09 17:08 | 阅读 1 views 1.对于windows 2000/xp 用户,下载blast- 2.2.18-ia32-win32.exe安装文件 ftp://https://www.sodocs.net/doc/01516963.html,/blast/executables/LATEST/blast- 2.2.18-ia32-win32.exe 2.创建一个新目录,例如C:\blast,将下载的文件blast-2.2.18-ia32-win32.exe复制到该目录,双击这个文件,自解压产生bin、data、doc 三个目录,bin是程序目录,data是程序使用数据的目录,doc是文档目录。 表:bin目录中的程序 程序说明 bl2seq.exe进行两条序列比对 blastall.exe做普通的blast比对 blastclust.exe blastpgp.exe copymat.exe fastacmd.exe通过gi号,接收号等,在数据库中检索序 列 formatdb.exe格式化数据库 formatrpsdb.exe impala.exe makemat.exe megablast.exe megablast程序 rpsblast.exe seedtop.exe 3.用文本编辑器创建一个ncbi.ini文件,文件包含下面内容:[NCBI] Data="C:\blast\data\" 将ncbi.ini文件存放到系统的Windows 或者 WINNT目录。 4.将”C:\blast\bin”目录添加路径中(该步骤非必须,但会给以后的操作带来方便),方法:

本地化服务方案

(五)本地化服务方案 为更好的做好XXXX询服务工作,我们经过严格的考察和筛选,充分结合各自的优势,安徽XXXXXX致力于为本项目业主提供专业、高端的造价咨询服务,除为本项目提供基准的本地化服务外,同时拥有较多方面优势。 针对本项目的本地化优势:1、公司为本地注册企业,从事工程造价咨询服务已近10年,并跻身于省内行业前列。公司拥有相应咨询、管理人才100余人,其中注册类人员占比40%以上。公司经过多年业务发展,在本项目沿线均设有分支机构(如分公司等),可以随时接受公司调遣,为本项目实现人、财、物供给。 2、项目班子组成方案及优势 针对本项目为XXXX询服务,项目战线长、专业涵盖范围广、要求高等特点,我公司精心选派13名资深专业人员服务本项目。项目组成员均为国家注册造价类或会计类人员,绝大多数为相应专业工程师及以上职称,且项目组成员均为类似造价咨询服务项目提供过技术咨询,技术力量雄厚,专业经验丰富 3、项目管理方案及优势 我公司对本项目均高度重视,项目一旦中标,即成立以我公司总经理及以上级别高管担任的项目领导小组,审批本项目具体实施方案,对重大事项做出及时合理决策,并参与本项目重要成果的讨论。 我公司针对本项目特点,对本项目制定专门管理办法,统一工作标准和管理制度,并要求双方工作人员共同遵守。 @ 我公司对项目负责人授权,赋予项目经理对人员统一办公、统一管理、统一调配、统一指挥、统一考核、统一奖惩“六个统一”权限。 我公司已就本项目实施过程中使用的全部造价管理软件达成一致,已就可能存在的技术问题进行探讨并形成预案,项目成员将在项目实施过程中积极办公、工作。 我公司已在其他项目实施中有过工作经验,对于实施中可能出现的问题,已拥有多种经验的处理办法。 4、人、财、物资源支持方案及优势

核酸BLAST

核酸BLAST: ?blastn程式——核酸序列比对。 ?MegaBLAST——可搜寻一批EST序列、长序列cDNA或基因体序列。 BLAST——Basic Local Alignment Search Tool——核酸与蛋白质序列比对工具。BLAST网页提供BLAST(Basic Local Alignment Search Tool)程式、概述、使用说明与常见问题解答(网址:https://www.sodocs.net/doc/01516963.html,/BLAST/)。 BLAST Program Selection Guide: https://www.sodocs.net/doc/01516963.html,/blast/producttable.shtml#tab31

在做BLASTn的时候,系统会给出三个程序选项,分别是Highly similar sequences (megablast), More dissimilar sequences (discontiguous megablast),Somewhat similar sequences (blastn) 。 第一个选项megablast是对高度相似DNA序列间的比较。鉴别一段未知DNA序列的最好办法就是看看在公共数据库中这段序列是否存在。Megablast就是对那些具有高度相似(相似性95% 以上)的长序列片断所特别设计的一种序列比较工具。Megablast除了提供序列联配的显著性期望值域之外,还提供了一种百分值域。在进行序列比较时,用户可以同时调整这两个参数以优化搜索结果。 第二个选项discontiguous megablast,当序列之间的差异比megablast大时,一般选用这个程序。其算法的基本原理是将查询序列分为一个一个的小片断,我们把它叫做字,通过字与数据库序列相比较,如果能够精确匹配,则以这个字为种子向两边延伸,从而获得符合我们要求的相似性序列。discontiguous megablast所应用的字是不连续的,这使得他的搜索精确性在三种搜索程序中是最高的。其模板类型选项分为三种编码(0),非编码(1),两者都有(2)。在编码模式中,根据第三位碱基的摆动原理,只要第一个和第二个碱基能够精确匹配,那么第三个碱基可以忽略,不做比较。在字的长度相同的情况下,discontiguous megablast的精确度要高于blastn。 第三个选项Somewhat similar sequences (blastn),这个程序比较的序列其相似程度可以非常低。它采用的算法与discontiguous megablast相同,只不过它的字是连续的。Blastn的字要比megablast短,所以其精确度要高于megablast,但是运算速度要慢一些。 注:字是影响blast灵敏度的一个主要参数,其取值要根据具体情况具体而定。 NCBI BLASTn: https://www.sodocs.net/doc/01516963.html,/public_documents/vibe/details/NcbiBlastn.html

实施软件本地化工程

实施软件本地化工程 发布时间:2004-9-3 9:58:00 软件本地化项目正式实施的初始阶段是进行软件资源文件工程处理。包括评估与准备、资源文件抽取、标识资源文件、检查翻译后的资源文件、调整用户界面尺寸、编译本地化软件、修复软件缺陷等。 1、抽取资源文件 (Leverage) 为了便于工程处理,需要本地化的源语言的资源文件包含在翻译数据库 (TDB) 中,由软件供应商提供。 为了抽取和重复利用已经翻译的资源,需要使用正确版本的本地化工具软件对源语言翻译数据库进行工程处理。有些软件供应商使用它们自己开发的本地化工具,也有的使用业界专业的本地化工具,例如 Alchemy Catalyst 和 Pass Passolo 等。 在进行资源文件抽取和重复利用前,要准备好前一版本的已经翻译过的翻译数据库。如果是第一次进行软件本地化,由于一些本地化工具软件支持术语表的导入,则在软件供应商确认的情况下,尽可能利用软件供应商的其它软件产品的术语表和本地操作系统的术语表。 在进行抽取和重复利用时,应该对本地化工具进行正确的设置,例如,源语言、目标语言、代码页、默认目标字体、提取选项、前一版本的已经翻译的翻译数据库等。 经过抽取和重复利用处理得到的翻译数据库,只包含新增的和更新的需要翻译的源语言字符。除了提供这个数据库,还要使用本地化工具的统计功能,提供全部需要翻译字符的数量(包含新增的和更新的),以便翻译团队估计任务量,分配翻译资源。 2、标识资源文件 (Mark) 如果源语言软件进行了很好的国际化设计,那么资源文件中包含了全部需要翻译的内容。但是,实际上不少软件的国际化设计并不完美,相应地,资源文件中包含了一些不需要翻译的内容,例如,变量和命令选项。另外,资源文件中的某些条目可能需要根据不同的目标区域语言,分别进行不同的本地化处理。因此,在将抽取处理的翻译数据库进行翻译前,软件工程师需要对这些不需要翻译的和需要特殊处理的条目,添加标识注释。 通常添加的标识类型如下: 不需要翻译 不要超过 n 个字符长度 重复利用操作系统中的翻译,需要审阅 本字符串与 ID:xx 字符串组成串联字符串 不要删除热键符号 保留字符结尾的空格 不要改变变量的顺序 3、检查资源文件 (Validate) 本地化工程师要在编译本地化软件前,对资源文件的翻译语言质量进行检查。由于资源文件通常使用翻译记忆软件进行翻译,因此翻译数据库中标识的内容,通常不能导出到适合翻译的文档中,从而这些标识的条目可能不能被正确处理。因此,应该重点检查标识部分的翻译的正确性。另外,在翻译数据库导出/导入到翻译记忆工具软件支持的文件格式过程,以及翻译过程中,可能会引起翻译格式和内容的错误。 检查方法首先是利用软件本地化工具的检查功能,例如,Alchemy Catalyst 的 Validate Expert(检查专家)。其次,人工检查翻译数据库中被标识的内容。 需要检查的元素如下:

Radialix-软件本地化工具-使用教程Word版

Radialix 是一款功能比较强大的软件本地化工具,支持以 VC++、Delphi、.Net 等语言编写的软件、以及 INI 格式文本文件的本地化。尤其是它具有非标资源的本地化功能、以及可以设置更多的资源属性。以下是开发商的描述。 - PE32、PE32+ 文件、.NET 程序集,资源和各类文本文件的本地化 - 加载子程序集的 .NET 程序集的本地化 - 非标(硬编码)字符串的本地化 - IDA 插件 - Unicode 支持 - 自动翻译、包括模糊翻译 - 机器翻译 - 翻译验证检查 - 对话框、窗体和菜单的所见即所得可视化编辑 - 导出和导入 CSV、TMX 和 TXT 文件 - 翻译记忆编辑器 - XML 格式的方案文件 下面是软件界面 要汉化编辑一个程序的资源首先要导入这个程序,点击【文件】【新建】【新建本地化方案】

在打开的窗口中点击【添加文件】浏览选择要打开的程序 弹出【文件属性】窗口中【目标构建操作】选项选择【创建本地话文件】

注:如果要编辑非编资源切换到【非标字串】选项勾选【提取非标字串】

其他可以保持默认点击【确定】后如果不继续添加需要编辑的程序就在弹出窗口继续点击【下一步】,然后来到语言添加界面双击简体中文添加到下方列表中。

【下一步】继续弹出信息窗口根据提示自行填写一下,也可不填直接点击【完成】. 等待程序载入完毕可以发现程序中所有能识别的资源的在左侧窗口列出来了,点击找到相关项目列表后直接在右侧窗口进行编辑即可。

编辑完毕后点选相关项目后右键点选【“切换”只读】 等待全部编辑完毕后点击【翻译】菜单栏点击【构建全部】即可在程序原目录生成名字后缀为【_CHS.exe】的程序,这个就是编辑后生成的文件。

软件开发标准化工作流程

目录 1 引言......................................................错误!未定义书签。 编写目的..........................................错误!未定义书签。 适用范围..........................................错误!未定义书签。 定义..............................................错误!未定义书签。 流程图............................................错误!未定义书签。 2 需求调研..................................................错误!未定义书签。 概述..............................................错误!未定义书签。 需求调研..........................................错误!未定义书签。 注意事项..........................................错误!未定义书签。 3 可行性分析................................................错误!未定义书签。 4 需求分析..................................................错误!未定义书签。 概述..............................................错误!未定义书签。 产物/成果.........................................错误!未定义书签。 需求分析任务......................................错误!未定义书签。 需求分析方法......................................错误!未定义书签。 原型化........................................错误!未定义书签。 需求报告..........................................错误!未定义书签。 划分需求的优先级..................................错误!未定义书签。 评审需求文档和原型................................错误!未定义书签。 5 系统设计..................................................错误!未定义书签。 概述..............................................错误!未定义书签。 产物/成果.........................................错误!未定义书签。 产品设计..........................................错误!未定义书签。 概述..........................................错误!未定义书签。 流程图........................................错误!未定义书签。

NCBI在线BLAST使用方法与结果详解

NCBI在线BLAST使用方法与结果详解 BLAST(Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA 数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。 BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。 Blast中常用的程序介绍: 1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。 2、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。 3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。 4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。 5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。 下面是具体操作方法 1,进入在线BLAST界面,可以选择blast特定的物种(如人,小鼠,水稻等),也可以选择blast所有的核酸或蛋白序列。不同的blast程序上面已经有了介绍。这里以常用的核酸库作为例子。

2,粘贴fasta格式的序列。选择一个要比对的数据库。关于数据库的说明请看NCBI在线blast数据库的简要说明。一般的话参数默认。 3,blast参数的设置。注意显示的最大的结果数跟E值,E值是比较重要的。筛选的标准。最后会说明一下。

NCBI中Blast种类及使用简介

NCBI中Blast种类及使用简介 NCBI中Blast种类简介 1. Blast Assembled Genomes 在一个选择的物种基因组序列中去搜索。 2.Basic Blast 2.1 nucleotide blast--- 用核酸序列到核酸数据库中进行搜索,包括3个程序 2.1.1 Blastn----核酸序列(n)到核酸序列数据库中搜索,是一种标准的搜索。 2.1.2 megablast----该程序使用“模糊算法”加快了比较速度,可以用于快速比较两大系列序列。可以用来搜索一匹ESTs序列和大的cDNA或基因组序列, 适用于由于测序或者其他原因形成的轻微的差别的序列之间的比较 2.1.3 discontiguous megablast----与megablast不同的是主要用来比较来自不同物种之间的相似性较低的分歧序列。 2.2 Protein Blast 2.2.1 Blastp ---蛋白质序列到蛋白质序列数据库中搜索,是一种标准的搜索。 2.2.2 psi-blast---位点特异迭代BLAST —用蛋白查询来搜索蛋白资料库的一个程式。所有被BLAST发现的统计有效的对齐被总和起来形成一个多次对齐,从这个对齐,一个位置特异的分值矩阵建立起来。这个矩阵被用来搜索资料库,以找到额外的显著对齐,这个过程可能被反复迭代一直到没有新的对齐可以被发现。 2.2.3 PHI-BLAST---以常规的表达模型为特别位置进行PSI - BLAST检索,找出和待查询序列具有一样的表达模型且具有同源性的蛋白质序列。 2.3 Translating BLAST 2.3.1 blastx----先将待查询的核酸序列按6 种读框翻译成蛋白质序列,然后将翻译出的蛋白质序列与NCBI 蛋白质序列数据库比较。 2.3.2 tblastn-----先将核酸序列数据库中的核酸序列按6 种读框翻译成

相关主题