搜档网
当前位置:搜档网 › 常用生物信息学软件

常用生物信息学软件

常用生物信息学软件
常用生物信息学软件

常用生物信息学软件

一、基因芯片

1、基因芯片综合分析软件。

ArrayVision 7.0 一种功能强大的商业版基因芯片分析软件,不仅可以进行图像分析,还可以进行数据处理,方便protocol的管理功能强大,商业版正式版:6900美元。

Arraypro 4.0 Media Cybernetics公司的产品,该公司的gelpro, imagepro一直以精确成为同类产品中的佼佼者,相信arraypro也不会差。

phoretix? Array Nonlinear Dynamics公司的基因片综合分析软件。

J-express 挪威Bergen大学编写,是一个用JA V A语言写的应用程序,界面清晰漂亮,用来分析微矩阵(microarray)实验获得的基因表达数据,需要下载安装JA V A运行环境JRE1.2后(5.1M)后,才能运行。

2、基因芯片阅读图像分析软件

ScanAlyze 2.44 ,斯坦福的基因芯片基因芯片阅读软件,进行微矩阵荧光图像分析,包括半自动定义格栅与像素点分析。输出为分隔的文本格式,可很容易地转化为任何数据库。

3、基因芯片数据分析软件

Cluster 斯坦福的对大量微矩阵数据组进行各种簇(Cluster)分析与其它各种处理的软件。

SAM Significance Analysis of Microarrays 的缩写,微矩阵显著性分析软件,EXCEL软件的插件,由Stanford大学编制。

4.基因芯片聚类图形显示

TreeView 1.5 斯坦福开发的用来显示Cluster软件分析的图形化结果。现已和Cluster成为了基因芯片处理的标准软件。

FreeView 是基于JA V A语言的系统树生成软件,接收Cluster生成的数据,比Treeview 增强了某些功能。

5.基因芯片引物设计

Array Designer 2.00 DNA微矩阵(microarray)软件,批量设计DNA和寡核苷酸引物工具

三、序列综合分析

V ector NTI Suite 8.0 不喜欢装备各种专业性强的软件,而希望用一个综合性的软件代替的同志可以选择本软件。本阶段的大部分功能它都有。该软件具体特有良好的数据库管理(增加、修改、查找),对要操作的数据放在一个界面相同的数据库中统一管理。软件中的大部分分析可以通过在数据库中进行选定(数据)->分析->结果(显示、保存和入库)三步完成。在分析主界面,软件可以对核酸蛋白分子进行限制酶分析、结构域查找等多种分析和操作,生成重组分子策略和实验方法,进行限制酶片段的虚拟电泳,新建输入各种格式的分子数据、

加以注释,输出高质量的图像。Vector NTI Suite还有以下独立的分析程序,完成相关分析。这些独立的程序,可以通过选定->分析->结果三步调用。

l 3DMol-显示PDB格式分子的三维结构

l Align X-序列相似性比较

l Align Xblocks-序列局部完全相同比较

l ContigExpress-将小片段拼装成长序列

l GCGConverter-GCG格式文件转换成NTI的格式

l PubMed/Entrez Search-搜索PubMed、PDB、GenBank

l Back Translation-核酸->蛋白->核酸反向翻译的工具

l Matrix Editor-矩阵数据编辑

l Tools Manager-连接其他程序和网络连接的界面。分成Align、Analyze、Assemble、Tools四部分。

DNAStar5.03 即著名的Lasergene Suite,由EditSeq MegAlign、GeneQuest MapDraw PrimerSelect Protean SeqMan II七个模块组成,该软件的MegAlign模块,可以对多达64000的片段进行拼装。整个拼装过程即时显示,并提示可能的完成时间。拼装结果采用序列、策略等方式显示。DNAstar是哈佛大学医学院是使用的序列分析软件,可见其功能强大。

Omiga 2.0实际上,大部分对核酸蛋白的序列分析功能,在Omiga 2.0中都能找到;而且界面非常友好。Omiga作为强大的蛋白质、核酸分析软件,它还兼有引物设计的功能。主要功能:编辑、浏览、蛋白质或核酸序列,分析序列组成。用Clustal. W进行同源序列比较,发现同源区。实现了核酸序列与其互补链之间的转化,序列的拷贝、删除、粘贴、置换以及转化为RNA链,以不同的读码框、遗传密码标准翻译成蛋白质序列。查找核酸限制性酶切位点、基元(Motif)及开放阅读框(ORF),设计并评估PCR、测序引物。查找蛋白质解蛋白位点(Proteolytic Sites)、基元、二级结构等。查寻结果可以以图谱及表格的显示,表格设有多种分类显示形式。利用Mange快捷键,用户可以向限制性内切酶、蛋白质或核酸基元、开放阅读框及蛋白位点等数据库中添加或移去某些信息。每一数据库中都设有多种查寻参数,可供选择使用。用户也可以添加、编辑或自定义某些查寻参数。可从MacVectorTM、Wisconsin PackageTM等数据库中输入或输出序列。另外,该软件还提供了一个很有特色的类似于核酸限制酶分析的蛋白分析,对蛋白进行有关的多肽酶处理后产生多肽片段。

DS gene : Omiga 2.0的换代产品,accelrys公司Discovery studio系列,accelrys公司的insight II,GCG是业内蛋白分析和核酸分析的权威软件,DS gene 是GCG的个人机简版,功能强大,而且可以直接与GCG服务器相连。由于受到vector NTI的界面影响,DS gene 与Omiga 2.0相比界面有了很大的改变。

DNASIS for Windows 2.5版是日立软件公司(Hitachi Sofeware Engineering Co.,Ltd.)97年推出的一个功能强大的序列分析软件。包含有大部分分子生物学软件的常用功能,可进行DNA,RNA,蛋白质序列的编辑和分析,甚至还能进行质粒作图、数据库查询等功能,足可满足一般实验室的要求。在DOS时代,DNASIS 7等版本便是流传甚广并曾给过许多人以帮助的分子生物学软件,因此我们有理由期待Win版的DNASIS 会带给我们惊喜。DNASIS MAX 1.0 DNASIS 2.5的更新换代产品。综合序列分析软件,体积比上一个版本一下膨胀了许多。界面风格也改变了很多。

DNA Tools 5.1 与Omiga, DNAsis, PCgene等软件属于同一类的综合性软件,操作简单功能多。DNATools设计的用户友好、强壮,以便快速、方便地获取、贮藏和分析序列及数据库查询获得的序列相关信息。DNA Tools包容性很好,能把几乎所有文本文件打开作为序列。当程序不能辨别序列的格式时(通过寻找常用序列格式的特征),会显示这个文件的文本形式,以便你编辑生成正确的蛋白质或DNA序列,编辑后可以再被载入程序。若你的序列是

DNATools格式时(DNA或寡核苷酸序列),程序不加注解的载入序列,程序模式调整成可以接受载入的数据类型(蛋白质、DNA和寡核苷酸引物序列)。在一个项目中可以加入几千个序列或引物,并在整个项目中分析这些序列及标题。这个程序的一个特点是给每个序列或引物添加文本标题。这样就可以用自定义的标题识别序列,而不必通过它们的文件名。

Bioedit一个具有序列简单分析和序列对比功能的软件。该软件有一个简单亲切的界面,集成其他已经很有效果的序列比对软件。另外该软件还有很多有用的相关站点连接。虽然该软件看起来结构简单,但却又很强的可充性,可以自由整合许多软件,例如viewtree.

Jellyfish 2.1 只水母不简单,可以用来进行DNA翻译,序列排队比较,限制酶消化,提交序列进行BLAST,研究项目管理等。操作十分简单,只需拖动与点击便可。

Genetools Genebio公司的核酸序列分析软件,虽然不及vect NTI 和DS gene 强大,它具有repeat /vect find 使其他分析软件所不具有的,值得一提的是该软件具有的CpG island 分析。

DNAMAN 限制酶分析,引物设计,对排(aligment),翻译,数据库操作,Blast,序列装配(Sequence assembly).易学易用,操作方便。

二、RNA二级结构

RNA Structure 3.5 RNA Sturcture 根据最小自由能原理,将Zuker的根据RNA一级序列预测RNA二级结构的算法在软件上实现。预测所用的热力学数据是最近由Turner实验室获得。提供了一些模块以扩展Zuker算法的能力,使之为一个界面友好的RNA折叠程序。允许你同时打开多个数据处理窗口。主窗口的工具条提供一些基本功能:打开文件、导入文件、关闭文件、设置程序参数、重排窗口、以及即时帮助和退出程序。RNAdraw中一个非常非常重要的特征是鼠标右键菜单打开的菜单显示对鼠标当前所指向的对象/窗口可以使用的功能列表。RNA文库(RNA Library)用一种容易操作的方式来组织你所有的RNA数据文件。基本配置:Windows95,Windows98或WindowsNT。Pentium以上芯片,32兆内存。

RNAdraw 是一个进行RNA二级结构计算的软件。1. 它是Windows下的多文档窗口(multipledocument interface) 软件,允许你同时打开多个数据处理窗口。主窗口的工具条提供一些基本功能:打开文件、导入文件、关闭文件、设置程序参数、重排窗口、以及即时帮助和退出程序。2. RNAdraw中一个非常非常重要的特征是鼠标右键菜单打开的菜单显示对鼠标当前所指向的对象/窗口可以使用的功能列表。3. RNA文库(RNA Library)用一种容易操作的方式来组织你所有的RNA数据文件。

loopDloop 2.07b Java语言写成的绘制RNA二级结构的软件,需要安装JA V A虚拟机。

Circles 0.1.0 Java语言写成的绘制RNA二级结构的软件,需要安装JA V A虚拟机。

四、限制酶切位点分析

DNAssist2.0 大多软件只对线性序列进行分析,那么cNNNNN…NNNgaatt环状的序列就找不到EcoR I的位点。DNAssist 1.0能很容易把这个EcoR I位点找出来。另外DNAssist 在输出上非常完美,除了图形、线性显示外,还有类似DNASIS的列表方式,列出有的位点(按酶排列,按碱基顺序排列)。

五、质粒绘图

Gene Construction Kit 2.0 这一个非常好的质粒构建软件包。与大多数分析的软件不同,它制作并显示克隆策略中的分子构建过程;包括质粒构建,模拟电泳条带;当然还可以质粒作图(有无序列均可)。通过它绘出来的图还可以继续用来构建克隆策略图谱。只是该软件

由于功能太强,使用起来也不简单;幸亏它附有详细的使用帮助,认真研究后,应该没有问题。

Winplas 2.6 该软件用来绘制发表质量的质粒图,可广泛应用与论文、教材的质粒插图。其特性包括:1.知道序列或不知序列结构均能绘制质粒图;2. 可读入各种流行序列格式文件引入序列信息;3. 自动识别限制位点可构建序列结构,功能包括:从文件插入序列、置换序列、序列编辑、部分序列删除等;4. 绘图功能强大,功能包括:位点标签说明、任意位置文字插入、生成彩图、线性或环形序列绘制、可输出到剪贴板、可输出到图像文件;5. 限制酶消化分析报告输出与序列输入报告功能。

Plasmid Premier2.02 是由加拿大的Premier Biosoft公司推出的用于质粒作图的专业软件,主要用于进行质粒作图,质粒特征分析和质粒设计。其主要界面分为序列编辑窗口(Genetank),质粒作图窗口(Plasmid Design),酶切分析窗口(Restriction Sites)和纹基分析窗口(Motif)。打开程序就可进入序列编辑窗口,可以直接打开Genbank或Vector数据库中已知质粒的序列文件,将序列读入,并将有关于质粒的各种特征,包括编码区,启动子,多克隆位点以及参考文献等信息保存在Header中;也可以直接输入序列进行未知质粒的设计。

Redasoft Visual Cloning 2000 用来帮助生命科学家快速而轻松地绘制专业级质量的质粒载体图,主要的性能包括:快速和轻松地生成一个清晰,色彩鲜明的环行或线性的载体图。自动识别和解析序列文件。新增的web浏览功能允许你链接到数据库站点,并支持下载和自动将序列文件转换成载体图。强大的限制性内切酶分析功能和拥有将近1000种来自REBASE的限制性内切酶。片段的删除和插入完全模拟克隆实验并和其他图形兼容。所看即所得(What You See Is What You Get)的编辑环境使得你的打印结果和你在屏幕上看到的保持一致。自动标记各种区段的碱基位置以避免重叠。可选择的图形比例尺使几个构造图间很容易比较。允许质粒图拷贝到剪贴板并粘贴到其他Windows应用程序。可以用e-mail的方式传递载体图。

SimVector 质粒图绘制软件,绘制发表质量的质粒图与序列、载体图。

Clone Manager 小巧的研究人员日常使用的辅助克隆工具,主要功能是限制酶切割、分子重组、质粒作图等。

六、引物分析

Primer Premier 5.0 顾名思义,该软件就是用来进行引物设计的。可以简单地通过手动拖动鼠标以扩增出相应片段所需的引物,而在手动的任何时候,下面显示各种参数的改变和可能的二聚体、异二聚体、发夹结构等。也可以给定条件,让软件自动搜索引物,并将引物分析结果显示出来。而且进行这些操作非常简单

Oligo 6.57 引物分析著名软件,主要应用于核酸序列引物分析设计软件,同时计算核酸序列的杂交温度(Tm)和理论预测序列二级结构。

Primer D'Signer 1.1 免费的引物设计辅助软件,专门用于pASK-IBA和pPR-IBA表达载体,简化引物设计工作。

Array Designer 2.00 DNA微矩阵(microarray)软件,批量设计DNA和寡核苷酸引物工具

Beacon Designer 1.01 PCR定量分析分子信标(Molecular beacon )设计软件

NetPrimer 于WEB界面的引物设计程序,1.8M,包括JA V A程序和帮助文件,解压后,可在本地直接使用,不须再连到原始网站使用。

七、蛋白二级结构分析

ANTHEPROT 4.5 是位于法国的蛋白质生物与化学研究院(Institute of Biology and Chemistry of Proteins)用十多年时间开发出的蛋白质研究软件包。软件包包括了蛋白质研究领域所包括的大多数内容,功能非常强大。应用此软件包,使用个人电脑,便能进行各种蛋白序列分析与特性预测。更重要的是该软件能够提供蛋白序列的一些二级结构信息,使用户有可能模拟出未知蛋白的高级结构。

Peptool, 与genetool同出一家,可以进行氨基酸序列的二级结构预测,motif的寻找,酶切片断的分析,以及转录后的甲基化分析。是为数不多的蛋白分析软件。

VHMPT (Viewer and editor for Helical Membrane Protein Topologies)是螺旋状膜蛋白拓扑结构观察与编辑软件,可以自动生成带有跨膜螺旋的蛋白的示意性2维拓扑结构,并可对拓扑结构进行交互编辑。由**生物医学科学研究所的黄明经博士编制。安装Tcl 8.0 (2.6M)方可运行。

MACAW 序列构建与分析工作台软件(Multiple Alignment Construction & Analysis Workbench, MACAW)是一个用来构建与分析多序列片段的交互式软件。MACAW具有几个特点:1. 新的搜索算法查寻类似区,消除了先前技术的许多限制。 2. 应用一个最近发展的数学原理计算block类似性的统计学显著性。 3. 使用各种视图工具,可以评估一个候选block包含在一个多序列中的可能性。4.可以很容易地编辑每一个block。

十一、数据统计类软件

SAS世界排名第一,专业性极强,能做各种统计,是FDA唯一批准有效的统计软件。但人机对话不方便,主要是类似DOS下的命令操作,最新的8.0版本,稍有改进,鼠标操作性较好,若今后能进一步改进操作的话,其应用将大大广泛。是专业统计人员的首选软件。

SPSS,世界排名第二,最新版本11.01,其特点:功能强大,易于操作,简单明了,人机对话方便,数据库接口丰富,最新SPSS可以读出SAS数据,是业余人员的首选。最新版本纠正以往的不稳定、运行速度慢的缺点。11.0运行速度是10.0的十倍以上,主要原因是SPSS公司将原有的内核全部更换了。但SPSS分为不同版本,如basic版、standard版和advance版。许多复杂的统计功能只在advance版中才出现,如复杂多元相关、神经网络统计,而前两版中许多复杂统计并没有(可能为了便于安装使用吧,11.0的basic版约60M,standard约110M-150M,而高级版本则几百M。象SAS完成安装则达6张CD!因而绝大多数人不可能使用它全部功能。因而常规建议是SPSS+origin6.0一个统计,一个作图,而且二者数据可以通用,效果很好!在我的主页的站点导航statisitic:最新10.0,运行速度最快,模块化操作,不同统计数据有不同界面风格,使用方便,目前国内有很多用户。但其知名度在前二者之下,对一般用户可以考虑选用。

Origin 7.0 是一个非常有名并且易于使用的科学用途数据绘图与数据分析处理工具软件,各种期刊上的统计图,几乎都是出自他的手笔。

以上的软件过于强大,下面是一些小巧易用的数据统计作图,更适合生物学的数据分析:GraphPad Prism著名的数据处理软件,用来进行生物学统计、曲线拟合以及作图。短小而功能齐全。

SigmaPlot 2002 著名的绘图和数据分析软件包可以根据各种数据,绘制精确的两维或三维曲线,可以自由定制各数据轴的特性,并能进行数据的各种统计分析。进行一般的生物类数据处理作图,功能足以。

Simstat 一个易于使用的智能统计软件尤其适合对统计知识了解不多的人使用,它具有一个“专家系统”,引导你对数据进行统计分析。可与SigmaPlot结合生成高质量数据图。

CurveExpert ELISA标准曲线拟合、及其它各种有关的实验数据分析,都可以应用CurveExpert进行数据分析。它使用非常方便,可以说是实验数据处理的圣手,并且可以生成漂亮的曲线应用到论文之中

十二、文献管理

reference Manager 10.0 可以在线通过查找关键词搜索PubMed和609个Z39.50数据库中的专业资料,同时保存查找的资料为本地文件。资料内容和记录分上下两个屏幕,如有全文或想连接网络时敲键盘就可以到相应的全文文章和摘要。可以直接在WORD中查找资料,并插入引用。在文章中对引用的文献可以格式化,引用的参考资料格式有很强的用户自定义功能,可以符合各种杂志对引用格式的要求,引用时不用多窗口切换.

Endnote6.0 专业参考文献查询软件,可在线查找Ineternet上的各种文献数据库,将查找到的资料保存入本地数据库,并自动生成格式化的参考文献清单插入各种文字处理软件。

十三、进化树分析

Phylip 最为通用的进化树分析软件。主要包括五个方面的功能软件:i,DNA和蛋白质序列数据的分析软件。ii,序列数据转变成距离数据后,对距离数据分析的软件。iii,对基因频率和连续的元素分析的软件。iv,把序列的每个碱基/氨基酸独立看待(碱基/氨基酸只有0和1的状态)时,对序列进行分析的软件。v,按照DOLLO简约性算法对序列进行分析的软件。vi,绘制和修改进化树的软件。

PUZZLE 核酸序列、蛋白序列相似性分析及进化树构建工具。根据序列数据的最大相似性构建进化树,一个软件,并且对树进行bootstrap评估。可对大量数据进行快速分析构建,程序还包含数个统计测试。

Paup 一种功能强大的商业版系统进化分析软件。

八、凝胶分析软件

BandScan 4.30 通用的电泳胶条带定量分析软件,手动、自动找到条带,手动的条带可以是无规则的,可以清除背景。进行分子量、百分比、质量、波峰等方面的定量分析。直接使用扫描仪。将数据输出到excel文件。

band leader 3.0 小巧的凝胶图像分析软件。

TotalLab 2.0 是一个全智能化的凝胶分析软件,对DNA、蛋白凝胶电泳图像、arrays, dot blots与colonies等图像可以进行很方便的处理。功能齐全,很容易上手。

Quantityone :bio-rad公司的1d凝胶分析软件,但可配套各种产品,界面华丽,能够生成报告,具有大公司的风范。

QuantiScan 2.1 功能单一的1D凝胶分析软件,但经评测能够及其准确的测量出各个条带的分子量。

Gel-Pro Analyzer Media Cybernetics公司的产品,一向以提供专业级的分析软件而著称。

SigmaGel 1.0 SPSS公司凝胶分析产品。

Melanie 3 Viewer Swiss Institute of Bioinformatics (SI用来查看使用Melanie3软件获得的凝胶图片与相关数据,也包括一些有限的凝胶数据分析功能。

PDQuest 6.2.1 bio-rad公司一个分析2维凝胶并生成数据库的标准软件。使用它,可以同时分析100个凝胶图像,生成包含1000个凝胶图像的数据库。

九、三维结构显示

RasMol 2.7 是计算化学与分子图形学以及信息产业的同步高速发展的成果,使一个普通的科研工作人员,在自己的个人电脑上,就可以从Internet上的各种免费数据库中,下载所需观察与研究的分子坐标文件,进而通过RasMol 2.7以各种模式、各种角度,甚至按照自己的意愿旋转着,观察此分子神秘的微观三维立体结构,进而了解化合物分子结构和各种微观性质与宏观性质之间的定量关系。RasMol 2.7的作者是Glaxo&Wellcome公司(世界第一大制药公司)研发中心的科学家Roger Sayle。RasMol 2.7最大的特点是界面简单,基本操作简单,运行非常迅速,对机器的要求较低,对小的有机分子与大分子,如蛋白质、DNA 或RNA, 均能适用,且显示模式非常丰富。而且它程序短小,功能强大。尚无在功能上出其右者。其显示窗口可以很简单通过选择相应的菜单来显示分子的三维结构。用命令行窗口,通过输入命令可以执行和显示复杂和要求极高的三维图形。

CHIME 2.6 IE与NetScape浏览器插件,安装后,可以直接用浏览器观看PDB格式的文件,直接在浏览器中观看3D分子。

ICMLite 维分子浏览工具,是MolSoft公司出品的软件ICM的简化版,免费推出,但功能十分强大。可读取PDB格式及其他数种格式的分子文件,易于操作,显示的分子图像我认为优于RasMol,值得一试。还可以进行一些计算操作。

POV-Ray 3.5 是一个高质量、完全免费创造最棒三维图像的非常有名的工具,用在分子生物学上,便是用它生成高质量的三维大分子图像。见过Science封面上漂亮极的分子图像吗?便是用它与以下软件结合制作出来的。运算POV格式文件,生成三维图形,非常棒。该软件相当于一种语言,修改pov格式文件,可以定义光源、摄像机、材质、阴影等因素,把生物分子的表面用材质填充,根据光源、摄像机得到分子三维图的一个角度的图。分辨率最大可达1280*1024。图象质量精美。

DS viewer pro 5.0 Accerlys公司Discovery studio系列中的一员。

3D-mol viewer, 带动windows系统下生物软件革新的vector NTIsuite中的一员。

Cn3D 是由NCBI开发的用于观看蛋白质三维结构的软件,其设计的主要目的是为NCBI 在其站点中的蛋白质结构数据库MMDB提供专业的结构观察软件,其主要的操作界面分为两个窗口,如右图所示,一个为结构窗口,另一个为序列窗口。与其他的类似的软件,如Rasmol,Weblabview等相比,其在结构观察方面主要功能上基本相似,但是图形格式上比Rasmol和Weblabview要差一些。而在与网络连接上,该软件能依托NCBI所建立的所建立的MMDB结构数据库,能直接根据输入的序列号从数据库中利用其内嵌的Entrez搜索引擎调出蛋白结构来进行观察,比其他软件要简便。而Cn3D主要的特点是能够将两个蛋白放在一起直观地进行三维结构上的比较,如下图中是将两种核酸外切酶的三维结构通过V AST对准得到的结构比较图:同样,Cn3D在结构比较方面也能利用其内嵌的Blast搜索引擎直接访问Genbank数据库找到具有局部相似性的结构数据,并在三维结构图中显示出二者具有相似性的结构区域。

Spdbv 即Swiss-PdbViewer,是一个界面非常友好的应用程序,使用起来比RASMOL 方便,用来同时分析几个蛋白PDB文件。可以将几个蛋白叠加起来用来分析结构类似性,比较活性位点或其它有关位点。通过菜单操作与直观的图形,可以很容易获得氢键、角度、原子距离、氨基酸突变等数据。该软件与Swiss-Model服务器(蛋白立体结构构建服务器)紧密关联,可以从软件直接连到Swiss-Model服务器进行理论蛋白立体结构构建。而且,该软件可以调用POV-Ray软件(见上)生成质量非常高的蛋白图像。

Molmol 主要用来进行各种分子文件的转换,支持30种主要分子格式,也可以用来进

行3维分子的简单显示。可将PDB格式输出为POV格式后,用POV-RAY进行渲染,生成非常漂亮的三维图形。演示版只支持样板文件与原子数小于20的分子文件格式的转换。不知是否有取巧的办法。

十、生物显微图像分析

Scion Image 是一个优秀的免费图像处理与分析工具。是非常流行的苹果机上的NIH (National Institutes of Health) Image的WINDOWS版,用来显示编辑分析各种图像。读取格式为TIFF 与BMP格式,是一个专业图像分析软件,适用与于科学处理,这点从研发单位便可看出。生物学工作者处理图像必备。

SigmaScan Pro 5.0 是一个有力的图像分析软件30天全功能演示版,进行数字图像的分析处理,可以很容易地将图像进行分析,得出科学结论。

Image-Pro Plus Version 4.5 Media Cybernetics公司的专业产品,不仅可以进行显微分析,还可也进行其他科学分析。

生物信息学软件及使用概述

生物信息学软件及使 刘吉平 liujiping@https://www.sodocs.net/doc/6a1183583.html, 用概述 生 物秀-专心做生物! w w w .b b i o o .c o m

生物信息学是一门新兴的交叉学生物信息学的概念: 科,它将数学和计算机知识应用于生物学,以获取、加工、存储、分类、检索与分析生物大分子的信息,从而理解这些信息的生物学意义。 生 物秀-专心做生物! w w w .b b i o o .c o m

分析和处理实验数据和公共数据,生物信息学软件主要功能 1.2.提示、指导、替代实验操作,利用对实验数据的分析所得的结论设计下一阶段的实验 3.实验数据的自动化管理 4.寻找、预测新基因及其结构、功能 5.蛋白质高级结构及功能预测(三维建模,目前研究的焦点和难点) 生 物秀-专心做生物! w w w .b b i o o .c o m

功能1. 分析和处理实验数据和公共数据,加快研究进度,缩短科研时间 ?核酸:序列同源性比较,分子进化树构建,结构信息分析,包括基元(Motif)、酶切点、重复片断、碱基组成和分布、开放阅读框(ORF ),蛋白编码区(CDS )及外显子预测、RNA 二级结构预测、DNA 片段的拼接; ?蛋白:序列同源性比较,结构信息分析(包括Motif ,限制酶切点,内部重复序列的查找,氨基酸残基组成及其亲水性及疏水性分析),等电点及二级结构预测等等; ?本地序列与公共序列的联接,成果扩大。 生 物秀-专心做生物! w w w .b b i o o .c o m

Antheprot 5.0 Dot Plot 点阵图 Dot plot 点阵图能够揭示多个局部相似性的复杂关系 生 物秀-专心做生物! w w w .b b i o o .c o m

生物信息学数据库或软件

一、搜索生物信息学数据库或者软件 数据库是生物信息学的主要内容,各种数据库几乎覆盖了生命科学的各个领域。 核酸序列数据库有GenBank,EMBL,DDB等,核酸序列是了解生物体结构、功能、发育和进化的出发点。国际上权威的核酸序列数据库有三个,分别是美国生物技术信息中心(NCBI)的GenBank ,欧洲分子生物学实验室的EMBL-Bank(简称EMBL),日本遗传研究所的DDBJ 蛋白质序列数据库有SWISS-PROT,PIR,OWL,NRL3D,TrEMBL等, 蛋白质片段数据库有PROSITE,BLOCKS,PRINTS等, 三维结构数据库有PDB,NDB,BioMagResBank,CCSD等, 与蛋白质结构有关的数据库还有SCOP,CATH,FSSP,3D-ALI,DSSP等, 与基因组有关的数据库还有ESTdb,OMIM,GDB,GSDB等, 文献数据库有Medline,Uncover等。 另外一些公司还开发了商业数据库,如MDL等。

生物信息学数据库覆盖面广,分布分散且格式不统一, 因此一些生物计算中心将多个数据库整合在一起提供综合服务,如EBI的SRS(Sequence Retrieval System)包含了核酸序列库、蛋白质序列库,三维结构库等30多个数据库及CLUSTALW、PROSITESEARCH等强有力的搜索工具,用户可以进行多个数据库的多种查询。 二、搜索生物信息学软件 生物信息学软件的主要功能有: 分析和处理实验数据和公共数据,加快研究进度,缩短科研时间; 提示、指导、替代实验操作,利用对实验数据的分析所得的结论设计下一阶段的实验;寻找、预测新基因及预测其结构、功能; 蛋白高级结构预测。 如:核酸序列分析软件BioEdit、DNAClub等;序列相似性搜索BLAST;多重系列比对软件Clustalx;系统进化树的构建软件Phylip、MEGA等;PCR 引物设计软件Primer premier6.0、oligo6.0等;蛋白质二级、三级结构预测及三维分子浏览工具等等。 NCBI的网址是:https://www.sodocs.net/doc/6a1183583.html,。 Entrez的网址是:https://www.sodocs.net/doc/6a1183583.html,/entrez/。 BankIt的网址是:https://www.sodocs.net/doc/6a1183583.html,/BankIt。 Sequin的相关网址是:https://www.sodocs.net/doc/6a1183583.html,/Sequin/。 数据库网址是:https://www.sodocs.net/doc/6a1183583.html,/embl/。

生物信息学名词解释

1.计算生物信息学(Computational Bioinformatics)是生命科学与计算机科学、数理科学、化学等领域相互交叉而形成的一门新兴学科,以生物数据作为研究对象,研究理论模型和计算方法,开发分析工具,进而达到揭示这些数据蕴含的生物学意义的目的。 2.油包水PCR (Emulsion PCR) : 1) DNA片段和捕获磁珠混合; 2) 矿物油和水相的剧烈震荡产生油包水环境; 3) DNA片段在油包水环境中扩增;4) 破油并富集有效扩增磁珠。 3.双碱基编码技术:在测序过程中对每个碱基判读两遍,从而减少原始数据错误,提供内在的校对功能。代表测序方法:solid 测序。 4.焦磷酸测序法:焦磷酸测序技术是由4种酶催化的同一反应体系中的酶级联化学发光反应,适于对已知的短序列的测序分析,其可重复性和精确性能与SangerDNA测序法相媲美,而速度却大大的提高。焦磷酸测序技术不需要凝胶电泳,也不需要对DNA样品进行任何特殊形式的标记和染色,具备同时对大量样品进行测序分析的能力。在单核苷酸多态性、病原微生物快速鉴定、病因学和法医鉴定研究等方面有着越来越广泛的应用。例如:454测序仪 :用蛋白质序列查找核苷酸序列。 :STS是序列标记位点(sequence-tagged site)的缩写,是指染色体上位置已定的、核苷酸序列已知的、且在基因组中只有一份拷贝的DNA短片断,一般长200bp -500bp。它可用PCR方法加以验证。将不同的STS依照它们在染色体上的位置依次排列构建的图为STS图。在基因组作图和测序研究时,当各个实验室发表其DNA测序数据或构建成的物理图时,可用STS来加以鉴定和验证,并确定这些测序的DNA片段在染色体上的位置;还有利于汇集分析各实验室发表的数据和资料,保证作图和测序的准确性。 :表达序列标签技术(EST,Expressed Sequence Tags)EST技术直接起源于人类基因组计划。 :生物信息学数据库。UniGene试图通过计算机程序对GeneBank中的序列数据进行适当处理,剔除冗余部分,将同一基因的序列,包括EST序列片段搜集到一起,以便研究基因的转录图谱。UniGene除了包括人的基因外,也包括小鼠、大鼠等其它模式生物的基因。 :开放阅读框(ORF,open reading frame )是基因序列的一部分,包含一段可以编码蛋白的碱基序列,不能被终止子打断。编码一个蛋白质的外显子连接成为一个连续的ORF。 10.分子钟检验:只有分子钟的,没听过分子钟检验。一种关于分子进化的假说,认为两个物种的同源基因之间的差异程度与它们的共同祖先的存在时间(即两者的分歧时间)有一定的数量关系

启动子生物信息学分析软件

https://www.sodocs.net/doc/6a1183583.html,/seq_tools/promoter.html 2. PlantCARE(plant cis-acting regulatory elements), a database of plant cis-acting regulatory elements http://bioinformatics.psb.ugent.be/webtoo ls/plantcare/html/ 3. promoter 2.0 prediction server http://www.cbs.dtu.dk/services/Promoter/ 4. 启动子分析网址: 1 https://www.sodocs.net/doc/6a1183583.html,/seq_tools/promoter.html 2 http://alggen.lsi.upc.es/recerca/menu_recerca.html 3 http://www.cbs.dtu.dk/services/Promoter/ 4 https://www.sodocs.net/doc/6a1183583.html,/~molb470/ ... s/solorz/index.html 5 https://www.sodocs.net/doc/6a1183583.html,/molbio/proscan/ http://bip.weizmann.ac.il/toolbo ... ters.html#databases https://www.sodocs.net/doc/6a1183583.html,/seq_tools/promoter.html https://www.sodocs.net/doc/6a1183583.html,.sg/promoter/CGrich1_0/CGRICH.htm https://www.sodocs.net/doc/6a1183583.html,/pub/programs.html#pmatch https://www.sodocs.net/doc/6a1183583.html,.hk/~b400559/arraysoft_pathway.html#Promoter http://www.dna.affrc.go.jp/PLACE/signalup.html http://intra.psb.ugent.be:8080/PlantCARE/ http://www.cbs.dtu.dk/services/Promoter/ https://www.sodocs.net/doc/6a1183583.html,/molbio/proscan/ https://www.sodocs.net/doc/6a1183583.html,/molbio/signal/ https://www.sodocs.net/doc/6a1183583.html,/thread-41571-1-1.htm 常用启动子分析网址: http://bip.weizmann.ac.il/toolbox/seq_analysis/promoters.html#databas es

生物信息学软件使用

生物信息学软件的使用(以MC4R基因为例) 第一章从NCBI上查找DNA、mRNA、蛋白质序列 一、以猪的黑素皮质素受体4(MC4R, melanocortin-4 re-ceptor)基因为例,介绍如何从NCBI 上查找DNA、mRNA、氨基酸序列。 1.首先查找MC4R的DNA序列。 在百度里输入NCBI,打开后得到的结果如下网页: 在Search 栏输入“MC4R pig”,在下拉菜单里选择Gene,然后点击Search,得到如下结果:

点击第一个ID为397359的链接,得到如下的结果:

可以看到该基因位于猪的1号染色体上,在右下方有个“Go to nucleotide”即进入核酸序列,有三种格式(用红圈标记的),经常用的是“FASTA”和“GenBank”,“FASTA”格式的比较简洁,不包含任何的数字,就全部是碱基,序列的对比和分析是就要用到这种格式;而“GenBank”格式就比较详细,可以查看到很多信息,比如碱基数、mRNA序列、内含子、外显子、CDS,以及氨基酸序列等等之类的。点击GenBank后得到如下结果: Sus scrofa breed mixed chromosome 1, Sscrofa10.2 DNA LOCUS NC_010443 2265 bp DNA linear CON 29-SEP-2013 DEFINITION Sus scrofa breed mixed chromosome 1, Sscrofa10.2. ACCESSION NC_010443 REGION: complement(178553488..178555752) GPC_000000583 VERSION NC_010443.4 GI:347618793 DBLINK BioProject: PRJNA28993 Assembly: GCF_000003025.5 KEYWORDS RefSeq. SOURCE Sus scrofa (pig) ORGANISM Sus scrofa Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Laurasiatheria; Cetartiodactyla; Suina; Suidae; Sus. COMMENT REFSEQ INFORMATION: The reference sequence is identical to CM000812.4. On Oct 11, 2011 this sequence version replaced gi:333795951. Assembly Name: Sscrofa10.2 The genomic sequence for this RefSeq record is from the genome assembly released by the Swine Genome Sequencing Consortium as Sscrofa10.2 in August 2011 (see https://www.sodocs.net/doc/6a1183583.html,/Projects/S_scrofa). Sscrofa10.2 is a mixed assembly of clones and contigs from the whole-genome shotgun

常用生物信息学软件

常用生物信息学软件 一、基因芯片 1、基因芯片综合分析软件。 ArrayVision 7.0 一种功能强大的商业版基因芯片分析软件,不仅可以进行图像分析,还可以进行数据处理,方便protocol的管理功能强大,商业版正式版:6900美元。 Arraypro 4.0 Media Cybernetics公司的产品,该公司的gelpro, imagepro一直以精确成为同类产品中的佼佼者,相信arraypro也不会差。 phoretix? Array Nonlinear Dynamics公司的基因片综合分析软件。 J-express 挪威Bergen大学编写,是一个用JA V A语言写的应用程序,界面清晰漂亮,用来分析微矩阵(microarray)实验获得的基因表达数据,需要下载安装JA V A运行环境JRE1.2后(5.1M)后,才能运行。 2、基因芯片阅读图像分析软件 ScanAlyze 2.44 ,斯坦福的基因芯片基因芯片阅读软件,进行微矩阵荧光图像分析,包括半自动定义格栅与像素点分析。输出为分隔的文本格式,可很容易地转化为任何数据库。 3、基因芯片数据分析软件 Cluster 斯坦福的对大量微矩阵数据组进行各种簇(Cluster)分析与其它各种处理的软件。 SAM Significance Analysis of Microarrays 的缩写,微矩阵显著性分析软件,EXCEL软件的插件,由Stanford大学编制。 4.基因芯片聚类图形显示 TreeView 1.5 斯坦福开发的用来显示Cluster软件分析的图形化结果。现已和Cluster成为了基因芯片处理的标准软件。 FreeView 是基于JA V A语言的系统树生成软件,接收Cluster生成的数据,比Treeview 增强了某些功能。 5.基因芯片引物设计 Array Designer 2.00 DNA微矩阵(microarray)软件,批量设计DNA和寡核苷酸引物工具 三、序列综合分析 V ector NTI Suite 8.0 不喜欢装备各种专业性强的软件,而希望用一个综合性的软件代替的同志可以选择本软件。本阶段的大部分功能它都有。该软件具体特有良好的数据库管理(增加、修改、查找),对要操作的数据放在一个界面相同的数据库中统一管理。软件中的大部分分析可以通过在数据库中进行选定(数据)->分析->结果(显示、保存和入库)三步完成。在分析主界面,软件可以对核酸蛋白分子进行限制酶分析、结构域查找等多种分析和操作,生成重组分子策略和实验方法,进行限制酶片段的虚拟电泳,新建输入各种格式的分子数据、

生物信息学常用工具

常用DNA和蛋白质序列数据分析工具: ●序列比对工具: a)BLAST: ●网络比对,包括基础的Blast比对、参数、特殊Blast如PSI-Blast、Blast2 等; ●本地比对,包括程序下载、安装、数据库的下载及格式化、Blast程序的 运行等。 b)多序列比对ClustalX(Windows系统) 包括程序下载、安装、及程序的运行、结果的输入输出等。 ●真核生物基因结构的预测: a)基因可读框的识别: Genescan; CpG岛、转录终止信号和启动子区域预测; CpGPlot; POLYAH; PromoterScan; b)基因密码子偏好性: CodonW; c)采用mRNA序列预测基因: Spidey; d)ASTD数据库 ●分子进化遗传分析工具 ●MEGA;

●Phylip; ●蛋白质结构和功能预测 a)一级结构 ProtParam蛋白质序列理化参数检索; ProtScale蛋白质疏水性分析; COILS卷曲螺旋预测; b)二级结构 PredictProtein蛋白质结构预测; PSIPRED不同蛋白质结构预测方法; c)InterProScan: 模式和序列谱研究 Prosite:蛋白质结构域、家族和功能为点数据库; Pfam:蛋白质家族比对和HMM数据库; BLOCK:模块搜索数据库; SMART:简单模块架构搜索工具; TMHMM:跨膜结构预测工具; d)三级结构 Swiss-Model Workspace: 同源建模的网络综合服务器; Phyre:线串法预测蛋白质折叠; HMMSTR/Rosetta:从头预测蛋白质结构; Swiss-PdbViewer:分子建模和可视化工具; 序列模体的识别和解析; MEME程序包; ●蛋白质谱数据分析

生物信息学工具介绍

生物信息学工具介绍 1、FASTA[10](https://www.sodocs.net/doc/6a1183583.html,/fasta33/)和BLAST[11](http://www.nc https://www.sodocs.net/doc/6a1183583.html,/BLAST/)是目前运用较为广泛的相似性搜索工具。比较和确定某一数据库中的序列与某一给定序列的相似性是生物信息学中最频繁使用和最有价值的操作。本质上这与两条序列的比较没有什么两样,只是要重复成千上万次。但是要严格地进行一次比较必定需要一定的耗时,所以必需考虑在一个合理的时间内完成搜索比较操作。FASTA使用的是Wilbur-Lipman 算法的改进算法,进行整体联配,重点查找那些可能达到匹配显著的联配。虽然FASTA不会错过那些匹配极好的序列,但有时会漏过一些匹配程度不高但达显著水平的序列。使用FASTA和BLAST,进行数据库搜索,找到与查询序列有一定相似性的序列。一般认为,如果蛋白的序列一致性为25-30%,则可认为序列同源。BLAST(Basic Loc al Alignment Search Tool,基本局部联配搜索工具)是基于匹配短序列片段,用一种强有力的统计模型来确定未知序列与数据库序列的最佳局部联配。BLAST 是现在应用最广泛的序列相似性搜索工具,相比FASTA 有更多改进,速度更快,并建立在严格的统计学基础之上。这两个工具都采用局部比对的方法,选择计分矩阵对序列计分,通过分值的大小和统计学显著性分析确定有意义的局部比对。BLAST根据搜索序列和数据库的不同类型分为5种:1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。 2、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。 3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。 4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。 5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。另外PSI-BLAST通过迭代搜索,可以搜索到与查询序列相似性较低的序列。其中BLASTN、BLASTP在实践中最为常用,TBLASTN在搜索相似序列

常用生物信息学软件介绍

常用生物学软件简介 1. Oligo 6是目前使用最为广泛的一款引物设计软件,除了可以简单快捷地完成各种引物和探针的设计与分析外,还具有很多其他同类软件所不具有的高级功能: a) 已知一个PCR引物的序列,搜寻和设计另一个引物的序列。b) 按照不同的物种对MM子的偏好性设计简并引物。 c) 对环型DNA片段,设计反向PCR引物。d) 设计多重PCR引物。e) 为LCR反应设计探针,以检测某个突变是否出现。f) 分析和评价用其他途径设计的引物是否合理。 g) 同源序列查找,并根据同源区设计引物。 h) 增强了的引物/探针搜寻手段。设计引物过程中,可以“Lock”每个参数,如Tm 值范围和引物3’端的稳定性等。 i) 以多种形式存储结果;支持多用户,每个用 户可保存自己的特殊设置。 网址: https://www.sodocs.net/doc/6a1183583.html,/ 2. Vector NTI Suite是一套功能最全,而且界面最美观,最友好的分子生物学应用软件包。主要包括四个大型软件,它们分别可以对DNA、RNA、蛋白质分子进行各种分析和操作。Vector⑴ NTI:作为Vector NTI Suite的核心组成部分,它可以在生物研究的全过程中提供数据组织和序列编辑的软件支持。Vector NTI 是以一种窗口形式,且支持项目组织的数据库来完成这一功能的;通过这个数据库,可以保存和组织大部分的实验数据,比如:基因结构、载体、序列片断、引物、蛋白质、多肽、电泳Markers和限制性内切酶等。实际上,该数据库还支持对Vector NTI Suite 中各种小型的绘图和结果展示工具的管理。Vector NTI 可以按照用户要求设计克隆策略。用户只需提供克隆载体,外源片断序列,明确载体克隆的大致位置或酶切位点,其它工作由软件完成。设计结果以图文形式输出到屏幕;最后根据客户定制的条件进行模拟电泳。Vector NTI 还具有强大的设计和评估PCR引物、测序引物和杂交探针功能。BioPlot⑵:BioPlot是一个对蛋白质和核酸序列进行各种理化特性分析的综合性工具,它是一种方便的桌面程序。和其他程序不同的是,BioPlot可以绘制50种以上预定制的蛋白质特征图谱,如疏水性和抗原性;并将序列与特征图谱和活性序列区域一一对应。BioPlot还可以对核酸序列进行8种不同类型的分析,如:退火温度、自由能和GC含量等。AlignX⑶:AlignX可以对多个蛋白质或核酸序列进行同源比较,以寻找不同序列之间的同源区域或相似性很高序列中的不同碱基,并绘制进化树;为下一步设计PCR引物、探针及研究系统发育提供基础。AlignX 可以识别所有标准TXT格式,如FASTA、GeneBank、EMBL、SWISS-PROT、GenPept 和ASCII Text。ContigExpress⑷:Contig Express是用来对多个小核酸片段进行拼接而形成连续的长序列。这些小片段可以是Text序列,也可以是直

生物信息学工具BLAST的使用简介_吕军

2003年3月内蒙古大学学报(自然科学版)M ar.2003第34卷第2期Acta Scientiarum Naturalium Univ ersitatis NeiM ongol Vol.34No.2 文章编号:1000-1638(2003)02-0179-09 生物信息学工具BL AS T的使用简介 吕 军1,3,张 颖3,冯立芹2,李 宏1 (1.内蒙古大学理论物理与理论生物物理研究室,内蒙古呼和浩特010021; 2.内蒙古民族大学物理系,内蒙古通辽028043; 3.内蒙古工业大学物理教研室,内蒙古呼和浩特010062) 摘要:从网上在线服务、电子邮件服务和本地运行三个方面介绍BL AS T的使用方法,目的是 使大家尽快掌握它,使其成为理论生物学研究的有力工具. 关键词:BL AS T;数据库;搜索 中图分类号:Q617 文献标识码:A 引 言 随着人类基因组计划(HGP)的进展,生物数据量迅速膨胀,海量的生物数据摆在生物信息学的工作者面前.生物信息学计算的核心是序列的比较,从而,比较基因组学、比较蛋白质组学成为后基因组时代的主要研究方向之一.比较的内容从序列的组分变化、寻找特殊的字段,到序列间字母的对应.比较的主要目的在于阐明序列间的同源(isogeny)关系,以及从已知序列去预测新序列的结构和功能. 两个或多个符号序列按字母比较,尽可能确切地反映他们之间的相似和相异,称为序列的联配(a lig nment).核酸和蛋白质序列的联配的前提是,假定两个序列来自同一个祖先序列(“同源”),它们在演化的过程中由于变异的积累而成为不同的序列. 近年来,进行序列联配分析的工具软件发展了很多,其中,尤以BLAST和FAST A使用最为频繁,一般认为,BLAS T运行速度快,对蛋白质序列的搜寻更为有效,FASTA速度较慢,对核酸序列更为敏感.BLAST是“基本局域联配搜索工具”(Basic Local Alig nment Search Tool)的字头缩写,是最常用的比较核酸和蛋白质同源性的比较工具.现在,利用BLAST对数据库进行搜索已成为生物信息学工作者的经常.因为BLAST和FAS TA的功能相近,所以,本文以BLAS T为例从三个方面来分别介绍BLAST的使用方法.关于BLAST的算法描述可见文献〔1〕和〔2〕. 1 网上在线服务 BLAST是运行速度甚快的数据库搜索程序,许多生物信息中心都有专门运行BLAST的服务器.主要的BLAST服务器网址如下: http://w w w.ncbi.nlm.nih.g ov/blast/(运行BLASTR2.0,美国,维护GenBank) http://w w https://www.sodocs.net/doc/6a1183583.html,(运行W U-BLAST2,欧洲,维护EM BL数据库) http://w w w.blast.geno me.ad.jp/(运行BLAST2.0,日本) https://www.sodocs.net/doc/6a1183583.html,(运行BLASTR2.0,中国,有ncbi和ebi的镜像) 收稿日期:2002-05-17 基金项目:国家自然科学基金(10147204)资助项目,内蒙古自然科学基金(2001301)资助项目 作者简介:吕军(1973~),男,内蒙古乌拉特前旗人,讲师,硕士.

生物信息学常用工具,作用及操作流程

用于分析DNA、RNA以及蛋白质一级结构 1、VecScreen用于分析未知序列的长度、载体序列的区域、判断可能使用的克隆载体。 操作过程:NCBI→Resource List (A-Z)→V→VecScreen→输入序列→Run VecScreen→获得结果 2、RepeatMasker用于分析未知序列的重复序列情况,输出重复序列的区域、包含的所有重复序列的类型、重复序列的总长度及Masked Sequence。 操作流程: RepeatMasker Home Page→RepeatMasking→输入文本→选择参数→submit sequence→Results→选择所需结果 3、使用CpGPlot工具,分析未知序列的CpG岛的长度、区域、GC数量及Obs/Exp 值。 EMBL→service→Search “cpg”→EMBOSS cpgplot→输入序列→选择参数→submit→得到结果 4、Neural Network Promoter Prediction和Splice Site Prediction用于预测未知序列的启动子,获得可能的启动子序列及相应的位置。 Neural Network Promoter Prediction BDGP: Home→Analysis Tools→Promoter Prediction→输入序列→选择参数→submit →得到结果 Splice Site Prediction Splice Site Prediction→输入序列→选择参数(物种)→submit→得到结果 这两个都是bdgp里边的,sp这个直接能进去操作。 5、ORF finder用于分析未知序列开放阅读框的预测,寻找潜在的蛋白质编码片段,并进行六框翻译(概念性翻译)。 操作流程 NCBI→Resource List (A-Z)→ORF finder→输入序列→选择参数→submit→获得结果→选择符合要求的形式的结果 6、GENSCAN,用于未知序列综合分析,预测来自各种生物的基因组序列中基因的位置和外显子结构,并对其进行概念性翻译。同时可以获得未知序列的长度以及C+G含量。(首先确定给定序列的物种来源) 操作流程: GENSCAN→输入序列→选择参数→Run GENSCAN→得到结果 7、REBASE是限制性内切酶数据库,用于分析限制性核酸内酶的Recognition Sequence和Type(识别序列和酶切类型)。 Official REBASE Homepage→输入酶的名字→GO→得到结果

生物信息学期末复习知识点总结

生物信息学:利用数学、物理、化学的理论、技术和方法,以计算机为工具,对生命现象加以研究,得到深层次的生物学知识。 研究任务:收集与管理生物分子数据,对数据进行处理分析,为其它生物学研究提供服务 四大“模式生物”:酵母、线虫、果蝇、小鼠 糖的生物功能,作为燃料(是生命活动所需的能源),重要的中间代谢物,参与生物大分子组成,作为信号分子 脂类的生物功能,构成生物膜的骨架,储存能量(效率是糖的2倍左右),构成生物表面的保护层、保温层,重要的生物学活性物质蛋白质的生物功能,是遗传信息转化成生物结构和功能的表达者;参与基因表达的调节,以及细胞中氧化还原反应、电子传递、神经传递、学习记忆等重要生命过程;酶(一类重要的蛋白质)在细胞和生物体内各种生化反应中起催化作用; 蛋白质的空间结构 一级结构(primary structure)多肽链中氨基酸数目、种类和线性排列顺序 二级结构(secondary structure)氢键形成?-螺旋(? -helix)链间形成?-折叠(?-sheet) 三级结构(tertiary structure)肽链进一步沿多方向盘绕成紧密的近似球状结构 四级结构(quaternary structure)具有特定构象的肽链进一步结合,并在空间相互作用检索方法:1)追溯法:通过已知文献后附有的参考文献中提供的线索来查找文献。(2)常用法:利用各种检索工具来查找文献。(3)循环法:是将常用法和追溯法交替使用的一种综合文献检索方法。 (4)浏览法:是从本专业期刊或其它类型的原始文献中直接查阅文献资料。 检索途径:着者途径:分类途径:主题途径:其它途径; 检索过程:(1)分析研究课题(2)制定检索策略(3)查找文献线索(4)获得原始文献大规模基因组DNA测序: 鸟枪法( Shot-gun sequencing)方法:借助物理或化学的手段将整个基因组随机打断成一定大小的片段进行测序,再根据序列间的重叠关系进行计算机排序与组装,确定它们在基因组中的位置。 适用范围:主要用于重复序列少、相对简单的原核生物基因组的测序工作。不适用于分析较大的、更复杂的基因组。优点:速度快、简单易行、成本低 克隆重叠群法(clone contig sequencing)方法:先将染色体打成比较大的片段(几十-几百Kb),利用分子标记将这些大片段排成重叠的克隆群,分别测序后拼装。需要绘制物理图谱,以鸟枪法为基础。适用范围:较大的、更复杂的基因组 蛋白质结构解析:X射线晶体衍射;核磁共振波谱学 其他方法:扫描隧道电子显微镜–圆二色谱一级数据库:直接来源于实验获得的原始数据,只经过简单的归类、整理和注释。 二级数据库:在一级数据库、实验数据和理论分析的基础上,针对不同的研究内容和需要,对生物学知识和信息的进一步整理得到的数据库。 序列比较的根本任务是:通过比较生物分子序列,发现他们之间的 相似性,找出序列之间共同的区域,同时辨别序列之间的差异。 同源性:是指序列们是由共同祖先进化而来,讲两条序列的同源关系,只有两种情况:同源、不同源。相似性:指序列间的差别,是一个度量。 同源与相似的关系:一般认为序列相似性达到一定程度,即可认为是同源,但不绝对。序列比对算法实现:点阵分析:寻找序列间可能的性状对位排列;寻找蛋白质、DNA序列中正向或反向重复;预测RNA中自补区域;直观,整体水平;动态规划算法:精确而全面,非常耗费资源;启发式算法 滑动窗口技术:使用滑动窗口代替一次一个位点的比较是解决这个问题的有效方法。 动态规划算法计算过程:1计算过程从d 0 ,

浅谈生物信息学在生物学研究中的应用

浅谈生物信息学在生物学研究中的应用 生物信息学(Bioinformatics)是一门新兴的、正在迅速发展的交叉学科,目前国内外对生物信息学的定义众说纷纭,没有形成统一认识。概括来说,现代生物信息学是以核酸和蛋白质等生物大分子数据库及其相关的图书、文献、资料为主要对象,以数学、信息学、计算机科学为主要手段,对浩如烟海的原始数据和原始资料进行存储、管理、注释、加工,使之成为具有明确生物意义的生物信息。并通过对生物信息的查询、搜索、比较、分析,从中获得基因的编码、凋控、遗传、突变等知识;研究核酸和蛋白质等生物大分子的结构、功能及其相互关系;研究它们在生物体内的物质代谢、能量转移、信息传导等生命活动中的作用机制。 生物信息在生物学研究上的应用主要包括在基因组学研究上的应用和在蛋白质组学研究中的应用。 1.在基因组学研究中的应用 基因组(genome)表示一个生物体所有的遗传信息的总和。一个生物体基因所包含的信息决定了该生物体的生长、发育、繁殖和消亡等所有生命现象。有关基因组的研究称为基因组学(Genomics),基因组学根据研究重点的不同分为序列基因组学(Sequence genomics)、结构基因组学(Structural genomics)、功能基因组学(Functional genomics)与比较基因组学(Comparative genomics)。 结构基因组学的研究:结构基因组学(Structural genomics)是基于基因组学的一个重要组成部分和研究领域,它是一门通过基因作图、核苷酸序列分析确定基因组成、基因定位的科学口。生物信息学在结构基因组学中的应用主要在于:基因组作图、核苷酸序列信息分析、基因定位、新基因的发现和鉴定等方面。比较基因组学的研究:借助生物信息学的手段对不同生物基因组的比较、分析,可以进行生物进化等方面的研究。 功能基因组学的研究:功能基因组学(Functional genomics)是指在全基因组序列测定的基础上,从整体水平研究基因及其产物在不同时空、条件下的结构与功能关系及活动规律的学科。功能基因组的研究是后基因组时代的关键点,它将借助生物信息学的技术平台,利用先进的基因表达技术及庞大的生物功能检测体系,从浩瀚无垠的基因库筛选并确知某一特定基因的功能,并通过比较分析基因及其表达的状态,确定出基因的功能内涵,揭示生命奥秘,甚至开发出基因产品。 2.在蛋白质组学的研究中的应用 在20世纪中后期,随着DNA双螺旋结构的提出和蛋白质空间结构的解析,生生命科学的研究进入了分子生物学时代,而遗传信息载体DNA和生命功能的体现者蛋白质的研究,成为了其主要内容。90年代初期启动的庞大的人类基因组计划,已经取得巨大的成在20世纪中后期,随着DNA双螺旋结构的提出和蛋白质

生物信息学分析方法

核酸和蛋白质序列分析 蛋白质, 核酸, 序列 关键词:核酸序列蛋白质序列分析软件 在获得一个基因序列后,需要对其进行生物信息学分析,从中尽量发掘信息,从而指导进一步的实验研究。通过染色体定位分析、内含子/外显子分析、ORF分析、表达谱分析等,能够阐明基因的基本信息。通过启动子预测、CpG岛分析和转录因子分析等,识别调控区的顺式作用元件,可以为基因的调控研究提供基础。通过蛋白质基本性质分析,疏水性分析,跨膜区预测,信号肽预测,亚细胞定位预测,抗原性位点预测,可以对基因编码蛋白的性质作出初步判断和预测。尤其通过疏水性分析和跨膜区预测可以预测基因是否为膜蛋白,这对确定实验研究方向有重要的参考意义。此外,通过相似性搜索、功能位点分析、结构分析、查询基因表达谱聚簇数据库、基因敲除数据库、基因组上下游邻居等,尽量挖掘网络数据库中的信息,可以对基因功能作出推论。上述技术路线可为其它类似分子的生物信息学分析提供借鉴。本路线图及推荐网址已建立超级链接,放在北京大学人类疾病基因研究中心网站(https://www.sodocs.net/doc/6a1183583.html,/science/bioinfomatics.htm),可以直接点击进入检索网站。 下面介绍其中一些基本分析。值得注意的是,在对序列进行分析时,首先应当明确序列的性质,是mRNA序列还是基因组序列?是计算机拼接得到还是经过PCR扩增测序得到?是原核生物还是真核生物?这些决定了分析方法的选择和分析结果的解释。 (一)核酸序列分析 1、双序列比对(pairwise alignment) 双序列比对是指比较两条序列的相似性和寻找相似碱基及氨基酸的对应位置,它是用计算机进行序列分析的强大工具,分为全局比对和局部比对两类,各以Needleman-Wunsch算法和Smith-Waterman算法为代表。由于这些算法都是启发式(heuristic)的算法,因此并没有最优值。根据比对的需要,选用适当的比对工具,在比对时适当调整空格罚分(gap penalty)和空格延伸罚分(gap extension penalty),以获得更优的比对。 除了利用BLAST、FASTA等局部比对工具进行序列对数据库的搜索外,我们还推荐使用EMBOSS软件包中的Needle软件(http://bioinfo.pbi.nrc.ca:8090/EMBOSS/),和Pairwise BLAST (https://www.sodocs.net/doc/6a1183583.html,/BLAST/)。以上介绍的这些双序列比对工具的使用都比较简单,一般输入所比较的序列即可。 (1)BLAST和FASTA FASTA(https://www.sodocs.net/doc/6a1183583.html,/fasta33/)和BLAST (https://www.sodocs.net/doc/6a1183583.html,/BLAST/)是目前运用较为广泛的相似性搜索工具。这两个工具都采用局部比对的方法,选择计分矩阵对序列计分,通过分值的大小和统计学显著

生物信息学复习题百度文库合集

生物信息学, 一、名词解释: 1、生物信息学:生物分子信息的获取、存贮、分析和利用;以数学为基础,应用计算机技术,研究生物学数据的科学。 2、相似性(similarity):两个序列(核酸、蛋白质)间的相关性。 3、同源性(homology):生物进化过程中源于同一祖先的分支之间的关系。 4、同一性(identity):两个序列(核酸、蛋白质)间未发生变异序列的关系。 5、序列比对(alignment):为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。 6、生物数据库检索(database query,数据库查询):对序列、结构以及各种二次数据库中的注释信息进行关键词匹配查找。 7、生物数据库搜索(database search):通过特定序列相似性比对算法,找出核酸或蛋白质序列数据库中与待检序列具有一定程度相似性的序列。 二、简答题: 1、分子生物学的三大核心数据库是什么?它们各有何特点? GenBank核酸序列数据库;SWISS-PROT蛋白质序列数据库;PDB生物大分子结构数据库;2、简述生物信息学的发生和发展。 20世纪50年代,生物信息学开始孕育; 20世纪60年代,生物分子信息在概念上将计算生物学和计算机科学联系起来; 20世纪70年代,生物信息学的真正开端; 20世纪70年代到80年代初期,出现了一系列著名的序列比较方法和生物信息分析方; 20世纪80年代以后,出现一批生物信息服务机构和生物信息数据库; 20世纪90年代后,HGP促进生物信息学的迅速发展。 3、生物信息学的主要方法和技术是什么? 数学统计方法;动态规划方法;机器学习与模式识别技术;数据库技术及数据挖掘;人工神经网络技术;专家系统;分子模型化技术;量子力学和分子力学计算;生物分子的计算机模拟;因特网(Internet)技术 4、常见的DNA测序方法有哪些?各有何技术特点和优缺点? Maxam-Gilbert DNA化学降解法: 优点:可测完全未知序列及CG富含区; 缺点:操作繁琐; Sanger双脱氧链终止法: 优点:简便,可测较长片段; 缺点:需已知部分序列或加接头; 焦磷酸测序: 优点:廉价、高通量; 缺点:一次测序片段短。 5、分子生物学数据库有哪些类型?各有何特点? 基因组数据库:基因组测序 核酸序列数据库:核酸序列测定 一次数据库:蛋白质序列数据库:蛋白质序列测定。生物大分子(蛋白质)三维结构数据库:X-衍射和核磁共振 特点:数量少,容量大,更新快

生物信息学复习资料

一、名词解释(31个) 1.生物信息学:广义:应用信息科学的方法和技术,研究生物体系和生物过程 中信息的存贮、信息的内涵和信息的传递,研究和分析生物体细胞、组织、器官的生理、病理、药理过程中的各种生物信息,或者也可以说成是生命科学中的信息科学。狭义:应用信息科学的理论、方法和技术,管理、分析和利用生物分子数据。 2.二级数据库:对原始生物分子数据进行整理、分类的结果,是在一级数据库、 实验数据和理论分析的基础上针对特定的应用目标而建立的。 3.多序列比对:研究的是多个序列的共性。序列的多重比对可用来搜索基因组 序列的功能区域,也可用于研究一组蛋白质之间的进化关系。 4.系统发育分析:是研究物种进化和系统分类的一种方法,其常用一种类似树 状分支的图形来概括各种(类)生物之间的亲缘关系,这种树状分支的图形称为系统发育树。 5.直系同源:如果由于进化压力来维持特定模体的话,模体中的组成蛋白应该 是进化保守的并且在其他物种中具有直系同源性。 指的是不同物种之间的同源性,例如蛋白质的同源性,DNA序列的同源性。(来自百度) 6.旁系(并系)同源:是那些在一定物种中的来源于基因复制的蛋白,可能会 进化出新的与原来有关的功能。用来描述在同一物种内由于基因复制而分离的同源基因。(来自百度) 7.FASTA序列格式:将一个DNA或者蛋白质序列表示为一个带有一些标记的 核苷酸或氨基酸字符串。 8.开放阅读框(ORF):是结构基因的正常核苷酸序列,从起始密码子到终止 密码子的阅读框可编码完整的多肽链,其间不存在使翻译中断的终止密码子。(来自百度) 9.结构域:大分子蛋白质的三级结构常可分割成一个或数个球状或纤维状的区 域,折叠得较为紧密,各行其功能,称为结构域。 10.空位罚分:序列比对分析时为了反映核酸或氨基酸的插入或缺失等而插入空 位并进行罚分,以控制空位插入的合理性。(来自百度) 11.表达序列标签:通过从cDNA文库中随机挑选的克隆进行测序所获得的部分 cDNA的3’或5’端序列。(来自文献) 12.Gene Ontology 协会: 13.HMM 隐马尔可夫模型:将核苷酸序列看成一个随机序列,DNA序列的编 码部分与非编码部分在核苷酸的选用频率上对应着不同的Markov模型。14.一级数据库:数据库中的数据直接来源于实验获得的原始数据,只经过简单 的归类整理和注释 15.序列一致性:指同源DNA顺序的同一碱基位置的相同的碱基成员, 或者蛋 白质的同一氨基酸位置的相同的氨基酸成员, 可用百分比表示。 16.序列相似性:指同源蛋白质的氨基酸序列中一致性氨基酸和可取代氨基酸所 占的比例。 17.Blastn:是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将 同所查序列作一对一地核酸序列比对。(来自百度) 18.Blastp:是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐 一地同每条所查序列作一对一的序列比对。(来自百度)

相关主题