搜档网
当前位置:搜档网 › 一步一步教你使用NCBI数据库资源

一步一步教你使用NCBI数据库资源

一步一步教你使用NCBI数据库资源
一步一步教你使用NCBI数据库资源

一步一步教你使用NCBI数据库资源

随着ncbi数据库各种资源的涌现,NCBI已经成为科研工作者必不可少的资料查找,数据分析的工具。那么NCBI 数据如何使用,新手入门一步一步教你认识和使用NCBI数据库。

一综合数据库

NCBI数据库集美国国立生物技术信息中心(National Center for Biotechnology Information),即我们所熟知的NCBI 是由美国国立卫生研究院(NIH)于1988年创办。创办NCBI 的初衷是为了给分子生物学家提供一个信息储存和处理的

系统。除了建有GenBank核酸序列数据库(该数据库的数据资源来自全球几大DNA数据库,其中包括日本DNA数据库DDBJ、欧洲分子生物学实验室数据库EMBL以及其它几个知名科研机构)之外,NCBI还可以提供众多功能强大的数据检索与分析工具。目前,NCBI提供的资源有Entrez、Entrez Programming Utilities、My NCBI、PubMed、PubMed Central、Entrez Gene、NCBI Taxonomy Browser、BLAST、BLAST Link (BLink)、Electronic PCR等共计36种功能,而且都可以在NCBI的主页https://www.sodocs.net/doc/9513035280.html,上找到相应链接,其中多

半是由BLAST功能发展而来的。

1 NCBI最新进展

1.1 PubMed搜索功能的增强

去年,NCBI对PubMed进行了几项改进工作,改动最大的是搜索界面和摘要浏览界面。其中,搜索界面中新增了“Advanced Search”选项(这实际上是对以往“Limits”和“Preview/Index”功能的整合),并且增加了一个新的窗口,用户可以在此窗口下通过“论文作者名”、“论文所属杂志名称”、“论文出版日期”等限定条件进行搜索。而且,“论文作者名”和“论文所属杂志名称”还设有文本框自动填充功能。现在,在PubMed数据库中进行文本搜索的同时还可以立即通过两个“内容传感器(content sensors)”进行分析。一个“内容传感器”是根据作者姓名、所属杂志名称或杂志名缩写、出版日期、卷号或刊号等信息进行分析,然后将符合条件的搜索结果排列到结果列表的顶端。另一个“内容传感器”是根据文章是否与用户给出的条件,例如是否与某种药物相关,在NCBI的新增数据库PubMed Clinical Q&A 中进行搜索,然后给出搜索结果。

1.2 新增primer-BLAST分析工具

2008年,NCBI新增了设计、分析PCR引物的工具——Primer-BLAST。Primer-BLAST的引物设计功能是基于NCBI 现有的Primer3程序发展而来的,Primer3程序可以为一段DNA模板序列设计PCR引物。Primer-BLAST在设计出引物之后还在某些相应数据库中进行BLAST搜索,因此可以得到特异性引物,扩增出目的片段。用户在给出DNA模板的同时还可以限定正向引物或反向引物,这样,NCBI就只会给出另一条引物。如果用户给出了模板DNA和两条引物序列,Primer-BLAST就只会运行BLAST程序,帮助用户对引物进行分析。用户也可以只给出两条引物而不给出模板序列,这时Primer-BLAST会通过BLAST程序分析出与这对引物最匹配的模板序列。Primer-BLAST进行BLAST搜索的数据库包括RefSeq mRNA、BLAST nr和12种模式生物基因组数据库。

1.3 BLAST的改进及更新

NCBI对BLAST进行了全新的改版,推出了最新的web BLAST report。在最新的BLAST比对结果页面中,“图形化概要(Graphic Summary)”、“具体描述(Descriptions)”以及“序

列比对(Alignments)”等部分页面都可以展开和收起。此外,网页上还提供了“结果输出格式选项(Formatting)”和“结果下载选项(download)”,在下载选项中还新增了CSV格式下载。这样,读者可以轻松地将BLAST的比对结果输入到表格处理软件中去。另外,BLAST比对结果页面上的“Alignments”部分还提供了每一条命中序列在Entrez GENE 中的相关信息,这些信息包括基因名称、来源物种以及在PubMed数据库中与该基因有关条目的数目等。

“BLAST tree”结果输出模式可以测量不同序列间的距离,自动收起亚类信息等。现在,可以以Newick 格式或Nexus 格式下载BLAST tree结果,也可以在进化树图中选择任一节点重新构树。最后还要向读者介绍ncbi blast的一个新网址:URL: https://www.sodocs.net/doc/9513035280.html,。NCBI建议读者都使用这个网址登陆NCBI BLAST,因为该BLAST使用更多的计算机进行分析,也具有更强的系统容错能力。

1.4 Entrez Gene改进及更新

基因组注释工作当中有一项重要的工作就是定位基因重叠群序列(contig sequences),即在染色体中找出某个基因的定位。实际上基因组测序工作就是将许多基因重叠序列彼此

拼接,最后拼出“完整(中间会有一些缝隙)”的基因组图谱。这项工作可以直接将某个基因与某段基因重叠群序列对应

起来,但不能直接将该基因与染色体联系起来,而这恰恰是生物学家最感兴趣的地方。因此,为了能让用户在搜索基因的同时,也能了解到一些该基因在染色体中的定位情况,Entrez Gene推出了新的“Limits”服务,用户可以使用该服务在基因组范围内进行基因搜索。用户可以在某个物种染色体的某个区域里进行基因搜索。

Entrez Gene会按以下三种顺序对搜索出的基因进行排序:

1. 按照基因名排序。

2. 按照相关性排序,即按照结果与用户搜索所使用的关键词,例如基因名称等的匹配程度排序。

3. 按照基因重要性排序,即按照该基因在PubMed、Homologene、Protein Clusters、Online Mendelian Inheritance in Man(OMIM)或Bookshelf 中文献数量的多少进行排序。

2 ENTREZ 搜索系统

2.1 Entrez

Entrez数据库是一个整合了多个数据库的综合检索系统,它包含了35个不同数据库的信息,共收录有超过350,000,000条记录(表1)。Entrez数据库支持使用简单的布尔查询(Boolean queries)方式进行文本搜索,可以下载不同格式的数据资料,还可以按照生物学关系提供与其它相关记录的链接。这些链接给出的都是最简要的信息,例如会给出一条序列和报道该序列的论文摘要,或者会给出一条蛋白质序列的编码DNA序列或该蛋白质的3D结构图。这种通过计算机运算,即基于比较序列相似性或PubMed中摘要的相似性,所给出的相关链接信息可以以最快的速度提供给用户大量的

相关信息。还有一种叫做“LinkOut”的功能将这种链接功能扩展到了与外部数据库,例如各物种基因组数据库之间的链接。Entrez中搜索到的数据可以以多种格式输出,也可以打包下载或逐个下载。

2.2 My NCBI

My NCBI功能是为了方便用户储存个人配置信息,例如搜索

条件、LinkOut参数或文件出处等而设的。用户登陆自己的My NCBI帐户后,就可以进行保存搜索设置、管理邮件等操作了。My NCBI中有一种称作“Collections”的功能可以让用户储存搜索结果和文献结果。BLAST中也设有类似的功能,这样用户就可以使用同一条件进行多次比对了。

2.3 Entrez programming utilities(E-Utilities)

E-Utilities(Entrez应用程序)由8种服务器程序组成,借助

E-Utilities可以设置一套标准参数进行搜索、链接和下载数据(表2)。用户可以到NCBI主页上的‘Entrez Tools’链接中了解更多有关E-Utilities的信息。 2.4 Taxonomy

NCBI Taxonomy(分类)数据库在Entrez生物学数据库中起到了组织中心的作用。该数据库为每一个分类学上的节点,从超界节点(superkingdoms)到亚种节点(subspecies),提供数据链接服务。分类数据库以每月增加2200个新分类单位的速度在增长,共收录有将近300,000种物种信息,这些信息为“属(genus)”级别,或者虽然未达到“属(genus)”级别,但在Entrez至少收录有一条该物种的核酸序列或蛋白质序列信息。使用Taxonomy网页可以了解该物种在分类学上的地位,也可以在某一物种范围内对Entrez数据库进行搜索。

3 BLAST序列相似性搜索程序

BLAST程序是一种进行序列相似性搜索的程序,它可以对核酸序列或蛋白质序列进行分析。经过BLAST程序比对之后会得到各种序列结果,例如转录体序列(UniGene)信息、基因序列(Gene)信息、3D结构信息(MMDB)或芯片信息(GEO)等。用户也可以使用My NCBI功能保留BLAST中设定的搜索题目、近期搜索结果和搜索参数等信息。还有一种BLAST 程序——BLAST2Sequences程序,它可以对两条DNA序列或蛋白质序列进行比对,并获得一个点对点的比对结果。BLAST程序也可以作为一个独立的程序下载到本地计算机上使用,用户可以到

https://www.sodocs.net/doc/9513035280.html,/blast/executables/LATEST/下载(表3)。

3.1 BLAST

BLAST默认的比对信息数据库包括NCBI中的人类基因组数据库和人类RefSeq数据库。比对之后,BLAST会按照评分高低、序列相似度对结果进行排序,另外BLAST还可以对

小鼠数据库以及其它数据库进行比对。

蛋白质序列的默认数据库包括GenBank非冗余数据库、RefSeq、Swiss-Prot、PDB、PIR和PRF等。此外,还包括这些数据库下的子数据库以及其它一些专利数据库和诸如核

酸数据库等环境样品数据库(environmental samples)。

3.2 BLAST output formats

标准的BLAST输出格式包括默认的配对比对格式(default pairwise alignment)、搜索定位的多序列比对格式

(query-anchored multiple sequence alignment formats)、简单的可解析的Hit Table格式以及按照分类学给出的报告格式等。一种叫做“按照同一性进行配对(Pairwise with identities)”的格式能更好地突出目标序列与检索序列之间的差别。而Web BLAST中提供的树状浏览格式则会按照搜索出的目标序列与检索序列之间的距离不同将这些目标序列进行聚类,形成一幅树状图来显示结果。BLAST比对之后给出的每一种格式的比对结果都会有一个分值和E值。用户也可以设定一个E 值的阈值来筛选比对结果。

3.3 MegaBLAST

MegaBLAST也是一种BLAST程序,不过它主要是用来在非常相似的序列之间(来自同一物种)比对同源性的。使用者通过网页使用MegaBLAST进行批量比对操作,这比使用标准的BLAST程序要快10倍。MegaBLAST在NCBI基因组BLAST页面下是默认的搜索工具,借助它能对增长迅速的Trace Archives数据库和标准BLAST使用的数据库进行快速检索。NCBI还为跨物种核酸序列快速搜索提供了Discontiguous MegaBLAST,它使用非重叠群字段匹配算法(noncontiguous word match)来进行核酸比对。Discontiguous MegaBLAST比blastx等翻译后比对要快得多,同时它在比较编码区时也具有相当高的敏感度。

3.4 Genomic BLAST

NCBI在Map Viewer中还为100多个物种设有Genomic BLAST。通过默认的Genomic BLAST既能对某个物种的基因组序列进行搜索,也能对其它的数据库进行搜索,比如RefSeqs数据库、EST数据库等。

4 文献资源

4.1 PubMed数据库

目前,PubMed数据库中收录有自1860年以来20,400种生命科学类杂志、刊物刊登过的超过1800万条的文献记录。这些文献中有980万条摘要信息,最早的记录可追溯至19世纪80年代,其中有870万条可以检索到全文。PubMed数据库与其它Entrez数据库都保持着密切联系,这样可以在不同的数据库之间架起一座连接的桥梁。PubMed数据库还会通过计算机自动检索出包含相近MeSH词汇、文献题目以及摘要的相关文献信息提供给用户。默认的“AbstractPlus”输出格式给出了该文献的摘要信息和五篇与该文献相关信息的

简单介绍,这样用户就可以获得更多的有关资讯了。

4.2 PubMed Central

PubMed Central是一个收录生命科学领域同行评审期刊(Peer Reviewed Journals)文献的数据库,现收录超过160万条全文文献,并且仅去年一年就增长了51%。而且,包括《核酸研究》(Nucleic Acids Research)在内的480多种期刊会为PubMed Central提供全文文献。

所有参与PubMed Central的出版商也都必须在文献出版后

12个月之内免费为PubMed Central提供全文文献。由于NIH 于2008年4月7日开始执行向公众免费开放使用的政策,故而PubMed Central也必须免费向公众开放使用。如此一来,用户使用Entrez就可以搜索到PubMed和PubMed Central中的所有文献信息了。

4.3 NCBI Bookshelf、NLM Catalog以及Journals database

NCBI Bookshelf通过与作者和出版商合作,收录了86种在线教科书和生物医药类图书。NCBI Bookshelf作为独立于Entrez数据库的一个单独数据库,它里面的信息也可以通过文本搜索或Entrez数据库,例如PubMed、PubMed Central、Gene和OMIM中的链接搜索到。NCBI Bookshelf中的图书不是象普通图书那样一本一本的存放的,而是按照内容将它们分成了230,000个不同的部分、章节进行储存的。用户浏览其中一个内容的时候也可以跳到该书的其它部分或者直

接搜索这本书中的特定内容进行阅读。

NLM Catalog为藏书超过130万册的美国国立卫生图书馆(NLM)记录设立目录信息,包括杂志、图书、手稿、计算机软件、录音文件和其它电子资源。每一条记录都可链接到NLM LocatorPlus和具有相近题目或MeSH词汇的相关文件

目录信息。

Journals database(期刊数据库)包含了每一个Entrez数据库中的所有期刊信息。目前共收录有超过22,000条记录,期刊数据库为每一份期刊都建立了ISO刊名缩写索引、出版日期索引和NLM catalog链接索引以及Entrez中引用该期刊中文献的索引。

5 基因序列信息以及相关序列信息

5.1 数据库

5.1.1 Entrez Gene

Entrez Gene数据库为用户提供基因序列注释和检索服务,还会链接到NCBI的Map Viewer、Evidence Viewer、Model Maker、BLAST Link (Blink)、protein domains from the Conserved Domain Database(CDD)等数据库资源以及其它与基因相关的资源。Entrez Gene数据库收录了来自5300多个物种的430万条基因记录。而且,NCBI除了拥有自己的注释工作人员之外,还在不断从许多其它国际合作组织那里获

取新的基因注释记录信息。

Entrez Gene数据库与PubMed中最新引文之间的链接是由基因注释人员负责维护的,这项功能也被称作GeneRIF。完整的Entrez Gene数据集以及物种特异性的数据亚集可以在NCBI FTP站点中的NCBI ASN.1中找到。一种可以将NCBI ASN.1格式转化成XML格式的名为ene2xml的软件也可以到

https://www.sodocs.net/doc/9513035280.html,/toolbox/ncbi_tools/converters/by_program/gene 2xml下载。

5.1.2 UniGene和ProtEST

UniGene从属于GenBank的一部分,专门收集转录体序列数据,包括EST序列和非冗余序列,每一条UniGene记录都代表一个潜在的基因。UniGene收录了GenBank中来自所有物种的将近70,000条EST序列,这些物种中包括58种动物、43种植物和真菌以及6种真核生物。现在,在构建基因表达谱芯片时都是参考UniGene中的数据来进行设计的。UniGene数据库每周都会更新EST信息,每两个月会更新序列信息。ProtEST作为UniGene序列的辅助确认工具会预先

对序列进行BLAST比对,它所使用的比对方式是将UniGene 核酸序列的6种可能翻译蛋白质序列与模式生物蛋白质序列进行比对。

5.1.3 HomoloGene数据库

HomoloGene数据库是一个在20种完全测序的真核生物基因组中自动检索同源基因的系统,包括直系同源与旁系同源。HomoloGene的结果报告包括基因同源性和来自OMIM、小鼠基因组信息学(Mouse Genome Informatics, MGI)、斑马鱼信息网络(Zebrafish Information Network, ZFIN)、酵母基因组数据库(Saccharomyces Genome Database, SGD)、直系同源基因簇(Clusters of Orthologous Groups,COG)和果蝇数据库(FlyBase)的基因表型信息。HomoloGene下载功能能下载HomoloGene中的转录体、蛋白质和基因组序列信息,还能下载基因组中特定基因的上游和下游序列。

5.1.4 Reference Sequences

Reference Sequences(RefSeq)数据库是一个收录注释过的非冗余转录体、蛋白质和基因组序列数据库。2008年,Reference Sequences数据库收录的记录增加了40%。同年7月公布的

Reference Sequences数据库30共收录了来自5400种不同物种的300万条核酸序列和560万条蛋白质序列。用户可以通过Entrez核酸和蛋白质数据库搜索到RefSeq序列,也可以通过NCBI FTP站点进入RefSeq数据库。

5.1.5 GenBank和其它数据库来源的序列

用户可以通过三个Entrez数据库——Nucleotide、EST和Genome Survey Sequence(GSS)(这三个数据库在E-Utilities中分别称作nuccore、nucest和nucgss)搜索到GenBank中的序列。Entrez Nucleotide数据库含有除了收录之外的GenBank 中所有的序列,它还收录有全基因组鸟枪法测序序列、第三方注释序列(Third Party Annotation sequences)和Entrez结构数据库中的序列。对这些记录中编码序列概念上的翻译信息都收录在了Entrez蛋白质数据库中。EST数据库收录了GenBank EST中的所有数据和没有生物学注释信息的“单分子识别首次通过(first-pass single-read)”的cDNA序列。同样,GenBank中的GSS数据库也收录了没有生物学注释信息的单分子识别首次通过的基因组序列。

5.2 分析工具

5.2.1 ORF Finder、Spidey和Splign

NCBI提供了几种分析工具可以帮助用户在基因组内发现编码序列。Open Reading Frame(ORF)Finder程序可以将一段DNA序列按照6种进行翻译,然后返回某一段DNA序列中可能的ORF。

Spidey工具将一组真核生物的mRNA序列与一个基因组序列进行比对,使用4种物种的RNA剪切模型(脊椎动物、果蝇、秀丽隐杆线虫和植物)来预测RNA剪切位点。Splign是一种通过比对cDNA和基因组序列来发现剪切位点的工具,它可以在测序出现错误的情况下使用,还可以进行跨物种的比对。Splign使用了一种Needleman-Wunsch算法,与区域化算法(compartmentization algorithm)一起使用能发现可能的基因位点。用户可以在Splign网页上下载单独为大批量分析而专门设计的Splign工具使用。

5.2.2 Electronic PCR(e-PCR)

正向e-PCR能在UniSTS数据库收录的超过510,000条STS 标记物中搜索到与STS引物配对的序列。反向e-PCR则通过搜索基因组数据库和转录体数据库来估计基因组结合位点、

扩增子大小和引物特异性。用户可以在

https://www.sodocs.net/doc/9513035280.html,/pub/schuler/e-PCR上找到e-PCR的源代码(source code)。

5.2.3 Conserved CDS database(CCDS)

不同的科研小组使用他们各自的方法研究同一物种基因组时,对于基因组中的基因定位可能会得到相似但不完全相同的结论。这样,就会对其它的科研工作者造成困扰。在所有的模式生物中,目前对人类和小鼠的基因组序列研究得最多也最透彻,因此它们最适合用来作为“标准的(consensus)”基因注释的“实验材料”。

CCDS数据库计划(https://www.sodocs.net/doc/9513035280.html,/CCDS/)就是由NCBI、欧洲生物信息学研究院(European Bioinformatics Institute)、韦尔科姆基金会桑格研究院(Wellcome Trust Sanger Institute)和加州大学圣克鲁兹分校(UCSC)共同合作建立的标准的有关人类和小鼠基因蛋白质编码区的数据库,该数据库会不断更新来保持其高水准。到目前为止,CCDS数据库共收录了超过20,000条人类基因CDS注释数据和17,500条小鼠基因CDS注释数据。用户可以在CCDS的网页上使用基因名或序列ID进行搜索,还可以链接到Entrez Gene数据库、

历史记录信息、转录体和蛋白质序列、Map Viewer、Ensemble Genome Browser、UCSC Genome Browser和桑格研究院的Vega Browser。用户可以到https://www.sodocs.net/doc/9513035280.html,/pub/CCDS/下载CCDS序列数据。

6 基因组信息

6.1 数据库

6.1.1 Entrez Genome

Entrez Genome数据库收录了850多种微生物、3100多种病毒以及1600多种真核生物细胞器的完整基因组数据以及将近50种动物、绿色植物和真菌的700多条染色体信息,总共收录有6200多条序列,其中有882条是去年新增的序列信息。而对于更高等的真核生物基因组,Entrez Genome数据库会直接链接到NCBI Map Viewer。原核生物、病毒和真核生物细胞器的基因组则可以链接到专门的页面和BLAST 页面。另外还专门设有植物基因组页面(Plant Genomes Central Web page),在上面可以查询到完整的植物基因组测序计划、植物基因组BLAST或者Map Viewer等信息。

6.1.2 Entrez Genome Project

Entrez Genome Project数据库(Entrez基因组计划数据库)向用户提供了一个有关正在进行中的大规模植物基因组测序、组装、注释和作图工作的全面概况。目前,该数据库显示,一共对2200种植物进行了测序工作,其中750种已经完成了所有工作,700种正处于草图组装阶段。该数据库的规模还在不断扩大,以至于还囊括了多个单独的测序项目,例如病毒群体计划(viral population projects)、对16S核糖体RNA元基因库(16S ribosomal RNA metagenomic)等靶位点的测序计划(targeted locus sequencing projects)以及转录组计划等。Entrez基因组计划数据库与其它Entrez数据库,例如Entrez 核酸数据库和Entrez基因组数据库以及NCBI内部或者外部资源都有广泛的联系。Entrez基因组计划还为原核生物的某些特点,例如表型、活力、致病性和对生存盐浓度、温度、氧气浓度、pH值等环境因素设置了索引,这对于研究原核生物的生物学家们来说无疑是一项非常有用的功能。NCBI 鼓励各个测序中心在开始他们的测序项目之前提前登记自己的项目安排,这样就能更好的统筹安排,共享资源了。

NCBI在线BLAST使用方法与结果详解

N C B I在线B L A S T使用方法与结果详解 IMB standardization office【IMB 5AB- IMBK 08- IMB 2C】

N C B I在线B L A S T使用方法与结果详解 BLAST(BasicLocalAlignmentSearchTool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。 BLAST采用一种局部的算法获得两个序列中具有相似性的序列。 Blast中常用的程序介绍: 1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。 2、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。 3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。 4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。 5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。 NCBI的在线BLAST: 下面是具体操作方法 1,进入在线BLAST界面,可以选择blast特定的物种(如人,小鼠,水稻等),也可以选择blast所有的核酸或蛋白序列。不同的blast程序上面已经有了介绍。这里以常用的核酸库作为例子。 2,粘贴fasta格式的序列。选择一个要比对的数据库。关于数据库的说明请看NCBI在线blast数据库的简要说明。一般的话参数默认。 3,blast参数的设置。注意显示的最大的结果数跟E值,E值是比较重要的。筛选的标准。最后会说明一下。 4,注意一下你输入的序列长度。注意一下比对的数据库的说明。 5,blast结果的图形显示。没啥好说的。 6,blast结果的描述区域。注意分值与E值。分值越大越靠前了,E值越小也是这样。7,blast结果的详细比对结果。注意比对到的序列长度。评价一个blast结果的标准主要有三项,E值(Expect),一致性(Identities),缺失或插入(Gaps)。加上长度的话,就有四个标准了。如图中显示,比对到的序列长度为1405,看Identities这一值,才匹配到1344bp,而输入的序列长度也是为1344bp(看上面的图),就说明比对到的序列要长一

ncbi的使用方法

NCBI(美国国立生物技术信息中心)资源介绍及使用手册 作者:未知来源:中科院上海生命科学研究院生物信息中心时间:2006-12-27 NCBI 资源介绍 本文目录: NCBI(美国国立生物技术信息中心) 简介 NCBI 站点地图 NCBI癌症基因组研究 NCBI-Coffee Break NCBI-基因和疾病 NCBI-UniGene Cluster of Orthologous Groups of proteins (COG)介绍 Gene Expression Omnibus (GEO)介绍 LocusLink介绍 关于RefSeq:NCBI参考序列 NCBI(美国国立生物技术信息中心)简介 介绍 理解自然无声但精妙的关于生命细胞的语言是现代分子生物学的要求。通过只有四个字母来代表DNA化学亚基的字母表,出现了生命过程的语法,其最复杂形式就是人类。阐明和使用这些字母来组成新的“单词和短语”是分子生物学领域的中心焦点。数目巨大的分子数据和这些数据的隐秘而精细的模式使得计算机化的数据库和分析方法成为绝对的必须。挑战在于发现新的手段去处理这些数据的容量和复杂性,并且为研究人员提供更好的便利来获得分析和计算的工具,以便推动对我们遗传之物和其在健康和疾病中角色的理解。 国立中心的建立 后来的参议员Claude Pepper意识到信息计算机化过程方法对指导生物医学研究的重要性,发起了在1988年11月4日建立国立生物技术信息中心(NCBI)的立

法。NCBI是在NIH的国立医学图书馆(NLM)的一个分支。NLM是因为它在创立和维护生物信息学数据库方面的经验被选择的,而且这可以建立一个内部的关于计算分子生物学的研究计划。NCBI的任务是发展新的信息学技术来帮助对那些控制健康和疾病的基本分子和遗传过程的理解。它的使命包括四项任务: 建立关于分子生物学,生物化学,和遗传学知识的存储和分 析的自动系统 实行关于用于分析生物学重要分子和复合物的结构和功能 的基于计算机的信息处理的,先进方法的研究 加速生物技术研究者和医药治疗人员对数据库和软件的使用。 全世界范围内的生物技术信息收集的合作努力。 NCBI通过下面的计划来实现它的四项目的: 基本研究 NCBI有一个多学科的研究小组包括计算机科学家,分子生物学家,数学家,生物化学家,实验物理学家,和结构生物学家,集中于计算分子生物学的基本的和应用的研究。这些研究者不仅仅在基础科学上做出重要贡献,而且往往成为应用研究活动产生新方法的源泉。他们一起用数学和计算的方法研究在分子水平上的基本的生物医学问题。这些问题包括基因的组织,序列的分析,和结构的预测。目前研究计划的一些代表是:检测和分析基因组织,重复序列形式,蛋白domain 和结构单元,建立人类基因组的基因图谱,HIV感染的动力学数学模型,数据库搜索中的序列错误影响的分析,开发新的数据库搜索和多重序列对齐算法,建立非冗余序列数据库,序列相似性的统计显著性评估的数学模型,和文本检索的矢量模型。另外,NCBI研究者还坚持推动与NIH内部其他研究所及许多科学院和政府的研究实验室的合作。 数据库和软件

NCBI分子数据库介绍

NCBI分子数据库介绍 信息来源:中国生命科学论坛更新时间:2003-10-12 2:33:00 核酸序列(nucleotides) ·Entrez核酸- 用accession number,作者姓名,物种,基因/蛋白名字,以及很多其它的文本术语来搜索核酸序列记录(在GenBank + PDB中)。更多的关于Entrez的信息见下。如果要检索大量数据,也可使用Batch Entrez (批量Entrez)。 ·RefSeq - NCBI数据库的参考序列。校正的,非冗余集合,包括基因组DNA contigs,已知基因的mRNAs和蛋白,在将来,整个的染色体。Accession numbers用NT_xxxxxx, NM_xxxxxx, NP_xxxxxx, 和NC_xxxxxx的形式来表示。 ·dbEST - 表达序列标签数据库,短的、单次(测序)阅读的cDNA序列。也包括来自于差异显示和RACE实验的cDNA序列。 ·dbGSS -基因组调查序列的数据库,短的、单次(测序)阅读的cDNA序列,exon trap获得的序列,cosmid/BAC/YAC 末端,及其他。 ·dbSTS -序列标签位点的数据库,短的在基因组上可以被唯一操作的序列,用于产生作图位点。 ·dbSNP - 单核苷酸多态性数据库,包括SNPs,小范围的插入/缺失,多态重复单元,和微卫星变异。 完整的基因组 ·参见Genome 和Maps 部分,包括各种物种资源,人,小鼠,大鼠,酵母,线虫,疟原虫,细菌,病毒,viroids,质粒。 ·UniGene - 被整理成簇的EST和全长mRNA 序列,每一个代表一种特定已知的或假设的人类基因,有定位图和表达信息以及同其它资源的交叉参考。序列数据可以以cluster 形式在Unigene 网页下载,完整的数据可以从FTP站点repository/UniGene 目录下下载。 1.奶牛UniGene 2.人类UniGene 3.小鼠UniGene 4.大鼠UniGene 5.斑马鱼UniGene ·BLAST - 将你的序列同核酸库中的的序列比较,检索相似的序列。(更详细的信息见下面Tools/Sequence 相似搜索部分) 蛋白序列(proteins) · Entrez蛋白-用accession number,作者姓名,物种,基因/蛋白名字,以及很多其它的文本术语来搜索蛋白序列记录(在GenPept + Swiss-Prot + PIR + RPF + PDB中)。更多的关于Entrez的信息见下。如果要检索大量数据,也可使用Batch Entrez(批量Entrez)。

ncbi中文说明书

NCBI (National Center for Biotechnology Information), 美国国家生物技术信息中心 [url]https://www.sodocs.net/doc/9513035280.html,/[/url] NCBI是NIH的国立医学图书馆(NLM)的一个分支。 NCBI提供检索的服务包括: 1.GenBank(NIH遗传序列数据库):一个可以公开获得所有的DNA序列的注释过的收集。GenBank是由NCBI受过分子生物学高级训练的工作人员通过来自各个实验室递交的序列和同国际核酸序列数据库(EMBL和DDBJ)交换数据建立起数据库的。它同日本和欧洲分子生物学实验室的DNA数据库共同构成了国际核酸序列数据库合作。这三个组织每天交换数据。其中的数据以指数形式增长,最近的数据为它已经有来自47000个物种的30亿个碱基。 2.Molecular Databases(分子数据库): Nucleotide Sequence(核酸序列库):从NCBI其他如Genbank数据库中收集整理核酸序列,提供直接的检索。 Protein Sequence (蛋白质序列库):与核酸类似,也是从NCBI多个不同资源中编译整理的,方便研究者的直接查询。 Structure(结构)-——关于NCBI结构小组的一般信息和他们的研究计划,另外也可以访问三维蛋白质结构的分子模型数据库(MMDB)和用来搜索和显示结构的相关工具。MMDB:分子模型数据库—一个关于三维生物分子结构的数据库,结构来自于X-ray晶体衍射和NMR色谱分析。 Taxonomy(分类学)——NCBI的分类数据库,包括大于7万余个物种的名字和种系,这些物种都至少在遗传数据库中有一条核酸或蛋白序列。其目的是为序列数据库建立一个一致的种系发生分类学。 3.Literature Databases(文献数据库) (1)PubMed是NLM提供的一项服务,能够对MEDLINE上超过1200万条的上世纪六十年代中期至今的杂志引用和其他的生命科学期刊进行访问,并可以连接到参与的出版商网络站点的全文文章和其他相关资源。 (2)PMC/PubMed Center:也是NLM的生命科学期刊文献的数字化存储数据库,用户可以免费获取PMC的文章全文,除了部分期刊要求对近期的文章付费。 (3)OMIM(孟德尔人类遗传):有关人类基因和无序基因的目录数据库由Victor A.McKusick和他的同事共同创造和编辑的,由NCBI网站负责开发,其中也包括对MEDINE众多资源和Entrez系统的序列记录,以及NCBI中其他有关资源的链接。

一步一步教你使用NCBI

一步一步教你使用NCBI 查找DNA、mRNA、cDNA、Protein、promoter、引物设计、BLAST序列比对等 作者:urbest 2007-8-1 苏州大学生命科学学院

最近看到很多战友在论坛上询问如何查询基因序列、如何进行引物设计、如何使用BLAST进行序列比对……,这些问题在NCBI上都可以方便的找到答案。现在我就结合我自己使用NCBI的一些经历(经验)跟大家交流一下BCBI的使用。希望大家都能发表自己的使用心得,让我们共同进步! 我分以下几个部分说一下NCBI的使用: Part one 如何查找基因序列、mRNA、Promoter Part two 如何查找连续的mRNA、cDNA、蛋白序列 Part three 运用STS查找已经公布的引物序列 Part four 如何运用BLAST进行序列比对、检验引物特异性 特别感谢本版版主,将这个帖子置顶! 从发帖到现在,很多战友对该帖给与了积极的关注,在此向给我投票的(以及想给我投票却暂时不能投票的)各位战友表示真诚的感谢,谢谢各位战友! 请大家对以下我发表的内容提出自己的意见。关于NCBI其他方面的使用也请水平较高的战友给予补充 First of all,还是让我们从查找基因序列开始。 第一部分 利用Map viewer查找基因序列、mRNA序列、 启动子(Promoter) 下面以人的IL6(白细胞介素6)为例讲述一下具体的操作步骤 1.打开Map viewer页面,网址为:https://www.sodocs.net/doc/9513035280.html,/mapview/index.html 在search的下拉菜单里选择物种,for后面填写你的目的基因。操作完毕如图所示: 2.点击“GO”出现如下页面:

NCBI在线BLAST使用方法与结果详解

NCBI在线BLAST使用方法与结果详解 BLAST(Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA 数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。 BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。 Blast中常用的程序介绍: 1、BLASTP是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。 2、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(一条核酸序列会被翻译成可能的六条蛋白),再对每一条作一对一的蛋白序列比对。 3、BLASTN是核酸序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。 4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。 5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。 NCBI的在线BLAST:下面是具体操作方法 1,进入在线BLAST界面,可以选择blast特定的物种(如人,小鼠,水稻等),也可以选择blast所有的核酸或蛋白序列。不同的blast程序上面已经有了介绍。这里以常用的核酸库作为例子。

2,粘贴fasta格式的序列。选择一个要比对的数据库。关于数据库的说明请看NCBI在线blast数据库的简要说明。一般的话参数默认。 3,blast参数的设置。注意显示的最大的结果数跟E值,E值是比较重要的。筛选的标准。最后会说明一下。

一步一步教你使用NCBI数据库资源

一步一步教你使用NCBI数据库资源 随着ncbi数据库各种资源的涌现,NCBI已经成为科研工作者必不可少的资料查找,数据分析的工具。那么NCBI 数据如何使用,新手入门一步一步教你认识和使用NCBI数据库。 一综合数据库 NCBI数据库集美国国立生物技术信息中心(National Center for Biotechnology Information),即我们所熟知的NCBI 是由美国国立卫生研究院(NIH)于1988年创办。创办NCBI 的初衷是为了给分子生物学家提供一个信息储存和处理的 系统。除了建有GenBank核酸序列数据库(该数据库的数据资源来自全球几大DNA数据库,其中包括日本DNA数据库DDBJ、欧洲分子生物学实验室数据库EMBL以及其它几个知名科研机构)之外,NCBI还可以提供众多功能强大的数据检索与分析工具。目前,NCBI提供的资源有Entrez、Entrez Programming Utilities、My NCBI、PubMed、PubMed Central、Entrez Gene、NCBI Taxonomy Browser、BLAST、BLAST Link (BLink)、Electronic PCR等共计36种功能,而且都可以在NCBI的主页https://www.sodocs.net/doc/9513035280.html,上找到相应链接,其中多

半是由BLAST功能发展而来的。 1 NCBI最新进展 1.1 PubMed搜索功能的增强 去年,NCBI对PubMed进行了几项改进工作,改动最大的是搜索界面和摘要浏览界面。其中,搜索界面中新增了“Advanced Search”选项(这实际上是对以往“Limits”和“Preview/Index”功能的整合),并且增加了一个新的窗口,用户可以在此窗口下通过“论文作者名”、“论文所属杂志名称”、“论文出版日期”等限定条件进行搜索。而且,“论文作者名”和“论文所属杂志名称”还设有文本框自动填充功能。现在,在PubMed数据库中进行文本搜索的同时还可以立即通过两个“内容传感器(content sensors)”进行分析。一个“内容传感器”是根据作者姓名、所属杂志名称或杂志名缩写、出版日期、卷号或刊号等信息进行分析,然后将符合条件的搜索结果排列到结果列表的顶端。另一个“内容传感器”是根据文章是否与用户给出的条件,例如是否与某种药物相关,在NCBI的新增数据库PubMed Clinical Q&A 中进行搜索,然后给出搜索结果。

NCBI资源介绍及使用手册

NCBI资源介绍及使用手册 NCBI资源介绍 本文目录: NCBI(美国国立生物技术信息中心) 简介 NCBI站点地图 NCBI癌症基因组研究 NCBI-Coffee Break NCBI-基因和疾病 NCBI-UniGene Cluster of Orthologous Groups of proteins(COG)介绍 Gene Expression Omnibus (GEO)介绍 LocusLink介绍 关于RefSeq:NCBI参考序列 NCBI(美国国立生物技术信息中心)简介 介绍 理解自然无声但精妙的关于生命细胞的语言是现代分子生物学的要求。通过只有四个字母来代表DNA化学亚基的字母表,出现了生命过程的语法,其最复杂形式就是人类。阐明和使用这些字母来组成新的“单词和短语”是分子生物学领域的中心焦点。数目巨大的分子数据和这些数据的隐秘而精细的模式使得计算机化的数据库和分析方法成为绝对的必须。挑战在于发现新的手段去处理这些数据的容量和复杂性,并且为研究人员提供更好的便利来获得分析和计算的工具,以便推动对我们遗传之物和其在健康和疾病中角色的理解。 国立中心的建立 后来的参议员Claude Pepper意识到信息计算机化过程方法对指导生物医学研究的重要性,发起了

在1988年11月4日建立国立生物技术信息中心(NCBI)的立法。NCBI是在NIH的国立医学图书馆(NLM)的一个分支。NLM是因为它在创立和维护生物信息学数据库方面的经验被选择的,而且这可以建立一个内部的关于计算分子生物学的研究计划。NCBI的任务是发展新的信息学技术来帮助对那些控制健康和疾病的基本分子和遗传过程的理解。它的使命包括四项任务: 建立关于分子生物学,生物化学,和遗传学知识的存储和分析的自动系统 实行关于用于分析生物学重要分子和复合物的结构和功能的基于计算机的信息处理的,先进方法的研究 加速生物技术研究者和医药治疗人员对数据库和软件的使用。 全世界范围内的生物技术信息收集的合作努力。 NCBI通过下面的计划来实现它的四项目的: 基本研究 NCBI有一个多学科的研究小组包括计算机科学家,分子生物学家,数学家,生物化学家,实验物理学家,和结构生物学家,集中于计算分子生物学的基本的和应用的研究。这些研究者不仅仅在基础科学上做出重要贡献,而且往往成为应用研究活动产生新方法的源泉。他们一起用数学和计算的方法研究在分子水平上的基本的生物医学问题。这些问题包括基因的组织,序列的分析,和结构的预测。目前研究计划的一些代表是:检测和分析基因组织,重复序列形式,蛋白domain和结构单元,建立人类基因组的基因图谱,HIV感染的动力学数学模型,数据库搜索中的序列错误影响的分析,开发新的数据库搜索和多重序列对齐算法,建立非冗余序列数据库,序列相似性的统计显著性评估的数学模型,和文本检索的矢量模型。另外,NCBI研究者还坚持推动与NIH内部其他研究所及许多科学院和政府的研究实验室的合作。 数据库和软件 在1992年10月,NCBI承担起对GenBank DNA序列数据库的责任。NCBI受过分子生物学高级训练的工作人员通过来自各个实验室递交的序列和同国际核酸序列数据库(EMBL和DDBJ)交换数据建立起数据库。同美国专利和商标局的安排使得专利的序列信息也被整合。 GenBank是NIH遗传序列数据库,一个所有可以公开获得的DNA序列的注释过的收集。GenBank同日本和欧洲分子生物学实验室的DNA数据库共同构成了国际核酸序列数据库合作。这三个组织每天交换数据。 GenBank以指数形式增长,核酸碱基数目大概每14个月就翻一个倍。最近,GenBank拥有来自47,000个物种的30亿个碱基。 孟德尔人类遗传(OMIM),三维蛋白质结构的分子模型数据库(MMDB),唯一人类基因序列集合

NCBI_功能详细介绍[1]

GenBank Overview 基本信息 ?什么是GenBank?GenBank是一个有来自于70,000多种生物的核苷酸序列的数据库。每条纪录都有编码区(CDS)特征的注释,还包括氨基酸的翻译。GenBank属于一个序列数据库的国际合作组织,包括EMBL和DDBJ。 ?纪录样本- 关于GenBank的各个字段的详细描述,以及同Entrez搜索字段的交叉索引。 ?访问GenBank - 通过Entrez Nucleotides来查询。用accession number,作者姓名,物种,基因/蛋白名字,还有许多其他的文本术语来查询。关于Entrez更多的信息请看下文。用BLAST来在GenBank和其他数据库中进行序列相似搜索。用E-mail来访问Entrez和BLAST可以通过Query 和BLAST服务器。另外一种选择是可以用FTP下载整个的GenBank和更新数据。 ?增长统计- 参见公布通知的2.2.6(每个分类的统计),2.2.7(每个物种的统计),2.2.8(GenBank 增长)小节。 ?公布通知,最新- 最近和即将有的变化,GenBank的分类,数据增长统计,GenBank的引用。 ?公布通知,旧- 同上相同,是过去公布的统计。 ?遗传密码- 15个遗传密码的概要。用来确保GenBank中纪录的编码序列被正确的翻译。(向)GenBank提交(数据) ?关于提交序列数据,收到accession number,和对纪录作更新的一般信息。 ?BankIt - 用于一条或者少数条提交的基于WWW的提交工具软件。(请在提交前用VecScreen去除载体) ?Sequin - 提交软件程序,用于一条或者很多条的提交,长序列,完整基因组,alignments,人群/种系/突变研究的提交。可以独立使用,或者用基于TCP/IP的“network aware”模式,可以链接到其他NCBI的资源和软件比如Entrez和PowerBLAST。(请在提交前用VecScreen去除载体)?ESTs - 表达序列标签,短的、单次(测序)阅读的cDNA序列。也包括来自于差异显示和RACE 实验的cDNA序列。 ?GSSs - 基因组调查序列,短的、单次(测序)阅读的cDNA序列,exon trap获得的序列,cosmid/BAC/YAC末端,及其他。 ?HTGs - 来自于大规模测序中心的高通量基因组序列,未完成的(阶段0,1,2)和完成的(阶段3)序列。(注意:完成的人类的HTG序列可以同时在GenBank和Human Genome Sequencing页面上访问。) ?STSs - 序列标签位点。短的在基因组上可以被唯一操作的序列,用于产生作图位点。 ?注:SNPs - 人类的和其他物种的遗传变异数据可以提交到NCBI数据库的单核苷酸多态性库中(dbSNP)。 国际核苷酸序列数据库合作组织 ?GenBank,DDBJ,EMBL - 合作计划的概述,并链接到相应的主页。GenBank,DDBJ(DNA Data Bank of Japan),and EMBL (European Molecular Biology Laboratory)数据库共享的数据是每天都交换的,因此他们是相等的。数据纪录的格式和搜索方式可能会不一样,但是accession number,序列数据和注解都是一模一样的。即,你可以用accession number U12345在GenBank,DDBJ或EMBL中查找相应纪录,得到的结果是完全一样的序列数据,参考内容等等。 ?DDBJ/EMBJ/GenBank特性表—特性表格式和标准被合作数据库用在序列记录的注释上,使得数据共享成为可能,包括详细的描述生物特性和特性限定语的附录,以及IUPAC规定的核苷酸和氨基酸的代号。

怎么使用NCBI[1]

怎么使用NCBI (National Center for Biotechnology Information), 美国国家生物技术信息中心 [url][/url] NCBI是NIH的国立医学图书馆(NLM)的一个分支。 NCBI提供检索的服务包括: 1.GenBank(NIH遗传序列数据库):一个可以公开获得所有的DNA序列的注释过的收集。GenBank是由NCBI受过分子生物学高级训练的工作人员通过来自各个实验室递交的序列和同国际核酸序列数据库(EMBL和DDBJ)交换数据建立起数据库的。它同日本和欧洲分子生物学实验室的DNA数据库共同构成了国际核酸序列数据库合作。这三个组织每天交换数据。其中的数据以指数形式增长,最近的数据为它已经有来自47000个物种的30亿个碱基。 2.Molecular Databases(分子数据库): Nucleotide Sequence(核酸序列库):从NCBI其他如Genbank数据库中收集整理核酸序列,提供直接的检索。 Protein Sequence (蛋白质序列库):与核酸类似,也是从NCBI多个不同资源中编译整理的,方便研究者的直接查询。 Structure(结构)-——关于NCBI结构小组的一般信息和他们的研究计划,另外也可以访问三维蛋白质结构的分子模型数据库(MMDB)和用来搜索和显示结构的相关工具。MMDB:分子模型数据库—一个关于三维生物分子结构的数据库,结构来自于X-ray晶体衍射和NMR色谱分析。 Taxonomy(分类学)——NCBI的分类数据库,包括大于7万余个物种的名字和种系,这些物种都至少在遗传数据库中有一条核酸或蛋白序列。其目的是为序列数据库建立一个一致的种系发生分类学。 3.Literature Databases(文献数据库) (1)PubMed是NLM提供的一项服务,能够对MEDLINE上超过1200万条的上世纪六十年代中期至今的杂志引用和其他的生命科学期刊进行访问,并可以连接到参与的出版商网络站点的全文文章和其他相关资源。 (2)PMC/PubMed Center:也是NLM的生命科学期刊文献的数字化存储数据库,用户可以免费获取PMC的文章全文,除了部分期刊要求对近期的文章付费。 (3)OMIM(孟德尔人类遗传):有关人类基因和无序基因的目录数据库由Victor A.McKusick 和他的同事共同创造和编辑的,由NCBI网站负责开发,其中也包括对MEDINE众多资源和Entrez系统的序列记录,以及NCBI中其他有关资源的链接。

NCBI使用方法

NCBI使用方法 NCBI (National Center for Biotechnology Information), 美国国家生物技术信息 中心 [url]https://www.sodocs.net/doc/9513035280.html,/[/url] NCBI是NIH的国立医学图书馆(NLM)的一个分支。 NCBI提供检索的服务包括: 1.GenBank(NIH遗传序列数据库):一个可以公开获得所有的DNA序列的注释过的收集。GenBank是由NCBI受过分子生物学高级训练的工作人员通过来自各个实验室递交的序列和同国际核酸序列数据库(EMBL和DDBJ)交换数据建立起数据库的。它同日本和欧洲分子生物学实验室的DNA数据库共同构成了国际核酸序列数据库合作。这三个组织每天交换数据。其中的数据以指数形式增长,最近的数据为它已经有来自47000个物种的30亿个碱基。 2.Molecular Databases(分子数据库): Nucleotide Sequence(核酸序列库):从NCBI其他如Genbank数据库中收集整理核 酸序列,提供直接的检索。 Protein Sequence (蛋白质序列库):与核酸类似,也是从NCBI多个不同资源中编 译整理的,方便研究者的直接查询。 Structure(结构)-——关于NCBI结构小组的一般信息和他们的研究计划,另外也可以访问三维蛋白质结构的分子模型数据库(MMDB)和用来搜索和显示结构的相关工具。MMDB:分子模型数据库—一个关于三维生物分子结构的数据库,结构来自于X-ray晶体衍 射和NMR色谱分析。 Taxonomy(分类学)——NCBI的分类数据库,包括大于7万余个物种的名字和种系,这些物种都至少在遗传数据库中有一条核酸或蛋白序列。其目的是为序列数据库建立一个一 致的种系发生分类学。 3.Literature Databases(文献数据库) (1)PubMed是NLM提供的一项服务,能够对MEDLINE上超过1200万条的上世纪六十年代中期至今的杂志引用和其他的生命科学期刊进行访问,并可以连接到参与的出版商网络 站点的全文文章和其他相关资源。 (2)PMC/PubMed Center:也是NLM的生命科学期刊文献的数字化存储数据库,用户可以免费获取PMC的文章全文,除了部分期刊要求对近期的文章付费。 (3)OMIM(孟德尔人类遗传):有关人类基因和无序基因的目录数据库由Victor A.McKusick和他的同事共同创造和编辑的,由NCBI网站负责开发,其中也包括对MEDINE 众多资源和Entrez系统的序列记录,以及NCBI中其他有关资源的链接。 (4)Books:NCBI的书库不断收集生物医学方面的书籍,提供这些书籍的出版信息、摘要、目录和全文的连接,用户可以直接在检索文本框内输入一个观念就可以查询。 4.NCBI提供的附加的软件工具有:

一步一步教你使用NCBI查找DNA、mRNA、cDNA

一步一步教你使用 NCBI 查找DNA、mRNA、cDNA、... 最近看到很多战友在论坛上询问如何查询基因序列、如何进行引物设计、如何使用BLAST 进行序列比对……,这些问题在 NCBI 上都可以方便的找到答案。现在我就结合我自 己使用 NCBI的一些经历(经验)跟大家交流一下 BCBI 的使用。希望大家都能发表自己的使 用心得,让我们共同进步! 我分以下几个部分说一下 NCBI 的使用: Part one 如何查找基因序列、mRNA、Promoter Part two 如何查找连续的 mRNA、cDNA、蛋白序列 Part three 运用 STS 查找已经公布的引物序列 Part four 如何运用 BLAST 进行序列比对、检验引物特异性 特别感谢本版版主,将这个帖子置顶! 从发帖到现在,很多战友对该帖给与了积极的关注,在此向给我投票的(以及想给我 投票却暂时不能投票的)各位战友表示真诚的感谢,谢谢各位战友! 请大家对以下我发表的内容提出自己的意见。关于NCBI 其他方面的使用也请水平较高 的战友给予补充 First of all,还是让我们从查找基因序列开始。 第一部分利用Map viewer 查找基因序列、mRNA 序列、 启动子(Promoter) 下面以人的 IL6(白细胞介素 6)为例讲述一下具体的操作步骤 1.打开Map viewer 页面,网址为: https://www.sodocs.net/doc/9513035280.html,/mapview/index.html 在 search 的下拉菜单里选择物种,for 后面填写你的目的基因。操作完毕如图所示:

2.点击“GO”出现如下页面: 3.在步骤二图示的右下角有一个Quick Filter,下面是让你选择的几个复选框,在Gene 前面的小方框里打勾,然后点击Filter. 出现下图:

NCBI数据库集

NCBI数据库集 生物信息学 2010-08-20 16:08:59 阅读202 评论0字号:大中小订阅 NCBI数据库集 https://www.sodocs.net/doc/9513035280.html,/?p=20049 一综合数据库 NCBI数据库集 美国国立生物技术信息中心(National Center for Biotechnology Information),即我们所熟知的NCBI是由美国国立卫生研究院(NIH)于1988年创办。创办NCBI的初衷是为了给分子生物学家提供一个信息储存和处理的系统。除了建有GenBank核酸序列数据库(该数据库的数据资源来自全球几大DNA数据库,其中包括日本DNA数据库DDBJ、欧洲分子生物学实验室数据库EMBL以及其它几个知名科研机构)之外,NCBI还可以提供众多功能强大的数据检索与分析工具。目前,NCBI提供的资源有Entrez、Entrez Programming Utilities、My NCBI、PubMed、PubMed Central、Entrez Gene、NCBI Taxonomy Browser、BLAST、BLAST Link (BLink)、Electronic PCR等共计36种功能,而且都可以在NCBI的主页https://www.sodocs.net/doc/9513035280.html,上找到相应链接,其中多半是由BLAST功能发展而来的。 1 NCBI最新进展 1.1 PubMed搜索功能的增强 去年,NCBI对PubMed进行了几项改进工作,改动最大的是搜索界面和摘要浏览界面。其中,搜索界面中新增了“Advanced Search”选项(这实际上是对以往“Limits”和“Preview/Index”功能的整合),并且增加了一个新的窗口,用户可以在此窗口下通过“论文作者名”、“论文所属杂志名称”、“论文出版日期”等限定条件进行搜索。而且,“论文作者名”和“论文所属杂志名称”还设有文本框自动填充功能。现在,在PubMed数据库中进行文本搜索的同时还可以立即通过两个“内容传感器(content sensors)”进行分析。一个“内容传感器”是根据作者姓名、所属杂志名称或杂志名缩写、出版日期、卷号或刊号等信息进行分析,

NCBI所有数据库简介

美国国家生物技术信息中心 (National Center of Biotechnology Information) 唐志立它的使命包括四项任务: 1. 建立关于分子生物学,生物化学,和遗传学知识的存储和分析的自动系统 2. 实行关于用于分析生物学重要分子和复合物的结构和功能的基于计算机的信息处理的,先进方法的研究 3. 加速生物技术研究者和医药治疗人员对数据库和软件的使用。

山东师范大学 2016年4月10日星期日30则留学生经典笑话,英语不好伤不起!凭你在国内口语练得多么娴熟,去了国外,照样有犯痴呆傻的时候! 1、有次房东问我:did u eat anyting yet? 我说:no. 她听后重复了一遍:so u didn‘t eat anyting. 我说:yes. 房东老太太犹豫了下又问:did u eat? 我说:no. 她接着说:so u didn‘t eat. 我说:yes. 估计她当时要崩溃了…… 2、刚上班不久,有个公司的A/R打电话来催支票,我循例问了一下他是哪间公司打来的,那男的很有礼貌的说:This is xxx calling from Beach Brother.

听懂了很开心,不过由于对公司名字还不熟,心想先用笔记下来公司名,省得等下忘记了,正得意忘形之间,顺嘴开始拼写人家公司的名字,还说得一本正经:b.i.t.c.h.bitch, correct? 那男的终于还是没能忍住怒火,近似于怒吼似的对我喊道:NO! B.E.A. C.H.BEACH! 接下来的一年里,没再跟这间公司有过任何生意往来…… 3、我男朋友以前在温哥华乘skytrain 的时候,一个白人女人说:I am sorry. 他直接说:you are welcome. 对方都呆了。 4、第一次跟老外去打painball,玩的是抢旗的那种。由于第一次玩,一直跟着个看起来很专业的队友跑,一路上躲着子弹跑到对方的base. 我们人都挂了,对方就剩一个人在看老家,就听那老外跟我说了一大堆术语,我

如何在ncbi上检索

如何在ncbi上检索NCBI包括五个部分,第一部分是欢迎进入NCBI,包括NCBI的最新信息、计划与活动、读者来信、服务地址和用户评论等。第二部分是基因序列数据库(GenBank),包括基因库概述、检索与投稿。第三部分是数据库服务,包括免费的PubMed检索、Entrez 检索、BLAST序列族性检索、电子邮件服务(详见本章第四节)、匿名FTP服务。第四部分是NCBI的其它资源。GenBank的检索在NCBI主页的第二部分点击"Searching GenBank",即可进入GenBank的检索屏幕。NCBI?提供了五种检索,即Entrez浏览检索、BLAST序列类似性检索、dbEST检索、dbSTS?检索和文本检索(Text Searching)。一、Entrez浏览检索1.Entrez检索的数据库及其检索信息Entrez浏览器(Entrez Browser)可以检索以下与NCBI?链接的基因序列数据库的分子生物数据和书目文献资料。???? (1) GenBank、EMBL、DDBJ中的DNA序列; ???? (2) SWISS-PROT、PIR、PRF、PDB中的蛋白质序列以及DNA序列数据库中翻译的蛋白质序列; ???? (3) 基因和染色体图像数据; ???? (4) PDB以及收入NCBI分子模型数据库(MMDB)的蛋白质三维结构; ???? (5) 通过PubMed检索Medline和PreMedline数据库。???? 2.Entrez检索功能???? Entrez提供了以下三种检索功能。 ?? (1)自由词检索功能??? 用户可以通过文本词、关键词、截词、期刊名或文献的作者检索Entrez数据库。截词用*号,期刊名必须用Medline刊名缩写,作者姓名必须是姓在前,名在后,用首字母缩写。????(2)索引词表(List Terms)检索功能 ????索引词表检索是当你键入检索词,Entrez?在你选定的字段中显示从该检索词开始的一个索引词表窗口,这时,你可以选择一个或几个词进行检索,这对单词拼写不准确时非常有用。?例如:在输入框中键入"P53",选择文本字段(Text Words)和索引词表(List Terms)?检索功能,再点击"Search",这时返回一个以"P53"开始的索引词表窗口,浏览选择一个或几个索引词,点击"Search",Entrez将返回检索结果。 ????(3)自动检索功能 ????自动检索功能就是Entrez浏览器根据用户输入的检索式自动进行检索,返回当前检索式检出的文献数,如满意,可进一步取得检索结果,如不满意,则可对当前检索式进行修改,直到用户满意为此。例如在输入框键入"P53",?选择所有字段和自动检索功能,?点击"?Search?",?Entrez返回一个Web页,包括当前检出文献数、加词检索和修改当前检索三个部分。如果你对检出文献数不满意(过多或过少),可以在加词检索部分增加更专指的检索词,以提高查准率,也可以在修改当前检索部分选择某一布尔算符(AND、OR、NOT、ANDNOT),对当前的检索策略进行修改,直到你满意为止。 ????对于检出文献,用户可以选择浏览格式进行浏览,也可以打印或存盘。 ????3 Entrez检索规则 (1)Entrez支持"*"号截词检索; ? (2)Entrez对你键入的词可以进行逻辑识别。例如:键入"Lipman DJ Genomics",Entrez将它识别为作者的姓名Lipman DJ和自由词?Genomics?,?并将提问式转换为"?Lipman ?DJ?"?AND Genomics。对于Entrez不能识别的提问式,如bac 1,必须加双引号,?系统就会将它们作为一个词进行检索; (3)Entrez支持复杂的布尔逻辑检索; (4)Entrez支持限定字段检索; 字段标识符的全称如下: WORD=Text Word, TITL=Title Word,

ncbi使用手册样本

NCBI 资源介绍 本文目录: NCBI(美国国立生物技术信息中心) 简介 NCBI 站点地图 NCBI癌症基因组研究 NCBI-Coffee Break NCBI-基因和疾病 NCBI-UniGene Cluster of Orthologous Groups of proteins( COG) 介绍 Gene Expression Omnibus ( GEO) 介绍 LocusLink介绍 关于RefSeq: NCBI参考序列 NCBI(美国国立生物技术信息中心)简介 介绍 理解自然无声但精妙的关于生命细胞的语言是现代分子生物学的要求。经过只有四个字母来代表DNA化学亚基的字母表, 出现了生命过程的语法, 其最复杂形式就是人类。阐明和使用这些字母来组成新的”单词和短语”是分子生物学领域的中心焦点。数目巨大的分子数据和这些数据的隐秘而精细的模式使得计算机化的数据库和分析方法成为绝正确必须。挑战在于发现新的手段去处理这些数据的容量和复杂性, 而且为研究人员提供更好的便利来获得分析

和计算的工具, 以便推动对我们遗传之物和其在健康和疾病中角色的理解。 国立中心的建立 后来的参议员Claude Pepper意识到信息计算机化过程方法对指导生物医学研究的重要性, 发起了在1988年11月4日建立国立生物技术信息中心( NCBI) 的立法。NCBI是在NIH的国立医学图书馆( NLM) 的一个分支。NLM是因为它在创立和维护生物信息学数据库方面的经验被选择的, 而且这能够建立一个内部的关于计算分子生物学的研究计划。NCBI的任务是发展新的信息学技术来帮助对那些控制健康和疾病的基本分子和遗传过程的理解。它的使命包括四项任务: 建立关于分子生物学, 生物化学, 和遗传学知识的存储和分析的自动系统 实行关于用于分析生物学重要分子和复合物的结构和功能的基于计算机的信息处理的, 先进方法的研究 加速生物技术研究者和医药治疗人员对数据库和软件的使用。 全世界范围内的生物技术信息收集的合作努力。 NCBI经过下面的计划来实现它的四项目的:

NCBI使用指南

一步一步教你使用NCBI 查找DNA、 mRNA、cDNA、Protein、promoter、引 物设计、BLAST 序列比对等 最近看到很多战友在论坛上询问如何查询基因序列、如何进行引物设计、如何使用 BLAST 进行序列比对……,这些问题在NCBI 上都可以方便的找到答案。现在我就结合我自己使用NCBI的一些经历(经验)跟大家交流一下BCBI 的使用。希望大家都能发表自己的使用心得,让我们共同进步! 我分以下几个部分说一下NCBI 的使用: Part one 如何查找基因序列、mRNA、Promoter Part two 如何查找连续的mRNA、cDNA、蛋白序列 Part three 运用STS 查找已经公布的引物序列 Part four 如何运用BLAST 进行序列比对、检验引物特异性 特别感谢本版版主,将这个帖子置顶! 从发帖到现在,很多战友对该帖给与了积极的关注,在此向给我投票的(以及想给我 投票却暂时不能投票的)各位战友表示真诚的感谢,谢谢各位战友! 请大家对以下我发表的内容提出自己的意见。关于NCBI 其他方面的使用也请水平较高 的战友给予补充 First of all,还是让我们从查找基因序列开始。 第一部分利用Map viewer 查找基因序列、mRNA 序列、启动子(Promoter) 下面以人的IL6(白细胞介素6)为例讲述一下具体的操作步骤 1.打开Map viewer 页面,网址为:https://www.sodocs.net/doc/9513035280.html,/mapview/index.html 在search 的下拉菜单里选择物种,for 后面填写你的目的基因。操作完毕如图所示:

相关主题