搜档网
当前位置:搜档网 › 蛋白质工程资料)

蛋白质工程资料)

蛋白质工程资料)
蛋白质工程资料)

第一节蛋白质工程的物质基础

概念:蛋白质工程(Protein Engineering)是以蛋白质的结构与功能的关系研究为基础,利用基因工程技术对现存蛋白质加以改造,组建成新型蛋白质的现代生物技术。

(一)蛋白质的来源(5min)

微生物:生长周期短,容易实现遗传操作,可以产生胞外酶。

植物:生长周期长,季节性强。

动物:医学方面的蛋白质。

(二)蛋白质的结构(5min)

一级结构,二级结构,超二级结构,结构域,三级结构,四级结构

(三)蛋白质的功能(10min)

蛋白质的生物学功能:①具有生物催化功能;②具有调节功能;③具有运输功能;④具有运动功能;⑤可作为机体的结构成分;⑥具有防御和保护功能;⑦可作为生物体发育和生长的营养物质。

(四)蛋白质的结构与功能的关系(5min)

蛋白质的生物功能与结构紧密相关

第二节蛋白质工程的原理

(一)蛋白质工程的理论依据(5min)基因指导蛋白质的合成

(二)蛋白质工程设计原理(5min)

蛋白质分子设计:基因水平,蛋白质水平

蛋白质分子设计的三种类型:小改,中改,大改

第三节蛋白质工程的程序和操作方法

(一)蛋白质工程的程序(10min)筛选纯化目的蛋白,研究其特性;制备晶体,氨基酸测序,X射线晶体衍射分析、核磁共振分析等研究,获得蛋白质结构与功能相关数据;结合生物信息学的方法对蛋白质的改造进行分析;由氨基酸序列及其化学结构预测蛋白质的空间结构,确定蛋白质结构与功能的关系,进而从中找出可以修饰的位点和可能的途径;根据氨基酸序列设计核酸引物或探针,并从cDNA文库或基因文库中获取编码该蛋白的基因序列;在基因改造方案设计的基础上,对编码蛋白的基因序列进行改造,并在不同的表达系统中表达;分离纯化表达产物,并对表达产物的结构和功能进行检测。

(二)蛋白质工程的操作方法(5min)理论基础:生物化学和结构生物学;蛋白质结构模拟预测平台:计算机辅助设计软件;提高设计的效率和正确性:分子生物学和基因工程技术,生物信息学。通过突变,重组,功能筛选等技术获得改造的蛋白质分子。

第四节蛋白质工程的产生与发展

(一)蛋白质工程与发酵工程(2min)发酵工程是指采用现代工程技术手段,利用微生物的某些特定功能,为人类生产有用的产品,或直接把微生物应用于工业生产过程的一种新技术。发酵工程的内容包括菌种的选育、培养基的配制、灭菌、扩大培养和接种、发酵过程和产品的分离提纯等方面。

(二)蛋白质工程与基因工程(2min)基因工程又称基因拼接技术和DNA重组技术,是以分子遗传学为理论基础,以分子生物学和微生物学的现代方法为手段,将不同来源的基因(DNA分子),按预先设计的蓝图,在体外构建杂种DNA分子,然后导入活细胞,以改变生物原有的遗传特性、获得新品种、生产新产品。

(三)蛋白质工程与细胞工程(2min)应用现代细胞生物学、发育生物学、遗传学和分子生物学的理论与方法,按照人们的需要和设计,在细胞水平上的遗传操作,重组细胞的结构和内含物,以改变生物的结构和功能,即通过细胞融合、核质移植、染色体或基因移植以及组织和细胞培养等方法,快速繁殖和培养出人们所需要的新物种的生物工程技术。

(四)蛋白质工程与酶工程(2min)将酶或者微生物细胞,动植物细胞,细胞器等在一定的生物反应装置中,利用酶所具有的生物催化功能,借助工程手段将相应的原料转化成有用物质并应用于社会生活的一门科

学技术。

(五)蛋白质工程与生物信息技术(2min)生物信息学基本上只是分子生物学与信息技术(尤其是因特网技术)的结合体。生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机,研究方法包括对生物学数据的搜索(收集和筛选)、处理(编辑、整理、管理和显示)及利用(计算、模拟)。研究重点主要体现在基因组学(Genomics)和蛋白学(Proteomics)两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。

(六)蛋白质工程与其他相关技术:结构分析技术

第五节蛋白质工程的应用领域(5min)

(一)医药领域(二)生物材料设计领域(三)能源领域

(四)农业领域(五)工业领域(六)其他领域

第一章蛋白质结构基础1

自然界中的蛋白质分为三类:(5min)纤维状蛋白质,球状蛋白质,膜蛋白。

第一节蛋白质的功能及应用

一、蛋白质的生物学功能(8min)1.催化2.结构成分3.储存4.运动5.转运6.调节7.信息传递8.支架作用9.防御和进攻10.其他特定功能

二、蛋白质类大分子的应用(2min)蛋白质被广泛应用于纺织食品医药农业等领域

酶制剂的工业用途聚氨基酸的应用

第二节蛋白质氨基酸与多肽链

一、常见蛋白质氨基酸的结构特征(5min)1. 蛋白质氨基酸的化学结构2.天然氨基酸具有单一结构3.氨

基酸的优势构象

二、蛋白质氨基酸的分类(10min)

(一)按照R基的化学结构进行分类

1.脂肪族氨基酸

(1)中性氨基酸:甘氨酸,丙氨酸,缬氨酸,亮氨酸,异亮氨酸

(2)含羟基或硫氨基酸:丝氨酸,苏氨酸,半胱氨酸,甲硫氨酸

(3)酸性氨基酸及其酰胺:天冬氨酸,谷氨酸,天冬酰胺,谷氨酰胺

(4)碱性氨基酸:赖氨酸,精氨酸

2.芳香族氨基酸苯丙氨酸,酪氨酸,色氨酸

3.杂环氨基酸组氨酸,脯氨酸

(二)按照R基的极性性质进行分类

4.疏水氨基酸丙氨酸异亮氨酸亮氨酸蛋氨酸苯丙氨酸脯氨酸色氨酸缬氨酸

5.不带电荷的极性氨基酸丝氨酸苏氨酸天冬酰胺半胱氨酸谷氨酰胺甘氨酸酪氨酸

6.带电荷的极性氨基酸精氨酸天冬氨酸谷氨酸组氨酸赖氨酸

(三)非天然蛋白质氨基酸

三、肽和多肽链(10min)

(一)肽键与多肽链

1.肽键:一分子氨基酸的α-羧基和一分子氨基酸的α-氨基脱水缩合形成的酰胺键,即-CO-NH-。

2.多肽链:氨基酸借肽键联结成多肽链。

(二)多肽链的构象1.肽单位:肽单位(peptide unit)又称为肽基(peptide group),是肽键主链上的重复结构。是由参于肽链形成的氮原子,碳原子和它们的4个取代成分:羰基氧原子,酰氨氢原子和两个相邻α-碳原子组成的一个平面单位。肽链中的酰胺基(-CO-NH-)称为肽基(peptide group)或肽单位(peptide unit)。2.多肽链的构象

(三)蛋白质多肽链氨基酸序列的测定

(四)多肽链的生物合成1.遗传密码与基因2.遗传信息的转录3.遗传信息的翻译

(五)线状和环状寡聚多肽的非核糖体生物合成

第一章蛋白质结构基础2

课程引入:蛋白质的空间结构?(5min)

第三节蛋白质的空间结构

一、一级结构(5min)蛋白质的一级结构,专指多肽链中氨基酸(残基)的排列的序列(sequence)。若

蛋白质分子中含有二硫键,一级结构也包括生成二硫键的半胱氨酸残基位置。一级结构就是指蛋白质分子中由共价肽键相连的基本分子结构。不同的蛋白质,首先具有不同的一级结构,因此一级结构是区别不同蛋白质最基本、最重要的标志之一。

二、二级结构蛋白质的二级结构是指多肽链中相邻氨基酸残基形成的局部肽链空间结构,是其主链原子的局部空间排布。蛋白质分子的空间结构有一些共同的规律可遵循,其中二级结构主要是周期性出现的有规则的α-螺旋、β-片层、β-转角、π-螺旋和无规则线圈等几种二级结构单元,且这些有序的二级结构单元,主要是靠氢键等非共价键来维持其空间结构的相对稳定的。

(一)α-螺旋(二)β-片层结构(三)回折(10min)β-转角,γ-转角,β-发夹,β-凸起

(四)环肽链(5min)(五)无规则卷曲(5min)

三、超二级结构(10min)蛋白质分子中的一些二级结构单元,往往有规则地聚集在一起形成全由α-螺旋、全由β-片层或α-螺旋与β-片层混合、均有的超二级结构基本形式,具体说,形成相对稳定的αα、βββ、βαβ、β2α和αTα等超二级结构又称模体(motif)或模序。

四、结构域(5min)单个或多个超二级结构,进一步集结起来,形成在蛋白质分子空间结构中明显可区分的区域,称结构域,它们分别又是蛋白质分子中的一个个功能单位,故又称之为功能域。蛋白质的结构域一般由40~400个氨基酸残基组成。

五、三级结构(5min) 蛋白质的三级结构是指整条多肽链中所有氨基酸残基,包括相距甚远的氨基酸残基主链和侧链所形成的全部分子结构。因此有些在一级结构上相距甚远的氨基酸残基,经肽链折叠在空间结构上六、四级结构(5min)

蛋白质的四级结构是指各具独立三级结构多肽链再以各自特定形式接触排布后,结集所形成的蛋白质最高层次空间结构。在此蛋白质四级结构中,各具独立三级结构的多肽链称亚基(subunit),亚基单独存在时不具生物活性,只有按特定组成与方式装配形成四级结构时,蛋白质才具有生物活性。

七、维持蛋白质空间构象的作用力疏水效应,氢键和范德华力,共价交联和离子相互作用,配位键

八、研究蛋白质空间构象的技术和方法(2min)

第四节蛋白质结构与功能的关系

一、氨基酸序列决定蛋白质的结构与功能(3min)

1)氨基酸序列的变异与蛋白质的功能2) 同源蛋白质的物种差异与生物进化

二、蛋白质的空间结构与功能的关系(5min)蛋白质分子空间结构和其性质及生理功能的关系也十分密切。不同的蛋白质,正因为具有不同的空间结构,因此具有不同的理化性质和生理功能。如指甲和毛发中的角蛋白,分子中含有大量的α-螺旋二级结构,因此性质稳定坚韧又富有弹性,这是和角蛋白的保护功能分不开的;而胶原蛋白的三股π螺旋平行再几股拧成缆绳样胶原微纤维结构,使其性质稳定而具有强大的抗张力作用,因此是组成肌腱、韧带、骨骼和皮肤的主要蛋白质;丝心蛋白正因为分子中富含β-片层结构,因此分子伸展,蚕丝柔软却没有多大的延伸性。事实上不同的酶,催化不同的底物起不同的反应,表现出酶的特异性,也是和不同的酶具有各自不相同且独特的空间结构密切有关。

具有四级结构的蛋白质,尚有重要的别构作用(allosteric effect),又称变构作用。别构作用是指一些生理小分子物质,作用于具有四级结构的蛋白质,与其活性中心外别的部位结合,引起蛋白质亚基间一些副键的改变,使蛋白质分子构象发生轻微变化,包括分子变得疏松或紧密,从而使其生物活性升高或降低的过程。具有四级结构蛋白质的别构作用,其活性得到不断调正,从而使机体适应千变万化的内、外环境,因此推断这是蛋白质进化到具有四级结构的重要生理意义之一。

三、蛋白质间的相互作用与特殊结构(5min)抗原与抗体的相互识别,14-3-3结构域,F-box结构域

四、参与蛋白质与DNA分子间相互作用的结构域(5min)

螺旋-转角-螺旋,锌指结构,亮氨酸拉链,

螺旋-环-螺旋结构,SPXX序列

五、蛋白质的变性与复性(5min)可以非常接近。

第五节多肽链的折叠

一、第二遗传密码(5min)蛋白质折叠的研究,比较狭义的定义就是研究蛋白质特定三维空间结构形成

的规律、稳定性和与其生物活性的关系。在概念上有热力学的问题和动力学的问题;蛋白质在体外折叠和在细胞内折叠的问题;有理论研究和实验研究的问题。这里最根本的科学问题就是多肽链的一级结构到底如何决定它的空间结构?既然前者决定后者,一级结构和空间结构之间肯定存在某种确定的关系,这是否也像核苷酸通过“三联密码”决定氨基酸顺序那样有一套密码呢?有人把这设想的一级结构决定空间结构的密码叫作“第二遗传密码”。

第二遗传密码的特点:简并性,多义性,全局性和复杂性

二、帮助折叠的蛋白质和酶

(一)分子伴侣(5min)一类在序列上没有相关性但有共同功能的蛋白质,它们在细胞内帮助其他含多肽的结构完成正确的组装,而且在组装完毕后与之分离,不构成这些蛋白质结构执行功能时的组份。

(二)帮助正确二硫键形成的酶(5min)折叠酶,异构化酶

三、蛋白质的去折叠(2min)

四、蛋白质的错误折叠(3min)

第二章蛋白质分子设计1

思考:蛋白质的分子设计有那些方法?(5min)

第一节蛋白质分子设计原理

一、蛋白质分子设计的分类蛋白质分子设计的目的:一是提供设计方案和指导信息;二是探索蛋白质的

折叠机理。

(一)蛋白质分子设计的层次两个层次:1,在蛋白质三维结构已知基础上的分子设计;2,在三维结构未知的情况下,借助一级结构序列信息及生物化学性质进行设计。

(二)蛋白质分子设计的分类 1.定点突变或化学修饰 2.拼接组装 3.从头设计全新蛋白质

二、蛋白质分子设计的基础

(一)蛋白质生物功能的多样性(5min)

(二)蛋白质功能由其高级结构决定(5min)

(三)蛋白质的一级结构与其构象及功能的关系(5min)

一级结构相似的蛋白质,基本构想及其功能也相似。

(四)蛋白质空间构象与功能活性的关系(5min)蛋白质的别构效应

(五)结构生物学与生物信息学促进蛋白质分子设计(5min)蛋白质数据库(the protein data bank,PDB)

四、蛋白质分子设计的程序

1. 收集结构信息(5min)一级结构,立体结构,功能结构域,同源蛋白质等相关数据

2. 建立结构模型(5min)PDB或文献,以及测定的三维结构数据

3. 结构模型的生物信息分析(5min)分析确定其三维结构的特点,功能活性区域以及分布,结构中存在的二硫键数目和位置。

4. 选择设计目标(5min)选择设计目标,确定所要构建的三级结构,找出功能位点或区域。

5. 序列设计(5min)氨基酸残基形成特定二级结构的倾向性;疏水相互作用,螺旋的偶极稳定作用,静电相互作用,氢键作用,残基侧链的空间堆积。

6. 预测结果(5min)选择好一级结构后,通过理论预测方法预测出所设计的多肽的二级结构和三级结构,

初步验证设计的正确程度,并修正。

7. 获得新蛋白质(5min)化学合成,基因工程

8. 新蛋白质的检验a.是否存在蛋白质多聚体状态;b.二级结构与预期的是否吻合;c.是否具有三级结构。

9. 完成新蛋白质设计对设计结构检测,修正不符合要求的设计,反复操作得到达到预期的蛋白质分子。

三、蛋白质分子设计的原则

1. 活性设计(5min)考虑蛋白质的功能,选择化学基团和化学基团的空间取向。

2.对专一性的设计(5min)化学基团与底物的专一性结合设计很重要

3. Scaffold设计(5min)对蛋白质分子的立体设计。

4.疏水集团与亲水集团需合理分布(5min)

5.最优的氨基酸侧链几何排列(5min)侧链构象由空间两个立体因素决定:第一,侧链构象决定于旋转每条链的立体势垒;第二,侧链构象由氨基酸在结构中的位置决定。

第二章蛋白质分子设计2

第二节基于天然蛋白质结构的分子设计

一、定位突变(5min)

(一)定位突变的设计目标及解决方法定位突变常见的设计目标是提高蛋白质的热、酸稳定性、增加活性、降低副作用、提高专一性,以及通过蛋白质工程手段进行结构-功能关系的研究等。

热稳定性:引入二硫桥,增加内氢键数目,改善内疏水堆积。

对氧化的稳定性:把Cys转换为Ala或Ser,把Trp转换为Phe或Tyr。

对重金属的稳定性:替代表面羧基,把Met转换为Gln、Val、Ile或Leu。

pH稳定性:替换表面荷电基团,His、Cys以及Tyr的置换,内离子对的置换。

提高酶学性质:专一性的改变,增加转换数,改变酸碱度。

(二)定位突变的种类

定点突变;盒式突变

(三)定位突变的程序

1.建立所研究蛋白质的结构模型:可以通过X射线晶体学、二维核磁

共振等测定结构,也可以根据类似物的结构或其他结构预测方法建立起结构模型。

2.找出对所要求的性质有重要影响的位置:在改造中如何恰当地选择

突变残基是一个关键问题,这不仅需要分析残基的性质,同时还需要借助于已有的三维结构或分子模型。

3.预测突变体的结构:利用蛋白质结构-功能或结构-稳定性相关知识

及理论计算预测新蛋白质可能具有的性质;

4.构建突变体,获得突变体蛋白:依据所设计好的突变,利用化学合

成或PCR等方法构建突变体。进行基因测序验证突变体后,将突变体进行表达,纯化蛋白质,获得所设计的新蛋白质。

5.突变体蛋白质的检验:测定新蛋白质的序列、三维结构、稳定性、

催化活性等,并与对应的天然蛋白质进行比较,检验突变设计的效果,同时进一步修正设计方案。

(四)定位突变残基的鉴定

1.根据结构信息确定残基的突变

2.突变方法鉴定突变功能残基

3.利用蛋白质同源性鉴定突变功能残基

(五)定位突变的应用RNase T1的结构改造

二、蛋白质分子拼接

蛋白质由结构元件组装而成,可以将不同蛋白质的特定结构元件剪裁拼接起来,从而将不同蛋白的功能结合在一起创造出新的蛋白。

第三节全新蛋白质设计

一、全新蛋白质设计方法(5min)

蛋白质分子从头设计:基于蛋白质折叠规律,从一级结构出发,设计制造自然界中不存在的具有特定结构和功能的全新蛋白质。

(一)全新蛋白质设计程序设计循环:理论设计和实验验证

(二)全新蛋白质设计目标的选择依据设计的目的可以分为:结构从头设计,功能从头设计

(三)设计方法1.设计方法种类2.设计中需考虑的因素3.设计中的困难

二、蛋白质结构的从头设计

(一)蛋白质结构的从头设计原则 1.二级结构的设计原则(1)α螺旋的设计原则

①选择倾向形成α螺旋的氨基酸

②设计两亲性的α螺旋,疏水性氨基酸残基按3或4的间隔排列。

③N端加N帽,C端加C帽

④带正电荷氨基酸残基靠近C端,带负电荷的氨基酸残基靠近N端。

(2)β折叠片的设计原则

选择形成β折叠片倾向性较大的氨基酸残基

使亲水性残基和疏水性残基相间排列

(3)转角的设计原则2.超二级结构和三级结构的设计原则

(二)蛋白质结构的从头设计实例

三、蛋白质功能的从头设计

通过反向拟合天然蛋白质设计新的功能键合及催化的从头设计

在全新蛋白质中引入结合位点催化活性蛋白质的设计

膜蛋白及离子通道的设计新材料的设计

四、全新蛋白质分子设计的展望

第三章蛋白质的修饰与表达1

第一节蛋白质的化学修饰

蛋白质的化学修饰:通过活性基团的引入或去除使蛋白质化学(一级)结构的发生改变的过程。非必需部分的修饰:不影响蛋白质的生物活性。

必需部分的修饰:影响蛋白质的生物活性。

一、蛋白质侧链基团的化学修饰蛋白质化学修饰的主要部位是蛋白质的侧链基团。蛋白质侧链基团的化

学修饰是通过选择性试剂或亲和标记试剂与蛋白质分子侧链上特定的功能基团发生化学反应而实现的。巯基、氨基和羧基特别容易产生有用的取代。

(一)巯基的化学修饰烷基化试剂:碘乙酸,碘乙酰胺(卤代酸,卤代酰胺)

(二)氨基的化学修饰修饰赖氨酸残基ε-氨基的常用试剂:三硝基苯磺酸,烷基化试剂,磷酸吡哆醛等。(三)羧基的化学修饰蛋白质分子中的羧基可以通过碳二亚胺法、混合酸酐法等与蛋白分子上的氨基形成酰胺键,其中水溶性碳二亚胺法在这类化合物的偶联反应中的应用最为广泛,它在比较温和的条件下就可以进行。

(四)二硫键的化学修饰二硫键:巯基乙醇,羧甲基化。

二、蛋白质的位点专一性修饰

专一性:一是试剂对被修饰基团的专一性;二是试剂对蛋白质分子中被修饰部位的专一性。

三、蛋白质的聚乙二醇修饰

四、蛋白质的化学交联和化学偶联

蛋白质的化学交联是一类重要的化学修饰反应,所用的交联剂为含有双功能基团的化学试剂。化学交联可以发生于分子内的亚基与亚基之间,也可以发生于蛋白质分子与分子之间,也可发生于多个分子之间,而形成网状交联。蛋白质的化学偶联是指将蛋白质分子偶联到一个化学惰性的水不溶性的生物大分子上,形成固定化蛋白质。

第二节蛋白质的分子生物学改造

一、基因突变技术蛋白质工程设计可以采用定点突变和体外分子定向进化两种方式对天然酶分子进行改

造。定点突变需要知道酶蛋白的一级结构及编码序列,并根据蛋白质空间结构知识来设计突变位点。

体外定向进化是在尚不知道蛋白质的空间结构,或者根据现有的蛋白质结构知识尚不能进行有效的定点突变时,借鉴实验室手段在体外模拟自然进化的过程,使基因发生大量变异,并定向选择出所需性质或功能。

(一)定点突变

定点突变技术可以随心所欲地在已知DNA序列中取代、插入或缺失一定长度的核苷酸片段。该方法与使用化学因素、自然因素导致突变的方法相比,具有突变率高、简单易行、重复性好的特点。

(二)蛋白质的体外分子定向进化

概念:在实验室中模仿自然进化的关键步骤--突变,重组和筛选,在较短的时间内完成漫长的自然进化过程,有效地改造蛋白质,使之具有人类需要的特性,称为蛋白质定向进化。

1、制造突变体

易错PCR(Error prone PCR)

DNA 改组(DNA shuffling)

2、突变体的筛选

表型观察选择

在鉴定平板上产生的水解圈或变色圈

在微量滴定板上培养并测定酶活

自动酶标分析仪大大提高筛选的速度

高通量筛选方法:表面展示技术

一、基因融合

基因融合的策略为蛋白质的表达和纯化提供方便

研究蛋白质的定位及移动控制蛋白质固定的空间取向

构建具有双催化活性的融合蛋白或融合酶防止外源蛋白被宿主的蛋白水解酶降解

改变胞内溶解性,防包涵体产生:硫氧还蛋白蛋白表达的空间定位:信号肽

第三章蛋白质的修饰与表达2

第三节重组蛋白质的表达

基因工程为目标蛋白质的生产,对其结构功能的研究以及蛋白质及多肽药物的开发在理论和实际应用上开辟了一条崭新的途径。

现阶段蛋白质异源表达的关键问题就是发展克隆基因的表达方法,即找到理想的宿主表达系统。目前常用的表达系统有细菌表达系统、酵母表达系统、昆虫表达系统、哺乳动物细胞等,这些表达系统各有优缺点。

一、目标蛋白质在大肠杆菌中的表达

细菌表达系统培养方法简单、增殖快、生产成本低,但缺乏真核细胞特有的加工后处理,外源蛋白大量表达容易形成包涵体,而且在菌体中表达的外源蛋白,在原核细胞中不稳定,易被菌体蛋白酶破坏。

1.表达载体的一般特点:

(1)复制起始点(2)选择性基因(3)强的、可诱导的启动子

(4)强的转录终止序列(5)核糖体结合位点(6)合适的多克隆位点

2.与外源基因有效表达的相关因素

⑴有效的转录起始与基因的高效表达转录起始的速率是基因表达的主要限速步骤,因此要选择强的可诱导的启动子及相关的调控序列。

启动子强启动子:高水平的外源蛋白的表达;低本底表达启动子:有毒外源蛋白

转录终止区有效的转录终止子是表达载体必不可少的元件,贯穿启动子的转录将抑制启动子的功能,

(2)有效的翻译与基因的高效表达

① mRNA的稳定性:细胞内mRNA的浓度是由mRNA转录的速率和mRNA降解之差来决定的。②翻译的起始:无效的翻译起始多半是蛋白质低表达的最常见的问题。③翻译的延伸:遗传密码的简并。

④氨基酸的错误搀入⑤翻译的终止

(3)密码子偏好性

每种生物对简并密码子的使用频率的差异;同义密码子的使用频率与相应的tRNA含量相关;与基因的表达调控有关;富含宿主不常用密码子的外源基因有可能得不到有效表达

3.改善表达水平及溶解性的方法

⑴如何改善表达水平

①诱导条件:改变诱导的时间或诱导的温度来发现产物积累的最适条件。在某些情况下,改变培养基的组成有时也可以改善外源基因的表达水平。②外源基因的编码序列;③用蛋白酶缺失的宿主菌;

⑵如何改善外源蛋白的溶解性

①外源蛋白的分泌表达;②细菌生长温度;③外源蛋白与分子伴侣的共表达;④外源蛋白与相关蛋白或蛋白标签的融合

4.外源蛋白的表达定位

胞内表达:将外源基因插到原核表达载体强启动子和有效SD序列下游,胞内表达易形成包涵体,蛋白易降解

周质表达:外源基因与信号肽融合,外周质的氧化环境有利于蛋白质的正确折叠

细胞外分泌:利用已有的分泌蛋白所采用的途径;利用信号肽序列、融合伴侣和具有穿透能力的因子。分泌至培养基的蛋白容易纯化,减少内源蛋白酶裂解。

胞质膜定位:常用于含有跨膜区的膜蛋白的研究

菌体表面定位:大肠杆菌表面蛋白与外源肽或蛋白融合,表达外源肽或蛋白的菌株可用于构建活菌苗、筛选文库,研究蛋白与配体的相互作用、细胞间的粘附等。

二、目标蛋白质在酵母细胞中的表达

酵母表达系统既具有原核细胞的增殖快、操作简单、成本低等优点,又可以象其他真核细胞一样完成对蛋白质转录和翻译后的修饰。但它蛋白水解酶类,可降解异体蛋白质,使产品产量降低。

三、昆虫杆状病毒表达系统

昆虫表达系统优点是能较高水平地表达不同动物来源的基因,能够有效地进行蛋白质翻译后的加工。主要缺点是不能连续合成重组蛋白,因为重组病毒感染昆虫细胞或昆虫幼虫4-5天后,细胞就裂解,幼虫即死亡。

四、哺乳动物细胞表达系统

哺乳动物细胞是生产哺乳动物蛋白质最好的场所,其表达真核基因比其他几种表达系统更优越,能对蛋白质进行各种类型的加工和修饰,还能表达有功能的膜蛋白及分泌性蛋白。其缺点是组织细胞培养的技术要求高,培养和筛选细胞株的周期长,成本较高。

五、体外翻泽系统

兔网织红细胞系统

麦胚提取物系统

原核体外翻译系统

优点:翻译系统组分和翻译条件可调内源性mRNA干扰很小同时加入多种基因模板可研究多种蛋白质的相互作用可以对基因产物进行特异性标记,便于在反应混合物中检测

第四章蛋白质的物理化学性质

课程引入:为什么蛋白质会自发折叠?(1min)

第一节热力学函数与蛋白质构象

一、热力学函数与蛋白质构象

内能:组成物体的所有分子的无规则运动的动能与分子间相互作用的势能之和。

焓(enthalpy):是一个系统的热力学参数。它描述的是体系的一个状态性质,它的改变量仅仅取决于系统的始态和终态,用符号H表示,即H=E+pV 其中,E为系统内能,p为其压强,V则为体积。

熵(S):是度量体系混乱度的热力学函数。从微观的角度来看,熵具有统计意义,它是体系微观状态数(或无序程度)的一种量度。熵值小的状态,对应于比较有秩序的状态,熵值大的状态,对应于比较无秩序的状态。

内能(E)和焓(H)是体系自身的性质,要认识它们,需凭借体系和环境间热量和功的交换从外界的变化来推断体系E和H的变化值。

熵也是如此,体系在一定状态下有一定的值,当体系发生变化时要用可逆变化过程中的热温熵来衡量它的变化值。

吉布斯自由能(Gibbs free energy,G):亦称吉布斯函数,它是定温定压下系统的状态函数。可以用公式表示为:G=H-TS=E+pV-TS

其中,T为绝对温度;S为体系的熵。注意:吉布斯自由能是体系的性质,它的大小只决定于体系的始态和终态,而与变化的途径无关(即与可逆与否无关)。

二、热容量

热容量:指系统在某一过程中,温度升高(或降低)1℃所吸收(或放出)的热量。热容量的单位是J/K。

系统的热容量与状态的转变过程有关,与它所包含的物质的质量成正比,不同过程的热容量不同。通常规定,系统吸收的热量为正值,而释放的热量为负值,故在系统吸收热量引起温度升高时,热容量为正值。

量热实验,特别是近几十年发展起来的使用微分扫描量热仪的实验,

使得在蛋白质的折叠或退折叠转变过程中,直接测定热容量的变化成为可能。

三、van’t Hoff焓Van’t Hoff规则:荷兰科学家范特霍夫(Van’t Hoff,1901年诺贝尔奖获得者) 提

出, 温度每升高10 K, 反应速度一般增加到原来的2-4倍,该规律被称作Van’t Hoff 规则。

当溶液中的活性状态N与失活状态U处于平衡时,平衡常数K=[U]/[ N] 取决于两种自由能之差?G=GU-GN 。

自有能差?G也可以用焓差?H=HU-HN和熵差?S=SU-SN 表示为:?G = ?H-T?S 于是:-RT·lnK = ?H0-T?S0

由此看出,平衡常数对温度的依赖关系可以用来估计?H的大小。H0和S0 分别表示标准状态下的焓和熵。

所以lnK = -?H0/ RT+?S0/R

即lnK =(-?H0/ R)(1/T)+?S0/R

四、蛋白质构象与热运动

构象:由于单键基本自由旋转以及键角有一定的柔性,一种具有相同结构和构型的分子在空间里可采取多种形态,分子所采取的特定形态称为构象。

热运动:是指蛋白质溶液中所有分子的不停运动,包括了分子相对于容器的运动和分子内部各部分之间的相对运动。

五、热力学参数在分子水平上的解释

1.静电相互作用2.范德华相互作用3.氢键

4.疏水效应

5.二硫键

6.盐桥或离子键

六、折叠/退折叠转变

第二节突变稳定性和折叠

一、体外突变技术

概念:体外突变技术是用酶学方法和化学方法剪切或合成DNA ,将突变导入到克隆化的基因中,再将改变的基因重新克隆到生物体中分析该基因的功能变化的一项技术。

分类: 随机突变定点突变

应用:研究蛋白质结构和功能之间的复杂关系。

具体事例:改进α-抗胰蛋白酶;提高重组干扰素的专一活性;提高T4溶菌酶的热稳定性;磷酸丙糖异构酶的结构改造提高其稳定性

二、突变与热稳定性

1.定点突变对蛋白质稳定性的影响

氨基酸的插入和删除、寡聚化和脯氨酸取代这三因素可以稳定个别嗜热蛋白。

2.导致热稳定性的因素堆积、寡聚化、氨基酸插入和删除、脯氨酸取代、螺旋含量、螺旋倾向、极性表面积、氢键和盐桥。

3.突变试验增加蛋白质的亲盐性例如亲盐的苹果酸脱氢酶中的唯一的谷氨酸替换为精氨酸。

三、蛋白质折叠蛋白质的一级结构并没有生物活性,结构决定功能,一维的线型氨基酸序列转化为具有特征三维结构的天然蛋白质才具有生物活性,这种自我组装的过程被称为蛋白质折叠。

第三节蛋白质折叠热力学与动力学

一、蛋白质折叠的热力学研究

Anfinsen认为,蛋白质的折叠结构在一定条件下是热力学最稳定的,即通常的自由能极小的状态。根据热力学方法的特点,热力学只能解决某一变化的趋势问题,即变化的可能性问题,而不能解决变化的现实性问题。

二、蛋白质折叠的动力学研究

蛋白质的折叠不是一个随机过程,而是通过特定的动力学途径达到天然构象,即动力学上最容易达到的构象。

第五章蛋白质结构解析

课程引入:如何测定蛋白质的结构?(1min)

蛋白质三维结构解析方法:

X-射线晶体衍射法:85.3%

核磁共振波谱:14.7%

电镜三维重构、各种光谱技术、显微技术和计算机模拟

第一节X射线晶体结构分析

X-Ray晶体衍射目前仍然是蛋白质三维结构测定的主要方法。

优点:分辨率高,能精确确定生物大分子中各原子的坐标、键长、键角,给出生物大分子的分子结构和构型,确定活性中心的位置和结构

缺点:只能测定单晶,反映静态结构信息,无法测定溶液中的信息

一、X射线晶体结构分析发展史(2min)

1895年11月8日,德国物理学家,50岁的伦琴在自己的实验室中偶然发现一种从阴极射线管中辐射出的新型射线,由于对管子发出的“东西”性质不确定,伦琴就把这种射线命名为“X射线”。

1896年1月23日伦琴将这一重大发现在维尔兹堡物理医学会上报告。与会的Kolliker教授提议将该射线命名为”伦琴射线”但伦琴却说:“我还没有彻底解释这种射线的发生现象,还是称它为X射线最恰当。

X射线是一种短波长(0.005~10nm)、高能量(2.5×105 ~1.2×102eV)的电磁波。它是原子内层电子在高速运动电子流冲击下,产生跃迁而发射的电磁辐射。

1912年Max von Laue发现X射线具有衍射的现象。

1954年伯纳尔(Bernal)获得第一张胃蛋白酶晶体X衍射图片。

1957年肯特罗(Kendrew)完成肌红蛋白的0.6 nm分辨率的蛋白质晶体结构

1959年佩鲁茨(Perute)完成血红蛋白0.55分辨率的晶体结构

二、X射线晶体结构分析基本原理X射线衍射分析所依赖的基本原理是X射线衍射现象。X射线衍射现

象利用X射线的波长和晶体中原子的大小及原子间距同数量级的特性来分析晶体结构。当X射线入射到样品晶体分子上时,分子上的每个原子使X射线发生散射,这些散射波之间相互叠加形成衍射图形。衍射图形能给出样品内部结构的许多资料,如原子间的距离、键角,分子的立体结构、绝对构型、原子和分子的堆积、有序或无序的排列以及非计量的程度等。

三、蛋白质X射线晶体结构测定程序

蛋白质晶体结构的X射线衍射分析包含五个主要步骤:

1、样品制备

2、蛋白质结晶和晶体生长

3、衍射数据收集和处理

4、位相求解

5、模型建立和修正

第二节核磁共振波谱的溶液结构解析

一、基本原理 1946年美国斯坦福大学的F.Bloch和哈佛大学的E.M.Purcell两个研究小组首次独立观察

到核磁共振现象,为此他们两人获1952年诺贝尔物理奖。

1983年,瑞士科学家Kurt Wüthrich教授实验室首次运用核磁共振方法解析了胰高血糖素(glucagon)多肽的溶液构象.

瑞士科学家Kurt Wüthrich因为发明了利用核磁共振(NMR)技术测定溶液中生物大分子三维结构的方法获得了2002年度诺贝尔化学奖。

核磁共振(Nuclear Magnetic Resonance),就是处于某个静磁场中的自旋核系统受到相应频率的射频磁场作用时 ,共振吸收某一特定频率的射频辐射的物理过程。

二、实验技术方法

NMR法测定蛋白质结构的基本实验步骤:

1 、样品制备,一般应采用液态样品

2 、一维NMR实验

3 、二维NMR实验 4、三维NMR实验 5 、有的还要做四维NMR实

优点:可以在水溶液或有机相中研究生物大分子结构,研究溶液条件的改变对生物大分子三维结构的影响以及生物大分子内部动力学的特点;

缺点:分辨率不高。目前,NMR只能用于测定小分子和中型蛋白质的结构。

三、波谱解析

四、技术发展和应用早期核磁共振主要用于对核结构和性质的研究,如测量核磁矩、电四极距、及核自

旋等后来广泛应用于分子组成和结构分析,生物组织与活体组织分析,病理分析、医疗诊断、产品无损监测等方面

第六章生物信息学在蛋白质工程中的应用

课程引入:什么是生物信息学?(1min)

生物信息学(Bioinformatics):是生物学、计算机科学和信息学相互渗透形成的交叉学科,在蛋白质工程中具有广泛应用。

第一节生物信息学与蛋白质工程

一、生物信息学概述

(一)生物信息学发展简史发展的3个阶段:前基因组时代;基因组时代;后基因组时代

(二)生物信息学的主要研究内容

1.生物信息的收集、存储、管理与提供2.基因组序列信息的提取和分析

3.功能基因组相关信息分析4.生物大分子结构模拟和药物设计5.生物信息分析的技术与方法研究二、生物信息学与蛋白质工程蛋白质研究为生物信息学提供了极为丰富的研究数据,极大地推动了生物信息学的发展。生物信息学在蛋白质的序列分析、结构预测、功能预测、分子设计等方面具有重要应用。

三、生物信息学与蛋白质组学

蛋白质组(Proteome) :由全部基因表达的全部蛋白质及其存在方式,是一种细胞、组织或完整生物体在特定时空上所拥有的全套蛋白质。

蛋白质组学(Proteomics):以蛋白质组为研究对象,其目的在于阐明某生物体全部蛋白质的表达模式及功能模式。

蛋白质组学研究内容:蛋白质的表达、存在方式、结构、功能以及蛋白质间的相互作用等。

生物信息学与蛋白质组学研究关系:生物信息学理论、技术方法和软件等在蛋白质组学相关数据库的建立、应用以及蛋白质组分析等方面具有重要的应用。

第二节蛋白质常用数据库

一、酸数据库

(一)核酸序列数据库目前,国际上主要有Genbank、EMBL、DDBJ三大核酸序列数据库,三大核酸数据库之间每天相互交换数据,保持数据同步更新。

(二)基因组数据库GDB 基因组数据库(GDB)创建于1990年,是一个专门汇集人类基因组数据的数据库,以对象模型来保存数据,提供基于网络的数据对象检索服务,可搜索各种类型的对象,并以图形方式观看基因组图谱。

GDB的网址是:https://www.sodocs.net/doc/198157685.html,

二、蛋白质数据库

(一)蛋白质序列数据库

常用的蛋白质序列数据库有SWISS-PROT、PIR、TrEMBL、UniProt、GenPept等,

(二)蛋白结构数据库

1.PDB

PDB(Protein Data Bank)蛋白质结构数据库是国际上最完整的蛋白质、核酸、糖类、蛋白质-核酸复合物及病毒等生物大分子三维结构数据库。

2. MMDB(Molecular Modeling Database)

是Entrez的组成部分。

只收录通过X射线晶体衍射和核磁共振实验测定的生物大分子结构数据。增加了附加信息如:大分子的生物学功能及产生机制、分子进化历史、生物大分子之间关系等。具有生物大分子三维结构模型展示、结构分析和结构比较等功能。

第三节蛋白质结构数据库

一、蛋白质序列比对

序列比对的功能:探寻分子进化关系及产生共同功能的序列模式;分析和预测一些新基因的功能;预测蛋白质的空间结构及生物学功能;获得有价值的参考信息。

序列比对常用软件:Blast、ClustalW等,可从NCBI和EBI网站免费下载到本地比对,也可进行网上远程比对。

二、蛋白质基本性质分析

利用生物信息学软件可直接预测蛋白质的许多基本性质,如氨基酸组成、相对分子质量(MW)、等电点(pI)、疏水性、电荷分布、信号肽、跨膜区域及结构功能域分析等。

用于蛋白质基本性质预测的生物信息学软件:SWISS-PROT数据库相关的蛋白质基本性质预测软件。

三、蛋白质二级结构预测

常用的蛋白质二级结构预测程序:

1. nnPredict程序:准确率可达到79%。

2. PredictProtein程序:准确率可达到72%以上。

3. SSPRED程序:与PredictProtein程序相似。

4.SOPMA 程序:

四、蛋白质结构预测实例

实验测定:利用仪器来测定蛋白质三维结构,主要包括X射线衍射和核磁共振(NMR)。

理论预测:利用计算机根据已有理论和已知氨基酸序列等信息来预测,主要包括同源模建(Homology Modeling)、折叠识别(Fold Recognition)和从头计算(Ab Initio)。

第七章蛋白质的分离纯化与鉴定1

课程引入:蛋白质的提取方法?(1min)

第一节蛋白质的分离纯化概述

蛋白质的分离纯化与鉴定一般包含以下主要步骤:

(1)选择实验材料:要分离纯化某一种蛋白质,首先要确定从什么实验材料中进行纯化,通常情况下要选择目标蛋白质含量高、其他杂质少、容易获得、成本低的实验材料。

(2)实验材料的预处理:根据实验材料的不同特点,选用适合的预处理方法。如果是液体材料,通常采用过滤或离心的方法除去固体杂质即可获得粗制品;如果是固体材料,则要经过洗涤、材料破碎等处理。(3)蛋白质的提取:采用特定的缓冲液将蛋白质溶解,然后通过离心或过滤的方法除去不溶物,就得到蛋白质粗提取液。

(4)蛋白质粗分级:通过盐析、等电点沉淀、透析、超速离心等对蛋白质粗提取液进行初步分离纯化,经浓缩后得到蛋白质粗制品。

(5)蛋白质细分级:运用层析和电泳技术进一步对蛋白质粗制品分离纯化,以获得高纯度的蛋白质样品。(6)蛋白质的鉴定:测定蛋白质分子量、等电点、氨基酸组成及其顺序、免疫特性、结晶特性、生物学功能等,以确定纯化的蛋白质是什么蛋白质以及它的结构与功能。

第二节蛋白质的提取

为了使蛋白质充分溶解并保持蛋白质的结构及活性,蛋白质提取缓冲液常常含有如下多种成份:

(1)控制溶液pH值的缓冲对:为了保持蛋白质的结构与功能,提高其溶解度,溶液pH值应尽量远离其等电点并接近其生理pH值。调节缓冲液pH值目前多用酸度计,新型的酸度计一般有温度矫正功能,调节时要把温度探头同时放入缓冲液中。

(2)控制溶液离子强度的无机盐:一般情况下,植物蛋白大多使用KCl,动物蛋白大多使用NaCl。(3)控制溶液氧化还原状态的还原剂:在缓冲液中通常加入一定浓度的还原剂,如β–巯基乙醇,以防止蛋白质的部分巯基发生氧化。

(4)蛋白酶抑制剂(inhibitors):加入蛋白酶抑制剂从而抑制目标蛋白质的降解。

(5)离子螯合剂(chelators):消除某些金属离子对目标蛋白质的影响。

(6)标准牛血清白蛋白(bovine serum albumin,BSA):有利于降低溶剂对蛋白质的不良影响。

(7)去污剂(detergents):去污剂有利于提取膜蛋白。

(8)水和防腐剂:避免细菌及其他杂质的污染。

(9)甘油(glycerol):甘油有利于蛋白质结构和活性的保持,在蛋白质保存过程中常加入20%~50%的甘油

第三节蛋白质粗分级

一、硫酸铵分级沉淀

蛋白质在高浓度中性盐溶液中会沉淀析出,称为盐析(salt out)。蛋白质盐析中最常用的盐是硫酸铵,由于不同的蛋白质沉淀所需要的盐离子浓度不同,因此通过调节硫酸铵的浓度可使不同的蛋白质分阶段沉淀下来,这就是硫酸铵分级沉淀。

二、有机溶剂分级沉淀

蛋白质水溶液中加入有机溶剂(通常为甲醇、乙醇或丙酮)后,这些有机溶剂一方面会降低水的介电常数,从而降低蛋白质分子间的电荷相互作用,另一方面,会和蛋白质争夺水分子,,破坏蛋白质分子表面的水膜,因此,有机溶剂会引起蛋白质沉淀。

三、超速离心法

离心是蛋白质分离纯化过程中最常用的实验手段之一。在强大离心力的作用下,溶液中不溶解的颗粒状物质会沉淀析出,从而把溶液和沉淀物质分开。

四、等电点沉淀法

不同蛋白质其等电点不同,在蛋白质混合样品中,通过调节溶液pH值,使不同的蛋白质先后发生沉淀,结合离心法可以把不同的蛋白质分开。

五、透析法

利用半透膜对溶液中不同分子的选择性透过作用,可以将蛋白质与其他小分子物质分开。例如,通过硫酸铵分级沉淀后得到的蛋白质溶液中含有的高浓度硫酸铵,就可以通过透析法除去。

六、超滤法

超滤法是利用压力或离心力使溶液中的小分子物质通过超滤膜,而大分子则被截留,一次实验可以把蛋白质混合物分为分子大小不同的两个部分。

七、结晶法

当某种蛋白质在溶液中由于沉淀剂的作用而聚集沉淀时有可能形成特定结构的晶体,如溶菌酶在高浓度硫酸铵作用下就会形成晶体。由于溶剂挥发而使蛋白质溶液达到过饱和状态时也可能使蛋白质结晶析出。

第七章蛋白质的分离纯化与鉴定2

课程引入:蛋白质的鉴定方法?(1min)

第四节蛋白质细分级

一、分子筛层析

(一)原理:

分子筛层析也称为凝胶过滤(gel filtration),它是以多孔性凝胶材料为支持物,当蛋白质溶液流经此支持物时,分子大小不同的蛋白质所受到的阻滞作用不同而先后流出,从而达到分离纯化的目的。

(二)凝胶介质

1.葡聚糖凝胶凝胶过滤最常采用的凝胶是交联葡聚糖,商品名为Sephadex G,

2.琼脂糖凝胶琼脂糖凝胶是由半乳糖及其衍生物以氢键方式相互连接凝聚而成。琼脂糖凝胶在pH为4~9之间是稳定的,对样品的吸附作用小,机械强度和稳定性也很好,洗脱速度比较快。但琼脂糖凝胶分辨率较低,不耐高温,在40℃以上开始融化,使用温度以0℃~30℃为宜。

3.聚丙烯酰胺凝胶聚丙烯酰胺凝胶是丙烯酰胺(acrylamide,简称Acr)与甲叉双丙烯酰胺(N,N-methylene- bisacylamide,简称Bis)交联而成。聚丙烯酰胺凝胶分离的分子量范围、吸水率等性能基本近似于Sephadex,分辨率较高。

4.Sephacryl凝胶

Sephacryl凝胶是葡聚糖凝胶的改进型,它由葡聚糖和甲叉双丙烯酰胺组成。它的突出优点是机械强度大、洗脱速度快。

5.其他凝胶

如多孔硅胶和多孔玻璃珠

二、离子交换层析

(一)原理:

蛋白质是两性分子,在一定的pH条件下带有电荷,不同的蛋白质所带有电荷的种类和数量不同,因此它们与带电的凝胶颗粒间的电荷相互作用不同。这样,当蛋白质混合物流经带电凝胶时,电荷吸引作用小的蛋白质先流过,而电荷吸引作用大的蛋白质后流过凝胶,从而把不同的蛋白质分开,这种层析方法即为离子交换层析。

(二)凝胶介质:

离子交换层析介质由三部分组成:

惰性支持物

带电基团

平衡离子

三、吸附层析

由于不同的蛋白质所含有的氨基酸的种类和数目不同,分子表面的极性氨基酸和非极性氨基酸的数目、分布区域不同,因此它与分子比表面积大的吸附剂间的相互作用力大小不同,根据此原理对蛋白质进行分离纯化即为吸附层析。

常用的吸附层析有:基磷灰石吸附层析;疏水作用层析

四、亲和层析

亲和层析是利用蛋白质与配体专一性识别并结合的特性而分离蛋白质的一种层析方法。将与目标蛋白质专一性结合的配体固定于支持物上,当混合样品流过此支持物时,只有目标蛋白能与配体专一性结合,而其他杂蛋白不能结合。先用起始缓冲液洗脱杂蛋白,然后改变洗脱条件,将目标蛋白洗脱下来。

五、电泳

蛋白质是两性电解质,在一定的pH值条件下,蛋白质带有电荷,不同的蛋白质所带电荷的种类和数目不同,因此其在电场中移动的速度不同,从而把蛋白质分开,这种实验技术即为电泳。

(一)聚丙烯酰胺凝胶电泳

聚丙烯酰胺凝胶电泳常用垂直板电泳装置,即将聚丙烯酰胺凝胶灌装在双层玻璃板之间,在凝胶顶端上样,然后分别在凝胶的底部和顶端接上正负电极,在电场的作用下,蛋白质由凝胶顶端向下移动,移动的速度与蛋白质所带电荷、分子大小和分子形状有关,从而把不同的蛋白质分开。

(二)等电聚焦电泳

根据不同蛋白质的等电点不同,将蛋白质加到含有不同pH值的两性电解质的聚丙烯酰胺凝胶中,蛋白质样品在此凝胶中移动到与其等电点相同的pH梯度处后净电荷为零,在凝胶中不再移动,也就是相同等电点的蛋白质聚焦在相同pH梯度处,从而把不同等电点的蛋白质分开。

(三)双向电泳

在双向电泳中,第一向通常根据蛋白质等电点的不同进行等电聚焦电泳(IEF),然后再根据分子量的不同进行变性聚丙烯酰胺凝胶电泳(SDS-PAGE)作为第二向。双向电泳技术是蛋白质组学研究中蛋白质多肽链分离纯化和鉴定的主要实验技术之一。

第五节蛋白质的鉴定

一、蛋白质含量测定

蛋白质含量测定有很多方法

凯氏定氮法

双缩脲法

福林-酚法

考马斯亮蓝比色法

紫外吸收法

二、蛋白质鉴定

(一)蛋白质纯度鉴定:

目前最常用的蛋白质纯度鉴定为电泳法,电泳后的凝胶经过染色脱色后,用目标蛋白质条带占整个泳道蛋白质条带的百分比来表示目标蛋白的纯度。

(二)蛋白质分子量及等电点测定:

蛋白质分子量测定有多种方法,聚丙烯酰胺凝胶电泳法是最常用的方法之一。采用IEF可测定蛋白质等电点。

(三)蛋白质氨基酸组成及顺序分析

1.蛋白质氨基酸组成分析

首先将蛋白质水解为氨基酸,通常情况下采用酸水解,蛋白质水解后的氨基酸混合物可通过全自动氨基酸分析仪或高效液相色谱进行测定。

2.蛋白质氨基酸顺序分析

主要是对纯化的蛋白质进行氨基酸组成分析,然后采用末端分析法测定其N-端和C-端氨基酸,采用蛋白酶或化学法裂解成若干有重叠的肽段后采用Edman降解法测定每一肽段的氨基酸顺序,再利用重叠肽组建整个多肽的氨基酸序列。最后确定二硫键的位置。

(四)蛋白质结晶与结构分析蛋白质在一定条件下会形成结构均一的晶体,蛋白质结晶不仅是蛋白质纯度鉴定的一个指标,也是蛋白质活性鉴定的一个指标。蛋白质三维结构分析的主要方法有X-射线晶体衍射法和核磁共振法,此外,圆二色谱法可以测定蛋白质中不同二级结构的比例。

(五)蛋白质免疫印迹

蛋白质免疫印迹主要包括三个步骤:第一步是凝胶电泳;第二步是转膜,把凝胶上的蛋白质条带转移固定到薄膜上;第三步是抗原抗体显色反应。

蛋白质转膜方法主要有两种类型,一种是半干转移,另外一种是湿转移,需要的转移缓冲液多,湿转移应用较多。电转移结束后,取出硝酸纤维素滤膜,进行抗原抗体显色反应。

(六)蛋白质生物活性及功能测定

不同的蛋白质具有不同的生物学功能,因此有不同的测定方法。比如肌动蛋白,它具有聚合成丝的特性,可以通过聚合解聚来判断其活性。

第三章蛋白质的修饰与表达1

课程引入:什么是蛋白质芯片?(1min)

第一节蛋白质分析鉴定技术

一、蛋白质芯片技术(2min)

蛋白质芯片(protein chip)技术是为满足人们对蛋白质的高通量、大信息量、平行分析研究而产生的。蛋白质芯片的产生将基因组学平台和蛋白质组学平台很好地连接起来。

1 蛋白质芯片的概念

蛋白质芯片(protein chip)也叫蛋白质微阵列(protein microarray),是将大量蛋白质有规则地固定到某种介质载体上,利用蛋白质与蛋白质、酶与底物、蛋白质与其他小分子之间的相互作用检测分析蛋白质的一种芯片。

2 蛋白质芯片的分类

根据用途的不同蛋白质芯片可分:

蛋白功能芯片:将天然蛋白、酶或酶底物固定在载体上制成芯片,主要用于天然蛋白活性及分子亲和性的高通量分析,可用来进行蛋白-蛋白、蛋白-多肽、蛋白-小分子、蛋白-DNA-RNA结合以及蛋白-酶反应的研究。

蛋白检测芯片:将具有高度亲和特异性的蛋白质或多肽,如单克隆抗体、小片段抗体、受体等固定在载体上,制备检测芯片用以识别复杂生物样品中的抗原、目标多肽和蛋白等。

3蛋白质芯片的特点快速、定量分析大量蛋白质;使用简单,结果正确率较高,只需少量血样标本即可进行分析和检测;采用光敏染料标记,灵敏度高,准确性好;所需试剂少,可直接应用血清样本,便于诊断,实用性强,其不足在于稳定性及操作复杂等因素限制

二、蛋白质指纹图谱技术蛋白指纹图谱技术也称为表面增强激光解吸电离飞行时间质谱(surface

enhanced laser desorption/Ionization time of flight mass spectrometry,SELDI-TOF-MS),是一种包含层析与质谱的特殊蛋白质芯片技术,用于蛋白质的定量分析。它结合了芯片微阵列与质谱技术两者的优点,是继基因芯片之后出现的新一代生物芯片技术。结合生物信息学的分析方法从大量的蛋白质和多肽中筛选出潜在的生物标记物,建立高特异性和敏感性的蛋白质指纹图谱模型。

蛋白指纹图谱技术在医学领域的应用,主要用于多种疾病,特别是肿瘤的早期诊断。

第二节研究蛋白相互作用技术

一、表面等离子体共振技术

表面等离子体共振技术是一种简单、直接的传感技术,根据这一原理研制的表面等离子体传感器在检测、分析生物分子间的相互作用等方面得到广泛的应用。

表面等离子体共振(Surface Plasmon Resonance,SPR)是将一束平面单色偏振光以一定角度入射到镀有薄层金膜的玻璃表面发生全反射时,若入射光的波向量与金膜内表面电子的振荡频率匹配,光线即耦合入金膜引发电子共振,即表面等离子共振。

SPR 生物传感器广泛的用于各类生物体系的测定,包括各类小分子化合物(分子量可小至100 Da)、多肽、蛋白质、寡核苷酸甚至脂分子、病毒和细胞。

SPR 生物传感器不需要借助任何标记即可用于分析蛋白质-蛋白质、蛋白质-小分子、蛋白质-核酸和蛋白质-脂的相互作用。

二、酵母双杂交技术1989 年建立了第一个基于酵母的细胞内检测蛋白间相互作用的遗传系统,右图则显示了酵母双杂交系统原理。酵母双杂交技术是一种有效的真核活细胞内研究方法,在蛋白质相互作用研究方面得到了广泛应用并取得了许多有价值的重要发现。

1 酵母双杂交系统由三个部分组成:

BD 融合的蛋白表达载体,被其表达的蛋白称诱饵蛋白(bait);

AD 融合的蛋白表达载体,被其表达的蛋白称为靶蛋白(prey);

有一个或多个报告基因的宿主菌株。

2 酵母双杂交技术主要应用在以下几方面:

检验一对功能已知蛋白间的相互作用;

研究一对蛋白间发生相互作用所必需的结构域;

用已知功能的蛋白基因筛选双杂交cDNA 文库,以研究蛋白质之间相互作用的传递途径;

分析新基因的生物学功能。

第3 节表面展示技术

一、噬菌体展示技术具体来讲噬菌体展示技术就是将待筛选基因插入噬菌体信号肽序列与主要衣壳蛋白基因(主要是基因Ⅷ或基因Ⅲ)之间,构成融合蛋白噬菌体库。表达的融合蛋白可以呈现在噬菌体表面,但不影响噬菌体的完整性和活性。

1 噬菌体展示技术建立基于三个原则:

在衣壳蛋白基因(主要是基因Ⅷ或基因Ⅲ)的N 端插入外源基因,形成的融合蛋白表达在噬菌体颗粒的表面,不影响也不干扰噬菌体的生活周期,同时保持了外源蛋白的天然构象,并能被相应的抗体或受体所识别。

利用固定于固相支持物的靶分子,采用适当的筛选方法,洗去非特异结合的噬菌体,筛选出目的噬菌体;外源多肽或蛋白质表达在噬菌体的表面,而其编码基因作为病毒基因组中的一部分可通过分泌型噬菌体的单链DNA测序推导出来。

2 目前,能用于蛋白质、多肽展示的噬菌体系统有:丝状噬菌体展示系统;

λ噬菌体展示系统;T4 噬菌体展示系统;T7 噬菌体展示系统。其中,T7 噬菌体系统可以高、中、低拷贝展示不同分子量的蛋白,是目前最为理想的展示系统。

3 噬菌体展示技术的局限性

(1)在噬菌体展示过程中必须经过细菌转化、噬菌体包装,有的展示系统还要经过跨膜分泌过程,这就大大限制了所建库的容量和分子的多样性。

(2)不是所有的序列都能在噬菌体中获得很好的表达,因为有些蛋白质功能的实现需要折叠、转运、膜插入和络合。

(3) 噬菌体展示文库一旦建成,很难再进行有效的体外突变和重组,进而限制了文库中分子遗传的多样性。

(4) 由于噬菌体展示系统依赖于细胞内基因的表达,所以,一些对细胞有毒性的分子如生物毒素分子,很难得到有效表达和展示。

二、核糖体展示技术与mRNA展示技术

核糖体展示(Ribosome display)技术与 mRNA 展示技术由于在体外无细胞翻译体系中进行,用 mRNA 的可复制性,使靶基因(蛋白)得到有效富集,不受细胞转化效率的限制。它大大提高了文库容量和筛选通量(1012~1014),而且能够增加表达的蛋白质溶解度。

三、细菌表面展示技术

细菌表面展示技术,结合荧光激活细胞筛选仪(Fluorescence Activated Cell Sorting,FACS)或流式细胞筛选仪(flow cytometry)是非常有效的高通量筛选方法。此方法能够决定突变体库中每个克隆的功能特性。

三、酵母表面展示技术

酵母表面展示系统是继噬菌体展示技术创立后发展起来的真核展示系统。酵母的蛋白质折叠和分泌机制与哺乳动物细胞非常相似,对人的蛋白质表达和展示更具优越性。酵母细胞颗粒大,可用流式细胞仪进行筛选和分离。目前报道的两种酵母展示系统分别以α或 a 凝集素作为融合骨架。

小结(5min)

蛋白质序列分析

蛋白质序列、性质、功能和结构分析 基于网络的蛋白质序列检索与核酸类似,从NCBI或利用SRS系统从EMBL 检索。 1、疏水性分析 ExPASy的ProtScale程序(https://www.sodocs.net/doc/198157685.html,/cgi-bin/protscale.pl)可用来计算蛋白质的疏水性图谱。输入的数据可为蛋白质序列或SWISS-PROT数据库的序列接受号。也可用BioEdit、DNAMAN等软件进行分析。 2、跨膜区分析 蛋白质跨膜区域分析的网络资源有: TMPRED:https://www.sodocs.net/doc/198157685.html,/software/TMPRED_form.html PHDhtm: http:www.embl-heidelberg.de/Services/sander/predictprotein/predictpro tein.html MEMSAT: ftp://https://www.sodocs.net/doc/198157685.html, 3、前导肽和蛋白质定位 一般认为,蛋白质定位的信息存在于该蛋白自身结构中,并且通过与膜上特殊受体的相互作用得以表达。这就是信号肽假说的基础。这一假说认为,穿膜蛋白质是由mRNA编码的。在起始密码子后,有一段疏水性氨基酸序列的RNA片段,这个氨基酸序列就称为信号序列(signal sequence)。 蛋白质序列的信号肽分析可联网到http://genome.cbs.dtu.dk /services/SignalP/或其二版网址 http://genome.cbs.dtu.dk/services/SignalP-2.0/。该服务器也提供利用 e-mail进行批量蛋白质序列信号肽分析的方案 (http://genome.cbs.dtu.dk/services /SignalP/mailserver.html),e-mail 地址为signalp@ genome.cbs.dtu.dk。 蛋白质序列中含有的信号肽序列将有助于它们向细胞内特定区域的移动,如前导肽和面向特定细胞器的靶向肽。在线粒体蛋白质的跨膜运输过程中,通过线粒体膜的蛋白质在转运之前大多数以前体形式存在,它由成熟蛋白质和N端延伸出的一段前导肽或引肽(leader peptide)共同组成。迄今有40多种线粒体蛋白质前导肽的一级结构被阐明,它们约含有20~80个氨基酸残基,当前体蛋白跨膜时,前导肽被一种或两种多肽酶所水解转变成成熟蛋白质,同时失去继续跨膜能力。前导肽一般具有如下性质:①带正电荷的碱性氨基酸(特别是精氨酸)含量较丰富,它们分散于不带电荷的氨基酸序列中间;②缺失带负电荷的酸性

微生物制剂MP代谢产物的蛋白质组分析

101赵敏等 微生物制剂MP代谢产物的蛋白质组分析 生物技术 微生物制剂MP代谢产物的蛋白质组分析 赵敏1,汪长国1,李宁1,夏庆友2,3,戴亚1 1川渝中烟工业有限责任公司技术中心,成都市成龙大道1段56号 610066; 2 西南大学家蚕基因组生物学国家重点实验室,重庆市北碚区天生路2号 400715; 3 西南大学生物技术学院,重庆市北碚区天生路2号 400715 摘 要:为明确微生物制剂MP提高烟叶品质的原因,以该制剂的代谢产物作为研究材料,采用液相色谱串联质谱法(LC-MS/ MS)分析了微生物制剂MP代谢产物的蛋白质组成分。结果共鉴定出35个非重复蛋白质,蛋白等电点几乎均在4-7范围内,分子量均大于20 kD。KEGG代谢通路分析显示,所鉴定的蛋白几乎都与代谢有关,其中参与氨基酸代谢、糖酵解、三羧酸循环、丙酮酸盐代谢的蛋白最多。其中,氨基酰组氨酸二肽酶、嗜热菌状金属蛋白酶、尿刊酸水合酶和组氨酸氨裂解酶能有效降低烟叶中蛋白质。 关键词:微生物制剂MP;LC-MS/MS;KEGG;烟叶;蛋白降解 doi:10.3969/j.issn.1004-5708.2013.05.018 中图分类号:TS416;TQ937 文献标识码:A 文章编号:1004-5708(2013)05-0101-06 Proteome analysis of metabolic products by microbial agents MP ZHAO Min1, WANG Changguo1, LI Ning1, XIA Qingyou2,3 , DAI Ya1 1 Technical Center, China Tobacco Chuanyu Industrial Corporation, Chengdu, 610066 China; 2 State Key Laboratory of Silkworm Genome Biology, Southwest University, Chongqing 400715,China; 3 College of Biotechnology, Southwest University, Chongqing 400715,China Abstract: Proteome of MP metabolic productions was analyzed by LC-MS/MS to determine the mechanism of MP in increasing tobacco quality. 35 non-repeated proteins were identi?ed whose isoelectric point fall within the scope of 4 to 7 and molecular weight are more than 20 kD. KEGG analysis indicated that those proteins were involved in metabolic pathways especially in amino acid metabolism, glycolysis, tricarboxylic acid cycle and pyruvate metabolism. Enzymes such as aminoacyl-histidine dipeptidase, thermolysin-like metalloprotease, HutU urocanate hydratase and histidine ammonia-lyase, function in protein degradation were vital for increasing tobacco quality after MP spraying. Keywords: Microbial agent MP; LC-MS/MS; KEGG; tobacco leaf; protein degradation 烟草(Nicotiana tabacum)是重要经济作物,也是植物学研究中的重要模式植物。汪长国等人从烟田土壤中分离筛选出的芽孢杆菌并制备成一种微生物制剂MP,采收前烟叶喷施MP制剂可改善烟叶重要香味成分和蛋白质含量,提高烟叶品质[1]。赵敏等人研究发现,喷施微生物制剂MP后烟叶中可能具有抗菌功能的组织蛋白酶B基因表达量增加[2],与植物抗病性相关的几丁质酶和逆渗透蛋白表达量也有增加[3]。但该制剂分泌的代谢产物含有哪些蛋白以及这些蛋白对烟叶品质的作用机制还有待于进一步研究。 “鸟枪法”(Shotgun)蛋白质学研究策略是基于复杂蛋白质混合物的酶解,它可以大规模的筛选复杂样品中的多肽和蛋白,并快速鉴定细胞、组织和器官中的蛋白质表达谱[4-6],其基本原理是蛋白质溶液或经过SDS-PAGE分离的蛋白质条带经过酶解后形 作者简介:赵敏,博士研究生,工程师,主要从事微生物与烟叶品质等方面的研究,Email: lszhaomin@https://www.sodocs.net/doc/198157685.html, 通讯作者:戴亚,教授,主要从事烟草化学、降焦减害等方面的研究,Email:dycy@https://www.sodocs.net/doc/198157685.html, 收稿日期:2012-10-12

蛋白质组学生物信息学分析介绍

生物信息学分析FAQ CHAPTER ONE ABOUT GENE ONTOLOGY ANNOTATION (3) 什么是GO? (3) GO和KEGG注释之前,为什么要先进行序列比对(BLAST)? (3) GO注释的意义? (3) GO和GOslim的区别 (4) 为什么有些蛋白没有GO注释信息? (4) 为什么GO Level 2的统计饼图里蛋白数目和差异蛋白总数不一致? (4) 什么是差异蛋白的功能富集分析&WHY? (4) GO注释结果文件解析 (5) Sheet TopBlastHits (5) Sheet protein2GO/protein2GOslim (5) Sheet BP/MF/CC (6) Sheet Level2_BP/Level2_MF/Level2_CC (6) CHAPTER TWO ABOUT KEGG PATHWAY ANNOTATION (7) WHY KEGG pathway annotation? (7) KEGG通路注释的方法&流程? (7) KEGG通路注释的意义? (7) 为什么有些蛋白没有KEGG通路注释信息? (8) 什么是差异蛋白的通路富集分析&WHY? (8) KEGG注释结果文件解析 (8) Sheet query2map (8) Sheet map2query (9) Sheet TopMapStat (9) CHAPTER THREE ABOUT FEATURE SELECTION & CLUSTERING (10) WHY Feature Selection? (10)

聚类分析(Clustering) (10) 聚类结果文件解析 (10) CHAPTER FOUR ABOUT PROTEIN-PROTEIN INTERACTION NETWORK (12) 蛋白质相互作用网络分析的意义 (12) 蛋白质相互作用 VS生物学通路? (12) 蛋白质相互作用网络分析结果文件解析 (12)

蛋白质数据库

生物芯片北京国家工程研究中心 湖南中药现代化药物筛选分中心 暨湖南涵春生物有限公司 常用数据库名录 1、蛋白质数据库 PPI - JCB 蛋白质与蛋白质相互作用网络 ?Swiss-Prot - 蛋白质序列注释数据库 ?Kabat - 免疫蛋白质序列数据库 ?PMD - 蛋白质突变数据库 ?InterPro - 蛋白质结构域和功能位点 ?PROSITE - 蛋白质位点和模型 ?BLOCKS - 生物序列分析数据库 ?Pfam - 蛋白质家族数据库 [镜像: St. Louis (USA), Sanger Institute, UK, Karolinska Institutet (Sweden)] ?PRINTS - 蛋白质 Motif 数据库 ?ProDom - 蛋白质结构域数据库 (自动产生) ?PROTOMAP - Swiss-Prot蛋白质自动分类系统 ?SBASE - SBASE 结构域预测数据库 ?SMART - 模式结构研究工具 ?STRING - 相互作用的蛋白质和基因的研究工具

?TIGRFAMs - TIGR 蛋白质家族数据库 ?BIND - 生物分子相互作用数据库 ?DIP - 蛋白质相互作用数据库 ?MINT - 分子相互作用数据库 ?HPRD - 人类蛋白质查询数据库 ?IntAct - EBI 蛋白质相互作用数据库 ?GRID - 相互作用综合数据库 ?PPI - JCB 蛋白质与蛋白质相互作用网络 2、蛋白质三级结构数据库 ?PDB - 蛋白质数据银行 ?BioMagResBank - 蛋白质、氨基酸和核苷酸的核磁共振数据库?SWISS-MODEL Repository - 自动产生蛋白质模型的数据库 ?ModBase - 蛋白质结构模型数据库 ?CATH - 蛋白质结构分类数据库 ?SCOP - 蛋白质结构分类 [镜像: USA | Israel | Singapore | Australia] ?Molecules To Go - PDB数据库查询 ?BMM Domain Server - 生物分子模型数据库 ?ReLiBase - 受体/配体复合物数据库 [镜像: USA] ?TOPS - 蛋白质拓扑图 ?CCDC - 剑桥晶体数据中心 (剑桥结构数据库 (CSD))

蛋白质组学与分析技术课复习思1考

蛋白质组学与分析技术课复习思考 一、名词解释 1、蛋白质组学: 蛋白质组学是研究与基因对应的蛋白质组的学科,蛋白质组(proteome)一词,源于蛋白质(protein)与基因组(genome)两个词的杂合,意指“一种基因组所表达的全套蛋白质”,即包括一种细胞乃至一种生物所表达的全部蛋白质。 2、二维(双向)电泳原理: 根据蛋白质的等电点和相对分子质量的特异性将蛋白质混合物在第一个方向上按照等电点高低进行分离,在第二个方向上按照相对分子质量大小进行分离。二维电泳分离后的蛋白质点经显色,通过图象扫描存档,最后是呈现出来的是二维方向排列的,呈漫天星状的小原点,每个点代表一个蛋白质。 3、三步纯化策略: 第一步:粗提。纯化粗样快速浓缩(减少体积) 和稳定样品(去除蛋白酶) 最适用层析技术: 离子交换/疏水层析 第二步:中度纯化。去除大部分杂质 最适用层析技术: 离子交换/疏水层析 第三步:精细纯化。达到最终纯度(去除聚合物,结构变异物) 最适用层析技术:凝焦过滤/离子交换/疏水层析/反相层析 4、高效纯化策略 在三步纯化蛋白质过程中,同时考虑到纯化的速度、载量、回收率及分辨率的纯化策略。5、离子交换色谱: 离子交换色谱中的固定相是一些带电荷的基团,这些带电基团通过静电相互作用与带相反电荷的离子结合。如果流动相中存在其他带相反电荷的离子,按照质量作用定律,这些离子将与结合在固定相上的反离子进行交换。固定相基团带正电荷的时候,其可交换离子为阴离子,这种离子交换剂为阴离子交换剂;固定相的带电基团带负电荷,可用来与流动相交换的离子就是阳离子,这种离子交换剂叫做阳离子交换剂。阴离子交换柱的功能团主要是-NH2,及-NH3 :阳离子交换剂的功能团主要是-SO3H及-COOH。其中-NH3 离子交换柱及-SO3H离子交换剂属于强离子交换剂,它们在很广泛的pH范围内都有离子交换能力;-NH2及-COOH 离子交换柱属于弱离子交换剂,只有在一定的pH值范围内,才能有离子交换能力。离子交换色谱主要用于可电离化合物的分离,例如,氨基酸自动分析仪中的色谱柱,多肽的分离、蛋白质的分离,核苷酸、核苷和各种碱基的分离等。 6、吸附色谱 吸附色谱系色谱法之一种,利用固定相吸附中对物质分子吸附能力的差异实现对混合物的分离,吸附色谱的色谱过程是流动相分子与物质分子竞争固定相吸附中心的过程。洗脱次序∶一般为正相,即:极性低的先被洗脱。 7、PCR扩增 PCR技术(polymerase chain reaction)技术能把单个目的基因大量扩增,这个方法必须在已知基因序列或已知该基因所翻译的氨基酸序列。进而推断出因序列的情况下使用。PCR 的每次扩增循环包括三步:1)变性,在高温下把双链靶DNA拆开;2)在较低的温度下使

生物信息研究中常用蛋白质数据库的总结

生物信息研究中常用蛋白质数据库简述 内蒙古工业大学理学院呼和浩特孙利霞 2010.1.5 摘要:在后基因组时代生物信息学的研究当中,离不开各种生物信息学数据库。尤其在蛋白质从序列到功能的研究当中,目前各种行之有效的方法都是基于各种层次和结构的蛋白质数据库。随着计算机技术及网络技术的发展,目前的蛋白质数据库不论是所包含数据量还是功能都日新月异,新的数据库层出不穷。一个新手面对如此浩瀚的数据量往往无从下手。本文粗浅地为目前蛋白质数据库的使用勾画出一个轮廓,作为自己蛋白质研究入门的一个引导。 关键词:蛋白质;数据库 0 引言 随着科技的发展,个人的知识往往赶不上快速膨胀的信息量,人们为了解决这个问题,便创建了形形色色的数据库。蛋白质数据库是指:在蛋白质研究领域根据实际需要,对蛋白质序列、蛋白质结构以及文献等数据进行分析、整理、归纳、注释,构建出具有特殊生物学意义和专门用途的数据库。蛋白质数据库总体上可分为两大类:蛋白质序列数据库和蛋白质结构数据库,蛋白质序列数据库来自序列测定,结构数据库来自X-衍射和核磁共振结构测定(详见图1)。这些数据库是分子生物信息学的基本数据资源。上世纪90年代,我国从事蛋白质研究的学者使用的蛋白质数据库储存介质还是国外实验室发布的激光光盘[1]。信息的传播储存甚为不便。随着蛋白质研究的发展飞快,同时伴随着计算机和因特网发展,蛋白质数据库的储存传播方式也发生的巨大的变化。进入21世纪后,我们所用的各种蛋白质数据库都发展成为存储在网络服务器上,基于“服务器—客户机”的访问查询方式。伴随着计算机及物理测试技术的发展数据库的容量和功能成数量级膨胀。但是面对如此浩瀚的数据,新手往往感到无从下手,在需要时找不到自己需要的合适数据库。 本文从目前蛋白质数据库建立的的逻辑层次出发,系统地简绍了常用蛋白质数据的概况,它们的查询方法以及它们相互之间的联系。同时尽量不涉及数据库建设和维护方面的计算机和网络这些数据库底层的技术,为蛋白质研究的入门者及对蛋白质感兴趣的人员的一个引导。

蛋白质结构预测和序列分析软件

蛋白质结构预测和序列分析软件蛋白质数据库及蛋白质序列分析 第一节、蛋白质数据库介绍 一、蛋白质一级数据库 1、 SWISS-PROT 数据库 SWISS-PROT和PIR是国际上二个主要的蛋白质序列数据 库,目前这二个数据库在EMBL和GenBank数据库上均建 立了镜像 (mirror) 站点。 SWISS-PROT数据库包括了从EMBL翻译而来的蛋白质序 列,这些序列经过检验和注释。该数据库主要由日内瓦大 学医学生物化学系和欧洲生物信息学研究所(EBI)合作维 护。SWISS-PROT的序列数量呈直线增长。 2、TrEMBL数据库: SWISS-PROT的数据存在一个滞后问题,即 进行注释需要时间。一大批含有开放阅读 了解决这一问题,TrEMBL(Translated E 白质数据库,它包括了所有EMBL库中的 质序列数据源,但这势必导致其注释质量 3、PIR数据库: PIR数据库的数据最初是由美国国家生物医学研究基金 会(National Biomedical Research Foundation, NBRF) 收集的蛋白质序列,主要翻译自GenBank的DNA序列。 1988年,美国的NBRF、日本的JIPID(the Japanese International Protein Sequence Database日本国家蛋 白质信息数据库)、德国的MIPS(Munich Information Centre for Protein Sequences摹尼黑蛋白质序列信息 中心)合作,共同收集和维护PIR数据库。PIR根据注释 程度(质量)分为4个等级。 4、 ExPASy数据库: 目前,瑞士生物信息学研究所(Swiss I 质分析专家系统(Expert protein anal 据库。 网址:https://www.sodocs.net/doc/198157685.html, 我国的北京大学生物信息中心(www.cbi.

基于质谱的蛋白质组学分析.

基于质谱分析的蛋白质组学 在21世纪,生命科学的研究进入了后基因组时代,蛋白质组学作为其中的一个重要分支于20世纪90年代中期应运而生。由于蛋白质的复杂性,传统的蛋白质鉴定方法如末端测序等已无法满足蛋白质组学研究中的一系列需要。因此,质谱技术作为蛋白质组学研究的一项强有力的工具日趋成熟,并作为样品制备和数据分析的信息学工具被广泛地应用。质谱技术具有灵敏度、准确度、自动化程度高的优点,能准确测量肽和蛋白质的相对分子质量,氨基酸序列及翻译后修饰、蛋白质间相互作用的检测[1],因此质谱分析无可争议地成为蛋白质组学研究的必然选择。 1. 蛋白质组学 蛋白质组学(proteomics )是从整体水平上研究细胞内蛋白质的组成、活动规律及蛋白质与蛋白质的相互作用,是功能基因组学时代一门新的科学。包括鉴定蛋白质的表达、修饰形式、结构、功能和相互作用等。根据研究目的,蛋白质组学可以分为表达蛋白质组学、结构蛋白质组学和功能蛋白质组学。表达蛋白质组学用于细胞内蛋白样品表达的定量研究。以绘制出蛋白复合物的结构或存在于一个特殊的细胞器中的蛋白为研究目的的蛋白质组学称为结构蛋白质组学,用于建立细胞内信号转导的网络图谱并解释某些特定蛋白的表达对细胞的作用[2]。功能蛋白质组学以细胞内蛋白质的功能及蛋白质之间的相互作用为研究目的,通过对选定的蛋白质组进行研究和分析,能够提供有关蛋白质的磷酸化、糖基化等重要信息。 蛋白质组学研究的核心就是能够系地的鉴定一个细胞或组织中表达的每一个蛋白质及蛋白质的性能。蛋白质组学的主要相关技术有双向凝胶电泳、双向荧光差异凝胶电泳、质谱分析等[2]。由于蛋白质的高度复杂性和大量低丰度蛋白质的存在,对分析技术提出了巨大挑战,生物质谱技术则是适应这一挑战的必然选择。 2. 生物质谱技术

蛋白质结构预测和序列分析软件

蛋白质结构预测和序列分析软件 2010-05-08 20:40 转载自布丁布果 最终编辑布丁布果 4月18日 蛋白质数据库及蛋白质序列分析 第一节、蛋白质数据库介绍 一、蛋白质一级数据库 1、 SWISS-PROT 数据库 SWISS-PROT和PIR是国际上二个主要的蛋白质序列数据库,目前这二个数据库在EMBL和GenBank数据库上均建立了镜像 (mirror) 站点。 SWISS-PROT数据库包括了从EMBL翻译而来的蛋白质序列,这些序列经过检验和注释。该数据库主要由日内瓦大学医学生物化学系和欧洲生物信息学研究所(EBI)合作维护。SWISS-PROT 的序列数量呈直线增长。2、TrEMBL数据库: SWISS-PROT的数据存在一个滞后问题,即把EMBL的DNA序列准确地翻译成蛋白质序列并进行注释需要时间。一大批含有开放阅读框(ORF) 的DNA序列尚未列入SWISS-PROT。为了解决这一问题,TrEMBL(Translated EMBL) 数据库被建立了起来。TrEMBL也是一个蛋白质数据库,它包括了所有EMBL库中的蛋白质编码区序列,提供了一个非常全面的蛋白质序列数据源,但这势必导致其注释质量的下降。 3、PIR数据库: PIR数据库的数据最初是由美国国家生物医学研究基金会(National Biomedical Research Foundation, NBRF)收集的蛋白质序列,主要翻译自GenBank的DNA序列。 1988年,美国的NBRF、日本的JIPID(the Japanese International Protein Sequence Database 日本国家蛋白质信息数据库)、德国的MIPS(Munich Information Centre for Protein Sequences摹尼黑蛋白质序列信息中心)合作,共同收集和维护PIR数据库。PIR根据注释程度(质量)分为4个等级。4、 ExPASy数据库: 目前,瑞士生物信息学研究所(Swiss Institute of Bioinformatics, SIB)创建了蛋白质分析专家系统(Expert protein analysis system, ExPASy )。涵盖了上述所有的数据库。网址:https://www.sodocs.net/doc/198157685.html, 我国的北京大学生物信息中心(https://www.sodocs.net/doc/198157685.html,) 设立了ExPASy的镜像(Mirror)。 主要蛋白质序列数据库的网址 SWISS-PROT https://www.sodocs.net/doc/198157685.html,/sprot 或 https://www.sodocs.net/doc/198157685.html,/expasy_urls.html TrEMBL https://www.sodocs.net/doc/198157685.html,/sprot PIR https://www.sodocs.net/doc/198157685.html,/pirwww MIPS——Munich Information Centre for Protein Sequences http://mips.gsf.de/ JIPID——the Japanese International Protein Sequence Database 已经和PIR合并 ExPASy https://www.sodocs.net/doc/198157685.html, 二、蛋白质结构数据库 1、PDB数据库:

蛋白质组学研究的基本步骤

请简述蛋白质组学研究的基本步骤 1.蛋白质样品的制备:蛋白质样品的制备是蛋白质组学研究的首要环节,也是最为重要的部分。蛋白质样品的质量直接影响到科学研究的真实性和可信度。 2.蛋白质的分离:双向凝胶电泳技术是目前最基础和常用的蛋白质分离方法,它能将数千种蛋白质同时分离与展示的分离技术。双向电泳分为等电聚焦电泳和SDS-PAGE两个步骤,即先进行等电聚焦电泳,按照pI的不同将蛋白分离,然后再进行SDS-PAGE按照分子量的大小不同对蛋白进行分离。IPG胶条的应用,大大提高了双向电泳的重复性。 3. 蛋白质双向电泳凝胶的染色。目前双向电泳凝胶的染色的方法有3种,分别为考马斯亮蓝染色法、银染法和荧光染色法。考马斯亮蓝染色法,操作简便,无毒性,染色后的背景及对比度良好,与下游的蛋白质鉴定方法兼容,但灵敏度较低,可以检测到30~100 ng蛋白质。银染法是一种较为流行的染色方法,银染成本较低,灵敏度高,可检测少到2~5ng的蛋白。荧光试剂显色对蛋白质无固定作用,与质谱兼容性好,而其灵敏度与银染相仿,但线性范围要远高于银染,这使二维电泳分离蛋白质的荧光检测受到普遍关注和应用。 4.双向电泳凝胶图像的采集与分析:图像采集系统通过投射扫描根据吸光度的大小获碍蛋白质点的光密度信息。一般来说,该光密度值与蛋白质点的表达丰度成正比,以便于软件分析时的定量比较。完成图像采集后采用ImageMaster等图像分析软件进行分析。分析步骤:蛋白质点检测、背景消减、归一化处理、蛋白质点匹配。 5.蛋白质鉴定:蛋白质鉴定是蛋白质组学研究中的核心内容。目前蛋白质鉴定技术主要有Edman 降解法测序、质谱。质谱是目前最常用的蛋白质鉴定方法。质谱技术的基本原理是带电粒子在磁场或电场中运动的轨迹和速度依粒子的质量与携带电荷之比质荷比( m/z) 的不同而变化,可以据此来判断粒子的质量和特性。质谱完成后利用蛋白质的各种属性参数如相对分子质量、等电点、序列、氨基酸组成、肽质量指纹谱等在蛋白质数据库中检索,寻找与这些参数相符的蛋白质。

整理(蛋白质序列数据库)

蛋白质序列数据库 我们可以根据基因组序列预测新基因,预测编码区域,并推测其产物(即蛋白质)的序列。因此,随着基因组序列的不断增长,蛋白质序列也在不断增加。 PIR 历史上,蛋白质数据库的出现先于核酸数据库。在1960年左右,Dayhoff和其同事们搜集了当时所有已知的氨基酸序列,编著了《蛋白质序列与结构图册》。从这本图册中的数据,演化为后来的蛋白质信息资源数据库PIR(Protein Information Resource)。 PIR是由美国生物医学基金会NBRF(National Biomedical Research Foundation)于1984年建立的,其目的是帮助研究者鉴别和解释蛋白质序列信息,研究分子进化、功能基因组,进行生物信息学分析。它是一个全面的、经过注释的、非冗余的蛋白质序列数据库。所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。PIR提供一个蛋白质序列数据库、相关数据库和辅助工具的集成系统,用户可以迅速查找、比较蛋白质序列,得到与蛋白质相关的众多信息。目前,PIR已经成为一个集成的生物信息数据源,支持基因组研究和蛋白质组研究。至2004年,PIR 有近30万个蛋白质的登录数据项,包括来自不同生物体的蛋白质序列。 除了蛋白质序列数据之外,PIR还包含以下信息: (1)蛋白质名称、蛋白质的分类、蛋白质的来源; (2)关于原始数据的参考文献; (3)蛋白质功能和蛋白质的一般特征,包括基因表达、翻译后处理、活化等; (4)序列中相关的位点、功能区域。 对于数据库中的每一个登录项,有与其它数据库的交叉索引,包括到GenBank、EMBL、DDBJ、GDB、MELINE等数据库的索引。PIR中一个具体的登录项如图4.4所示。

蛋白质组学检测及分析方案

iTRAQ检测及数据分析

目录 一、项目简介 (3) 二、实验方案 (3) 2.1样品准备 (3) 2.2实验流程 (3) 2.3实验结果 (4) 三、分析方案 (4) 3.1原始数据预处理及均一化 (4) 3.2差异蛋白筛选 (4) 3.3层次聚类分析 (5) 3.4差异蛋白G ENE O NTOLOGY分析 (6) 3.5差异基因P ATHWAY分析 (6) 3.6差异蛋白N ETWORK分析 (7) 四、费用概算 (7) 五、时间概算 (7)

iTRAQ检测及数据分析方案 一、项目简介 样品情况: 对比情况:针对实验产出的原始数据进行生物信息学处理。组间相互对比筛选差异蛋白,并对差异蛋白进行后续生物信息学数据分析。具体内容见如下方案: 二、实验方案 2.1 样品准备 如果送样为溶液,则溶液中一般不要有SDS、CHAPS、Triton X-100、NP40及吐温 20、40等系列的去污剂。盐浓度小于50mM。 样品可以直接寄送未处理的组织,组织样品需要>100Mg,如蛋白已经提取,则需要蛋白量>200ug。 2.2 实验流程 同位素标记相对和绝对定量(iTRAQ)技术是一种新的、功能强大的可同时对八种样品进行绝对和相对定量研究的方法。作为一种新的蛋白质绝对和相对定量技术,具有很好的精确性和重复性,并且弥补了DIGE及ICAT的不足。它可以结合非凝胶串联质谱技术,对复杂样本、细胞器、细胞裂解液等样本进行相对定量研究。

2.3 实验结果 我们的实验结果将由专业软件Protein Pilot 3.0 (ABI,USA) 进行展示: 鉴定到的该蛋白质的肽断相关信息 同一个group的蛋白质 上图选中绿色的肽断的质谱图信息 所选定蛋白质(上表绿色)的肽断信息 质谱图定量信息 三、分析方案 3.1 原始数据预处理及均一化 首先对原始检测数据进行预处理和均一化处理。使得数据达到后期统计学分析要求。 3.2 差异蛋白筛选 利用统计学方法筛选差异表达的蛋白。一般认为高丰度蛋白鉴定出多个肽段,低丰度蛋

蛋白质组学常见问题解答(参考资料)

1、iTRAQ和label-free所用的搜库软件及其版本、定量分析软件是否一致? 答:搜库软件是不一致的:iTRAQ数据采用Mascot(2.3.0);label-free则是maxquant(1.4.1.2)。 2、iTRAQ/TMT和Label-free技术都有哪些优缺点? 答:(1)定量准确性:iTRAQ/TMT的定量准确性和重现性要明显优于Label-free,Label-free的样本之间不能直接混合,导致定量的结果受到的影响因素多,因此定量结果的准确度较低; (2)鉴定通量:Label-free通量相对较高,而iTRAQ/TMT由于标记基团的影响,鉴定通量较label-free 低; (3)修饰组学:label-free定量,修饰肽段的富集(即IP)是各组分开进行的,很可能造成富集的不平行,最终造成定量不准确。因此,我们通过加入内标肽段来归一化以减少富集步骤引入的误差。而iTRAQ/TMT标记的修饰组,修饰肽段的富集是各组标记、混合后同时进行的,所以不会存在富集的不平行。因此,修饰组的定量,iTRAQ/TMT方法的定量准确性优于label-free; (4)其它:目前泛素化修饰定量组学只能用label-free来做。。 3、常用的蛋白质翻译后修饰参考数据库有哪些?

4、HPLC分级的标准及作用是什么?是否组分越多通量越高? 答:HPLC分级有两个目的:1.降低每个组分中蛋白的复杂度,利于质谱鉴定;2.增加每个组分中每个蛋白的含量,同样利于质谱的鉴定。组分的多少和样品的复杂程度有关,如果分级数太少,没有达到降低样品复杂度的作用,如果分级数目太多,反而会降低每个组分中每个蛋白的含量,并且组分越多蛋白损失越大,因此分级太少和太多都不利于质谱鉴定,我们公司的分级数目是经过系统考察得到的最优选择。 5、公司目前使用的蛋白浓度测定方法是什么? 答:我们的蛋白浓度测定使用GE公司的2D Quant kit完成,该试剂盒可耐受8 M urea和2% SDS,明显优于其它浓度测定方法。并且我们在浓度测定后会取20μg蛋白通过SDS-PAGE来确定蛋白提取是否良好,浓度测定是否准确。 6、公司采用何种蛋白酶进行蛋白酶解?

蛋白质序列分析常用网站-2018.8

蛋白质序列分析 蛋白质序列的基本性质分析是蛋白质序列分析的基本方面,一般包括蛋白质的氨基酸组成,分子质量,等电点,亲水性,和疏水性、信号肽,跨膜区及结构功能域的分析等到。蛋白质的很多功能特征可直接由分析其序列而获得。例如,疏水性图谱可通知来预测跨膜螺旋。同时,也有很多短片段被细胞用来将目的蛋白质向特定细胞器进行转移的靶标(其中最典型的例子是在羧基端含有KDEL序列特征的蛋白质将被引向内质网。WEB中有很多此类资源用于帮助预测蛋白质的功能。 基本理化性质分析:https://https://www.sodocs.net/doc/198157685.html,/protparam/ 信号肽预测:http://www.cbs.dtu.dk/services/SignalP/ 在生物内,蛋白质的合成场所与功能场所常被一层或多层细胞膜所隔开,这样就涉及到蛋白质的转运。合成的蛋白质只有准确地定向运行才能保证生命活动的正常进行。一般来说,蛋白质的定位的信息存在于该蛋白质自身结构中,并通过与膜上特殊的受体相互作用而得以表达。在起始密码子之后,有一段编码疏水性氨基酸序列的RNA片段,这个氨基酸序列就这个氨基酸序列就是信号肽序列。含有信号肽的蛋白质一般都是分泌到细胞外,可能作为重要的细胞因子起作用,从而具有潜在的应用价值。 糖基化位点预测:http://www.cbs.dtu.dk/services/Net NGlyc/ 跨膜区分析:TMORED 蛋白质序列含有跨膜区提示它可能作为膜受体起作用,也可能是定位于膜的锚定蛋白或者离子通道蛋白等,从而,含有跨膜区的蛋白质往往和细胞的功能状态密切相关。 蛋白酶的结构功能进行预测和分析:http://smart.embl-heidelberg.de/ 同源建模分析:https://www.sodocs.net/doc/198157685.html,//SWISS-MODEL.html 二级结构及折叠类预测:Predictprotein 特殊结构或结构预测:COILS MacStripe 疏水性分析:ExPASy的ProtScale 基于序列同源性分析的蛋白质功能预测: 至少有80个氨基酸长度范围内具有25%以上序列一致性才提示可能的显著性意义。类似于核酸序列同源性分析,用户直接将待分析的蛋白质序列输入NCBI/BLAST(https://www.sodocs.net/doc/198157685.html,/blast),选择程序BLASTP就可网上分析。 基于motif、结构位点、结构功能域数据库的蛋白质功能预测 蛋白质的磷酸化与糖基化对蛋白质的功能影响很大,所以对其的分析也是生物信息学的一个部分。同时,分子进化方面的研究表明,蛋白质的不同区域具有

蛋白质质谱分析

蛋白质质谱分析研究进展作者:汪福源蛋白质质谱分析研究进展摘要:随着科学的不断发展,运用质谱法进行蛋白质的分析日益增多,本文简要综述了肽和蛋白质等生物大分子质谱分析的特点、方法及蛋白质质谱分析的原理、方式和应用,并对其发展前景作出展望。关键词:蛋白质,质谱分析,应用前言:蛋白质是生物体中含量最高,功能最重要的生物大分子,存在于所有生物细胞,约占细胞干质量的50%以上,作为生命的物质基础之一,蛋白质在催化生命体内各种反应进行、调节代谢、抵御外来物质入侵及控制遗传信息等方面都起着至关重要的作用,因此蛋白质也是生命科学中极为重要的研究对象。关于蛋白质的分析研究,一直是化学家及生物学家极为关注的问题,其研究的内容主要包括分子量测定,氨基酸鉴定,蛋白质序列分析及立体化学分析等。随着生命科学的发展,仪器分析手段的更新,尤其是质谱分析技术的不断成熟,使这一领域的研究发展迅速。自约翰.芬恩(JohnB.Fenn)和田中耕一(Koichi.Tanaka)发明了对生物大分子进行确认和结构分析的方法及发明了对生物大分子的质谱分析法以来,随着生命科学及生物技术的迅速发展,生物质谱目前已成为有机质谱中最活跃、最富生命力的前沿研究领域之一[1]。它的发展强有力地推动了人类基因组计划及其后基因组计划的提前完成和有力实施。质谱法已成为研究生物大分子特别是蛋白质研究的主要支撑技术之一,在对蛋白质结构分析的研究中占据了重要地位[2]。1.质谱分析的特点质谱分析用于蛋白质等生物活性分子的研究具有如下优点:很高的灵敏度能为亚微克级试样提供信息,能最有效地与色谱联用,适用于复杂体系中痕量物质的鉴定或结构测定,同时具有准确性、易操作性、快速性及很好的普适性。2.质谱分析的方法近年来涌现出较成功地用于生物大分子质谱分析的软电离技术主要有下列几种:1)电喷雾电离质谱;2)基质辅助激光解吸电离质谱;3)快原子轰击质谱;4)离子喷雾电离质谱; 5)大气压电离质谱。在这些软电离技术中,以前面三种近年来研究得最多,应用得也最广泛[3]。3.蛋白质的质谱分析蛋自质是一条或多条肽链以特殊方式组合的生物大分子,复杂结构主要包括以肽链为基础的肽链线型序列[称为一级结构]及由肽链卷曲折叠而形成三 维[称为二级,三级或四级]结构。目前质谱主要测定蛋自质一级结构包括分子量、肽链氨基酸排序及多肽或二硫键数目和位置。3.1蛋白质的质谱分析原理以往质谱(MS)仅用于小分子挥发物质的分析,由于新的离子化技术的出现,如介质辅助的激光解析/离子化、电喷雾离子化,各种新的质谱技术开始用于生物大分子的分析。其原理是:通过电离源将蛋白质分子转化为气相离子,然后利用质谱分析仪的电场、磁场将具有特定质量与电荷比值(M/Z值)的蛋白质离子分离开来,经过离子检测器收集分离的离子,确定离子的M/Z值,分析鉴定未知蛋白质。3.2蛋白质和肽的序列分析现代研究结果发现越来越多的小肽同蛋白质一样具有生物功能,建立具有特殊、高效的生物功能肽的肽库是现在的研究热点之一。因此需要高效率、高灵敏度的肽和蛋白质序列测定方法支持这些研究的进行。现有的肽和蛋白质测序方法包括N末端序列测定的化学方法Edman法、C末端酶解方法、C末端化学降解法等,这些方法都存在一些缺陷。例如作为肽和蛋白质序列测定标准方法的N末端氨基酸苯异硫氰酸酯(phenylisothiocyanate)PITC分析法(即Edman法,又称PTH法),测序速度较慢(50个氨基酸残基/天);样品用量较大(nmol级或几十pmol级);对样品纯度要求很高;对于修饰氨基酸残基往往会错误识别,而对N末端保护的肽链则无法测序[4]。C末端化学降解测序法则由于无法找到PITC这样理想的化学探针,其发展仍面临着很大的困难。在这种背景下,质谱由于很高的灵敏度、准确性、易操作性、快速性及很好的普适性而倍受科学家的广泛注意。在质谱测序中,灵敏度及准确性随分子量增大有明显降低,所以肽的序列分析比蛋白容易许多,许多研究也都是以肽作为分析对象进行的。近年来随着电喷雾电离质谱(electrospray ionisation,ESI)及基质辅助激光解吸质谱(matrix assisted laser

蛋白质数据库应用swiss-port和PPD

摘要 本文对SWISS-PROT和PDB两个数据库进行了简要介绍以及如何进行序列的单个下载和批量下载进行了说明。 关键词:SWISS-PROT PDB 下载

ABSTRACT In this paper,I make a brief introduction about SWISS-PROT and PDB and how to make a single download and batch download about sequence. Key words:SWISS-PROT PDB download

摘要 0 ABSTRACT (1) 一Swiss-Port的使用方法 (4) 1.1网站简介 (4) 1.2数据下载: (5) 二 PDB的使用方法 (5) 2.1网站简介 (5) 2.2数据下载 (9)

一Swiss-Port的使用方法 SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。SWISS-PROT只接受直接测序获得的蛋白质序列,序列提交可以在其Web页面上完成。Swiss-Port的网址为http://www.expasy.ch/sprot。 1.1网站简介 打开网站后可以找到如下所示部分: 在处可以查询序列。点击后会有如下界面: 在输入区输入序列:MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHL VLRLRGG,点击按钮可以进行查找(查找时还可以在其下方进行一系列的筛选条件控制)。 查询后会看到如下界面,在这里可以看到你进行查询的时间,查询所用时间,

相关主题