搜档网
当前位置:搜档网 › 蛋白质组学研究(完整版)

蛋白质组学研究(完整版)

蛋白质组学研究(完整版)
蛋白质组学研究(完整版)

蛋白质组学

第一课概论

一、蛋白质组学(Proteomics)

90年代初期开始实施的人类基因组计划,在经过各国科学家近10年的努力下,已经取得了巨大的成就。不仅完成了十余种模式生物(从大肠杆菌、酿酒酵母到线虫)基因组全序列的测定工作,还有望在2003年提前完成人类所有基因的全序列测定。那么,知道了人类的全部遗传密码即基因组序列,就可以任意控制人的生老病死吗?其实并不是这么简单。基因组学(genomics)虽然在基因活性和疾病的相关性方面为人类提供了有力根据,但实际上大部分疾病并不是因为基因改变所造成。并且,基因的表达方式错综复杂,同样的一个基因在不同条件、不同时期可能会起到完全不同的作用。关于这些方面的问题,基因组学是无法回答的。所以,随着人类基因组计划的逐步完成,科学家们又进一步提出了后基因组计划,蛋白质组(proteome)研究是其中一个很重要的内容。

那么,基因组和蛋白质组到底有什么联系?我们可以这样理解生命,遗传信息从DNA(基因)转变为一种被称作mRNA的中间转载体,然后再合成各式各样的结构蛋白质和功能蛋白质,构成一种有机体,完成生命的功能。基因→ mRNA→蛋白质,三位一体,构成了遗传信息的流程图,这即是传统的中心法则。现在已经证明,一个基因并不只存在一个相应的蛋白质,可能会有几个,甚至几十个。什么情况下会有什么样的蛋白,这不仅决定于基因,还与机体所处的周围环境以及机体本身的生理状态有关。并且,基因也不能直接决定一个功能蛋白。实际上,往往是通过基因的转录、表达产生一个蛋白质前体,在此基础上再进行加工、修饰,才成为一个具生物活性的蛋白质。这样的蛋白质还通过一系列的运输过程,到组织细胞内适当的位置才能发挥正常的生理作用。基因不能完全决定这样的蛋白质后期加工、修饰以及转运定位的全过程。而且,这些过程中的任何一个步骤发生微细的差错即可导致机体的疾病。纽约Rockefeller大学的细胞和分子生物学家Günter Blobel博士就是因其“蛋白质内在的信号分子活性,调节自身的细胞内转运和定位”研究上的卓越成就,获得了1999年诺贝尔医学奖和生理学奖。

近些年来人们又发现蛋白质间亦存在类似于mRNA分子内的剪切、拼接,具有自身特有的活动规律。这种自主性不能从其基因编码序列中预测,而只能通过对其最终的功能蛋白进行分析。因此说,基因虽是遗传信息的源头,而功能性蛋白是基因功能的执行体。基因组计划的实现固然为生物有机体全体基因序列的确定、为未来生命科学研究奠定了坚实的基础,但是它并不能提供认识各种生命活动直接的分子基础,其间必须研究生命活动的执行体-蛋白质这一重要环节。蛋白质组学(proteomics)研究即旨在解决这一问题。

蛋白质组(proteome)一词,源于蛋白质(protein)与基因组(genome)两个词的杂合,意指“一种基因组所表达的全套蛋白质”,即包括一种细胞乃至一种生物所表达的全部蛋白质。蛋白质组的研究不仅能为生命活动规律提供物质基础,也能为众多种疾病机理的阐明及攻克提供理论根据和解决途径。通过对正常个体及病理个体间的蛋白质组比较分析,我们可以找到某些“疾病特异性的蛋白质分子”,它们可成为新药物设计的分子靶点,或者也会为疾病的早期诊断提供分子标志。确实,那些世界范围内销路最好的药物本身是蛋白质或其作用靶点为某种蛋白质分子。因此,蛋白质组学研究不仅是探索生命奥秘的必须工作,也能为人类健康事业带来巨大的利益。

与基因重组、表达、序列分析的快速、自动化程度相比,到最近为止,机体组织细胞内蛋白质的序列分析只是实验室小规模研究项目。随着对生物学、物理、化学及信息学的各种尖端技术的综合应用,蛋白质组研究也正逐步变成高产量、高精确度的分析过程。现今,蛋白质组研究中主要应用的技术包括:双相电泳(2-DE)、新型质谱(MS)技术、数据库设置与检索系统等。为了保证分析过程的精确性和重复性,大规模样品处理机器人也被应用。整个研究过程包括:样品处理、蛋白质的分离、蛋白质丰度分析、蛋白质鉴定等步骤。当前,蛋白质组分析虽然以双相电泳和质谱分析为其技术基础,但离不开各种先进的数据分析和图象分析软件及网络技术的支持。

自1995年蛋白质组(proteome)一词问世到现在,虽然只有短短的五年多时间,蛋白质组学研究却得到了突飞猛进的发展。1995年,悉尼大学Humphery Smith I实验室与Williams等4家实验室合作,对至今已知最小的自我复制生物(一种支原体)进行了蛋白质成分的大规模分离与鉴定后,到1996年,蛋白

质组研究对象已迅速扩展到单细胞真核生物-酵母以及人体正常组织、病理标本等。参与国家在1995年只有澳大利亚,而到1997年时已有美国、丹麦、瑞士、英、法、日、瑞典、意、德等10个国家加入。国际著名学府哈佛、斯坦福、耶鲁、密执安、华盛顿大学、欧洲分子生物学实验室、巴士德研究所、瑞士联邦工业学院等均挤身此类研究。如今澳大利亚悉尼大学与Macquarie大学仍处领先水平,但美欧多家实验室已奋起直追。

不过,蛋白质组学为一种新生领域,目前还处于初期发展阶段,仍有许多困难有待克服。如双相电泳和质谱分析的灵敏度还很难将体内微量的调节蛋白质精确分析。而这种微量调控蛋白的精确表达在生命过程中起到关键性作用。另外,当前质谱分析仪的价格十分昂贵,约为DNA序列分析仪的十倍之多,严重影响了它的普及和被广泛应用。再者,成千上万种蛋白质间及蛋白质与其它生物大分子间的相互作用和作用方式的复杂性同样也是蛋白质组研究所面临的问题。近年来,我国的人类基因组研究正在迅速开展,并取得了许多有意义的成果。我国曾有很好基础的蛋白质领域方面的研究,如人工合成胰岛素等。然而,蛋白质组研究在国际上正如火如荼、轰轰烈烈,我国则刚启动。如何抓住国际上蛋白质组学研究刚刚启动的时机,迅速地进入到蛋白质组学的国际前沿,是摆在我国生命科学研究发展方向决策中的一个重要问题。

网上蛋白质组学资源

由于蛋白质组学研究依赖生物信息学和网络技术,internet 上有关蛋白质组研究的技术支持以及蛋白质数据分析的专家系统、数据库等专门网站很多。

蛋白质组研究技术、信息等。

从新药开发角度,发现新蛋白及新作用。

可以找到蛋白质组研究相关企业、各种仪器来源、新闻等。

各种蛋白质组研究相关信息

介绍蛋白质鉴定的先进仪器

蛋白质鉴定专家系统,Swiss Institute of Bioinformatics

蛋白质鉴定专家系统,Australian Proteome Analysis Facility

蛋白质鉴定专家系统,Canadian Bioinformatics Resours

第二课蛋白质组学研究

一、酵母双杂交技术及其在蛋白质组研究中的应用

杨齐衡李林*

(中国科学院上海生物化学研究所, 上海 200031)

作为后基因组时代出现的新兴研究领域之一, 蛋白质组学(proteomics)正受到越来越多的关注。蛋白质组学的研究目标是对机体或细胞的所有蛋白质进行鉴定和结构功能分析。蛋白质组学的研究不局限任何特定的方法。高分辨率的蛋白质分离技术如二维凝胶电泳和高效液相层析, 经典的蛋白质鉴定方法如氨基酸序列分析等, 现代质谱技术, 基因组学研究的各种手段, 现代计算机信息学和计算机网络通讯技术等等, 任何可用于蛋白质研究的技术手段, 蛋白质组学都可能会采用。它体现的是一个开放的思维和研究方式。

蛋白质-蛋白质的相互作用是细胞生命活动的基础和特征。这种千变万化的相互作用以及由此形成的纷繁复杂的蛋白质联系网络同样也是蛋白质组学的研究内容, 相应的工作也已经开展。

酵母双杂交系统(yeast two-hybrid system)自建立以来已经成为分析蛋白质相互作用的强有力的方法之一。该方法在不断完善, 如今它不但可用来在体内检验蛋白质间的相互作用, 而且还能用来发现新的作用蛋白质, 在对蛋白质组中特定的代谢途径中蛋白质相互作用关系网络的认识上发挥了重要的作用。实验表明双杂交技术在蛋白质组学上的应用是成功的。本文将就双杂交技术的产生、发展及其在蛋白质组研究方面的初步应用作一介绍。

1 蛋白质组学的产生背景

基因组研究自从开展以来已经取得了举世瞩目的成就。在过去几年中, 已经陆续完成了包括大肠杆菌、酿酒酵母等十多种结构比较简单的生物的基因组DNA的全序列分析[1]。线虫(C.elegans)的基因组DNA测序工作已基本完成[2]。规模更为庞大的人类基因组计划预期在下一世纪的前几年(2003~2005年)也将完成全部基因组DNA的序列分析。这些进展是非常令人振奋的。但是也随之产生了新问题。大量涌出的新基因数据迫使我们不得不考虑这些基因编

码的蛋白质有什么功能这个问题。不仅如此, 在细胞合成蛋白质之后, 这些蛋白质往往还要经历翻译后的加工修饰。也就是说, 一个基因对应的不是一种蛋白质而可能是几种甚至是数十种。包容了数千甚至数万种蛋白质的细胞是如何运转的?或者说这些蛋白质在细胞内是怎样工作、如何相互作用、相互协调的?这些问题远不是基因组研究所能回答得了的。正是在此背景下, 蛋白质组学(proteomics)应运而生。

蛋白质组(proteome)一词是马克.威尔金斯(Marc Wilkins)最先提出来的[3], 最早见诸于1995年7月的“Electrophoresis”杂志上[4], 它是指一个有机体的全部蛋白质组成及其活动方式。蛋白质组研究虽然尚处于初始阶段, 但已经取得了一些重要进展。当前蛋白质组学的主要内容是, 在建立和发展蛋白质组研究的技术方法的同时, 进行蛋白质组分析。对蛋白质组的分析工作大致有两个方面。一方面, 通过二维凝胶电泳得到正常生理条件下的机体、组织或细胞的全部蛋白质的图谱, 相关数据将作为待检测机体、组织或细胞的二维参考图谱和数据库。一系列这样的二维参考图谱和数据库已经建立并且可通过联网检索。二维参考图谱建立的意义在于为进一步的分析工作提供基础。蛋白质组分析的另一方面, 是比较分析在变化了的生理条件下蛋白质组所发生的变化。如蛋白质表达量的变化, 翻译后修饰的变化, 或者可能的条件下分析蛋白质在亚细胞水平上的定位的改变等。关于蛋白质组学的介绍可参阅文献[5,6]。

细胞或组织的蛋白质不是杂乱无章的混合物, 蛋白质间的相互作用、相互协调是细胞进行一切代谢活动的基础。蛋白质间的相互作用及作用方式同样也是蛋白质组研究所面临的问题。研究蛋白质间的相互作用有多种方法, 常用的如酵母双杂交系统、亲和层析、免疫沉淀、蛋白质交联等。其中, 酵母双杂交系统是当前发展迅速、应用广泛的主要方法。

2 酵母双杂交系统的建立与发展

双杂交系统的建立得力于对真核生物调控转录起始过程的认识。细胞起始基因转录需要有反式转录激活因子的参与。 80年代的工作表明, 转录激活因子在结构上是组件式的(modular), 即这些因子往往由两个或两个以上相互独立的结构域构成, 其中有DNA结合结构域(DNA binding domain, 简称为DB)和转录激活结构域(activation domain, 简称为AD), 它们是转录激活因子发挥功能所

必需的。单独的DB虽然能和启动子结合, 但是不能激活转录。而不同转录激活因子的DB和AD形成的杂合蛋白仍然具有正常的激活转录的功能。如酵母细胞的Gal4蛋白的DB与大肠杆菌的一个酸性激活结构域B42融合得到的杂合蛋白仍然可结合到Gal4结合位点并激活转录[7]。

Fields等人的工作标志双杂交系统的正式建立[8]。他们以与调控SUC2基因有关的两个蛋白质Snf1和Snf2为模型, 将前者与Gal4的DB结构域融合, 另外一个与Gal4的AD结构域的酸性区域融合。由DB和AD形成的融合蛋白现在一般分别称之为“诱饵”(bait)和“猎物”或靶蛋白(prey or target protein)。如果在Snf1和Snf2之间存在相互作用, 那么分别位于这两个融合蛋白上的DB和AD就能重新形成有活性的转录激活因子, 从而激活相应基因的转录与表达。这个被激活的、能显示“诱饵”和“猎物”相互作用的基因称之为报道基因(reporter gene)。通过对报道基因表达产物的检测, 反过来可判别作为“诱饵”和“猎物”的两个蛋白质之间是否存在相互作用。在此Fields等人采用编码β-半乳糖苷酶的LacZ作为报道基因, 并且在该基因的上游调控区引入受Gal4蛋白调控的GAL1序列。这个改造过的LacZ基因被整合到酵母染色体URA3位上。而酵母的GAL4基因和GAL80基因(Gal80是Gal4的负调控因子)被缺失, 从而排除了细胞内源调控因子的影响。已经知道在Snf1和Snf2之间存在相互作用。结果发现只有同时转化了Snf1和Snf2融合表达载体的酵母细胞才有β-半乳糖苷酶活性, 单独转化其中任何一个载体都不能检测出β-半乳糖苷酶活性。

目前发展起来的各种双杂交系统大多是以Fields等人建立的系统为基础的。这些新系统主要对报道基因、“诱饵”表达载体以及“猎物”表达载体等做了一些改进。其中一个重要改进是引入额外的报道基因, 如广泛采用的HIS3基因。经过改造带有HIS3报道基因的酵母细胞, 只有当HIS3被启动表达才能在缺乏组氨酸的选择性培养基上生长。 HIS3报道基因的转录表达是由“诱饵”和“猎物”的相互作用所启动的。大多数双杂交系统往往同时使用两个甚至三个报道基因, 其中之一是LacZ。这些改造后的基因在启动子区有相同的转录激活因子结合位点, 因此可以被相同的转录激活因子(如上述的Gal4蛋白)激活。通过这种双重或多重选择既提高了检测灵敏度又减少了假阳性现象。其他还有

针对“诱饵”或“猎物”表达载体等所作的改进, 这里不一一详述。

在双杂交鉴定过程中要经过两次转化, 这个工作量是相当大的, 特别是寻找新的作用蛋白质的时候尤其如此。而且, 酵母细胞的转化效率比细菌要低约4个数量级。因此转化步骤就成为双杂交技术的瓶颈。 Bendixen等人通过酵母接合型的引用, 避免了两次转化操作, 同时又提高了双杂交的效率[9]。在酵母的有性生殖过程中涉及到两种配合类型: a接合型和α接合型, 这两种单倍体之间接合(mating)能形成二倍体, 但a接合型细胞之间或α接合型细胞之间不能接合形成二倍体。根据酵母有性生殖的这一特点, 他们将文库质粒转化α接合型酵母细胞, “诱饵”表达载体转化a接合型细胞。然后分别铺筛选平板使细胞长成菌苔(lawn), 再将两种菌苔复印到同一个三重筛选平板上, 原则上只有诱饵和靶蛋白发生了相互作用的二倍体细胞才能在此平板上生长。单倍体细胞或虽然是二倍体细胞但DB融合蛋白和AD融合蛋白不相互作用的都被淘汰。长出来的克隆进一步通过β-半乳糖苷酶活力进行鉴定。这项改进不仅简化了实验操作, 而且也提高了双杂交的筛选效率。

在研究蛋白质的结构功能特点、作用方式过程中, 有时还要通过突变、加抑制剂等手段破坏蛋白质间的相互作用。针对实际工作中的这种需要, Vidal等人发展了所谓的逆双杂交系统(reverse two-hybrid system)[10,11]。这项技术的关键是报道基因URA3的引入。 URA3基因在这里起到了反选择的作用, 它编码的酶是尿嘧啶合成的关键酶。该酶能把5-氟乳清酸(5-FOA)转化成对细胞有毒的物质。 Vidal等人通过改造在URA3基因的启动子内引入Gal4的结合位点。这个改造的酵母菌株在缺乏尿嘧啶的选择性培养基上只有当“诱饵”和“猎物”相互作用激活URA3基因的表达才能生长。在含有5-FOA的完全培养基上“诱饵”和“猎物”的相互作用则抑制细胞的生长。然而如果目的蛋白, 即与DB或AD融合的蛋白质发生了突变或者由于外加药物的干扰不再相互作用, URA3基因不表达, 则细胞能在含有5-FOA的完全培养基上生长。通过这种方法,Vidal等人筛选到了转录因子E2F1的突变物, 这些突变物仍然能结合视网膜母细胞瘤蛋白RB, 但是丧失了同另外一种称为DP1蛋白的结合能力。结果得到了体外结合实验的验证。通过对这些突变蛋白基因的测序, 他们发现了新的E2F1同DP1结合的位点。

相关主题