搜档网
当前位置:搜档网 › 代谢组学小常识

代谢组学小常识

代谢组学小常识
代谢组学小常识

代谢组学小常识

概念:

?代谢组:指一个细胞、组织或器官中所有代谢物的集合, 包含一系列不同类型的小分子(通常分子量<1000), 比如肽、碳水化合物、脂类、核酸等。

?代谢组学:通过考察生物体系(细胞、组织或生物体)受刺激或扰动后,其代谢产物的变化或其随时间的变化,来研究生物体系的一门科学。

实验流程:(以液质联用为基础的代谢组学为例)

?样本前处理:在保证小分子代谢物完整的前提下,处理的步骤越简单越好,以保证操作容易重复,也为大批量样本的处理节约时间。

?数据采集:依据实验目的有所不同。

o非目标代谢组学:选用高分辨质谱仪(TOF,Orbitrap等),有助于检测到尽可能多的化合物,另外高分辨的质核比数据也有助于数据库检索以及化合物的鉴定。

o目标代谢组学:通常使用三重四极其杆质谱,提高检测的灵敏度以及定量的准确性。

?数据预处理:峰提取,排列,归一化。

o多数质谱商家都提供了配套的预处理软件,例如安捷伦公司的MassHunter,热电的Sieve,沃特世的MarkerLynx以及Progenisis QI。

o同时也有一些基于网络的可以免费获取的软件。建议使用配套的软件,因为不需要额外的数据转换,不需要上传数据,节省时间。

?数据分析:多元统计分析包括主成份分析(PCA),偏最小二乘判别分析(PLS-DA),正交偏最小二乘判别分析(OPLS-DA),聚类分析(HCA)等。各个厂商也提供了相应的统计分析软件,比如安捷伦的MPP,热电的Sieve,沃特世的Ezinfor。目前常用的第三方软件是Simca-p,同时也有一些网络的开源软件可以使用。

?化合物鉴定:数据库检索,标准品对比,二级质谱对比。

代谢组学文章中常见的统计图(一)

主成分分析(PCA)

PCA得分图(score plot),用来看样本天然的分组情况,在分析时不加任何分组信息。图中每一个点代表一个样本,样本在空间中所处的位置由其中所含有的代谢物的差异决定。

PCA载荷图(loading plot),用来寻找差异变量。同种的每一个点代表样本中还有的一个代谢物物,距离原点越远的代谢物被认为对样本的分类贡献越大。

偏最小二乘判别分析(PLS-DA)

得分图和载荷图的解释同PCA。区别在于,PLS-DA在分析时提前赋予每个样本分组信息,简单说,就是在分

析时扩大组间差异,减少组内差异,多用来寻找标记物。

正交偏最小二乘判别分析(OPLS-DA)

在OPLS-DA分析中,寻找标记物通常使用S-plot。如图中所示,得分图中,两组样本分布在y轴两侧,通过S-plot可以获得标记物在两组中相对含量的变化。也就是说,处在S-plot右上角的化合物(距离原点越远,对分类贡献越大)在处在得分图y轴右侧的样本中含量较高,反之亦然。

代谢组学文章中常见的统计图(二)

?图中每一行代表一个化合物,每一列代表一个样本。

?上边对样本进行聚类分析,左边对化合物进行聚类分析。

?绿色代表该化合物在样本中含量较低,红色代表含量较高(也有用其他颜色表示的)。

?通过此图,可以直观地看出化合物在样本间的变化趋势;同时也可以找出具有相同变化趋势的代谢物。?在对化合物进行鉴定之后或选择出生物标记物之后,可将化合物名称(或对应的HMDB 或者KEGG编号)输入MetaboAnalyst软件(免费)进行此分析,来观察体内哪些代谢途径受到了影响。

?在图中,p值越小(-logo(p)越大),pathway impact越大,证明该条代谢通路被严重扰动。

?此分析可用来寻找化合物之间的内在联系(数值上的联系),如图中红色表示负相关,黄色表示正相关。

?可用来筛选与某一类或者某一个自己感兴趣的化合物产生正相关或者负相关的代谢物。?用来评价算选出的标记物的诊断能力。

?AUC曲线下面积越大,诊断能力越好。

非目标代谢组学(untargeted metabolomics)中常用的方法学考察的方法

QC样本的制备:

?混合相同体积的所有待检测样本,然后按照与待测样本相同的前处理方法来处理QC样本,之后进样进行LC-MS分析。

?样本检测时,通常在检测最开始运行几次QC样本,之后根据样本量的大小在每检测几个样本之后检测一次QC样本。

方法学考察:

方法一:

最早使用的一种方法,从QC样本的总离子流图中选择具有代表性的离子峰(覆盖不同的保留时间,不同的强度),在对QC样本进行重复检测之后,计算这些离子的保留时间以及峰面积的相对标准偏差(RSD),用以考察分析方法的稳定性以及重复性。

方法二:

所有样品检测完之后,收集所有的QC样本的原始数据进行数据预处理,包括(峰提取,排列,归一化等),经过数据过滤(80%规则)之后,计算剩下的峰的峰面积的RSD值。

通常如果在一个样本中有超过70%的化合物的RSD值小于等于30%,则证明该方法有良好的稳定性以及重复性,所得到的数据可靠(也有不同的评价标准,比如要求LC-MS数据小于20%,GC-MS数据小于30%等)。

图中柱形图表示化合物在不同RSD范围内的百分比分布,折线图表示在不同RSD范围的累计百分比。

方法三:

原始数据经过数据预处理之后,将所有样本(包括QC样本)进行PCA分析,在得分图中观察QC 样本的聚集程度。

由于QC样本是等量混合了所有的被检测样本,理论上QC样本包含了所有样本中的代谢物,因此QC样本理论上会分布在原点周围。

图中QC样本紧密聚集,证明方法稳定,重复性良好。

方法四:

采用混合标准品作为QC,该QC通常包含不同物理化学性质的体内和体外代谢物(使所选择的化合物具有代表性)。

检测结束后,计算这些化合物的保留时间以及峰面积的RSD用以对分离分析方法进行评价。

代谢组学研究中需要了解的质谱知识(一)

主要介绍以液质联用为分析工具的代谢组学研究中的常见问题:

1)在分析样本时,要选用什么质谱

2)质谱仪中通常按照质量分析器以及联用方式的不同对质谱进行分类,常见的包括包括:单四级杆,三重四级杆,飞行时间(TOF),Q-TOF,离子阱,线性离子阱(LTQ),静电场轨道阱(Orbitrap),LTQ-Orbitrap等。这么多质谱,我们应该如何选择

在靶向代谢组学中,通常使用三重四级杆质谱。因为靶向代谢组学是针对某一些特定的化合物进行定量检测,而LC-QqQ/MS 在MRM扫描模式下对化合物进行定量分析(如药代动力学研究)已非常普遍,所以使用此方法以达到更高的灵敏度,更准确的定量。

在非靶向代谢组学研究中,需要选择高分辨质谱进行数据采集,因为高分辨质谱可以帮助我们检测到尽可能多的化合物,提供所检测化合物的精确分子量,同位素分布等信息,有助于化合物的鉴定。

何为高分辨首先了解以下分辨率,分辨率就是指质谱仪区分两个质量相近的离子的能力。这个区分能力也有不同的定义,如10%峰谷分离,50%峰谷分离等。

理论知识就不多解释了,举个例子说明便知。

以H为例,低分辨质谱测得的H的分子量为1,而高分辨质谱测得的H分子量为(当然,能测到多精确,取决于分辨率有多高)。

有什么用呢

有用!以C2H4,CO,N2为例,这三者在低分辨质谱中测得的分子量均为28,也就是说低分辨的质谱没有办法根据分子量将三者分离;但是高分辨质谱测得三者的分子量分别为,,,可以将三者分开。

所以在非靶向代谢组学中,由于生物样本中化合物的组成非常复杂,所以要用高分辨的质谱仪对其进行检测,以达到尽可能多的检测到化合物的目的。

常用的高分辨质质量分析器:TOF和Or比trap,以及他们与其他质量分析器的联用形式如Q-TOF,Q-Orbitrap,LTQ-Orbitrap等。

注:

可以简单的认为,分辨率越高,区分离子的能力越强,即能够区分离子在很细微的分子量上的差异。但请不要将分辨率和质量精度混淆,两者不一样。

有一个简单的类比,低分辨质谱对比高分辨质谱就类似于普通天平对比十万分之一天平,精密天平可以区分物质质量的细微差异,但是天平称出的质量准确与否,取决于天平在使用之前是否校正。

代谢组学研究中需要了解的质谱知识(二)

上一篇介绍了以下质谱的分辨率,高分辨率质谱有区分分子量细微差异的能力,但是测得的分子量准确与否,则要看质谱的质量精度了。分辨率和质量精度不一样,高分辨质谱也会有质量偏差很大的情况,那今天就来谈一谈质量精度。

什么是质量精度质量精度指的是质谱测得值和理论值之间的误差。常以mDa或者ppm表示。

举个例子:

C6H12O6理论精确分子量为,

如果测得分子量为,

则误差为

或者

~~~~~~~~~~~~~~~~~~

在液质联用中,化合物通常是以加合离子的形式出现,如[M+H]+,[M+Na]+等,以上只是举例说明。

那么,如何保持较高的质量精度呢

所有的高分辨质谱在使用之前都需要对质谱仪进行校正,这个校正其实就是校正质谱的质量轴。就像我们使用十万分之一天平时用一个200克的砝码对天平进行校正一样,质谱的校正也是使用一系列已知分子量的物质(覆盖了从低到高的质量范围)对其进行校正。可以接受的偏差通常为2ppm,校正的频率依实际情况而定,Q-TOF质谱大多数一周校正一次,Orbitrap质谱校正的频率稍少一些。各大仪器厂商常用的校正液如下:

此外,几乎所有的Q-TOF质谱除了在检测之前进行质量轴校正外,在质谱运行过程中还需要对质谱进行实时校正。

在非目标代谢组学中,代谢物的鉴定通常依赖精确分子量,同位素分布等信息,仪器的数据处理软件通常可以根据采集到的质谱图对其元素组成进行推测,方便化合物的鉴定,推测的前提就是质量精度要高,在进行推测时通常需要输入一个可以接受的误差范围(如±5ppm),所以在质谱使用之前一定要对其进行校正,或者一定保证质谱的质量轴是准确的。

在代谢组学文章投稿时,都需要列出已鉴定化合物的检测分子量的误差,这个通常需要自己计算,计算方法如上述例子。这里介绍一个计算精确分子量的网站:

此外,高分辨质谱的数据处理软件如MassHunter,MassLynx,Xcalibur等,都有类似的功能。但是记得读取正确的数值,Monoisotopic mass才是精确分子量。

代谢组学的研究方法和研究流程

代谢组学的研究方法和研究流程分子微生物学112300003林兵 随着人类基因组计划等重大科学项目的实施,基因组学、转录组学及蛋白质组学在研究人类生命科学的过程中发挥了重要的作用,与此同时, 代谢组学(metabolomics)在20世纪90年代中期产生并迅速地发展起来,与基因组学、转录组学、蛋白质组学共同组成系统生物学。基因组学、转录组学、蛋白质组学和代谢组学等各种组学0在生命科学领域中发挥了重要的作用,它们分别从调控生命过程的不同层面进行研究, 使人们能够从分子水平研究生命现象, 探讨生命的本质, 逐步系统地认识生命发展的规律.这些组学手段加上生物信息学, 成为系统生物学的重要组成部分。 代谢组学的出现和发展是必要的, 同时也是必须的。对于基因组学和蛋白质组学在生命科学研究中的缺点和不足, 代谢组学正好可以进行弥补。代谢组学研究的是生命个体对外源性物质(药物或毒物)的刺激、环境变化或遗传修饰所做出的所有代谢应答, 并且检测这种应答的全貌及其动态变化。代谢组学方法为生命科学的发展提供了有力的现代化实验技术手段, 同时也为新药临床前安全性评价与实践提供了新的技术支持与保障. 1 代谢组学的概念及发展 代谢组学最初是由英国帝国理工大学Jeremy N icholson教授提出的,他认为代谢组学是将人体作为一个完整的系统,机体的生理病理过程作为一个动态的系统来研究, 并且将代谢组学定义为生物体对病理生理或基因修饰等刺激产生的代谢物质动态应答的定量测定。2000年,德国马普所的Fiehn等提出了代谢组学的概念,但是与N ichols on提出的代谢组学不同, 他是将代谢组学定位为一个静态的过程,也可以称为/代谢物组学, 即对限定条件下的特定生物样品中所有代谢产物的定性定量分析。同时Fiehn还将代谢组学按照研究目的的不同分为4类: 代谢物靶标分析,代谢轮廓(谱)分析, 代谢组学,代谢指纹分析。现在代谢组学在国内外的研究都在迅速地发展, 科学家们对代谢组学这一概念也进行了完善, 作出了科学的定义: 代谢组学是对一个生物系统的细胞在给定时间和条件下所有小分子代谢物质的定性定量分析,从而定量描述生物内源性代谢物质的整体及其对内因和外因变化应答规律的科学。 与基因组学、转录组学、蛋白质组学相同, 代谢组学的主要研究思想是全局观点。与传统的代谢研究相比, 代谢组学融合了物理学、生物学及分析化学等多学科知识, 利用现代化的先进的仪器联用分析技术对机体在特定的条件下整个代谢产物谱的变化进行检测,并通过特殊的多元统计分析方法研究整体的生物学功能状况。由于代谢组学的研究对象是人体或动物体的所有代谢产物, 而这些代谢产物的产生都是由机体的内源性物质发生反应生成的,因此,代谢产物的变化也就揭示了内源性物质或是基因水平的变化,这使研究对象从微观的基因变为宏观的代谢物,宏观代谢表型的研究使得科学研究的对象范围缩小而且更加直观,易于理解, 这点也是代谢组学研究的优势之一. 代谢组学的优势主要包括:对机体损伤小,所得到的信息量大,相对于基因组学和蛋白质组学检测更加容易。由于代谢组学发展的时间较短, 并且由于代谢组学的分析对象是无偏向性的样品中所有的小分子物质,因此对分析手段的要求比较高, 在数据处理和模式识别上也不成熟,存在一些不足之处。同时生物体代谢物组变化快, 稳定性较难控制,当机体的生理和药理效应超敏时,受试物即使没有相关毒性,也可能引起明显的代谢变化,导致假阳性结果。 代谢组学应用领域大致可以分为以下7个方面:

代谢组学的数据分析技术

代谢组学的数据分析技术 摘要:代谢组学是效仿基因组学和蛋白质组学的研究思想,对生物体内所有代谢物进行定量分析,并寻找代谢物与生理病理变化的相对关系的研究方式,是系统生物学的组成部分。其研究对象大都是相对分子质量1000以内的小分子物质。先进分析检测技术结合模式识别和专家系统等计算分析方法是代谢组学研究的基本方法。文章主要综述了将代谢组学中的图谱、数据信息转换为相应的参数所采用的分析方法。 关键词:代谢组学;数据分析方法 代谢组学是以代谢物分析的整体方法来研究功能蛋白如何产生能量和处理体内物质,评价细胞和体液内源性和外源性代谢物浓度及功能关系的新兴学科,是系统生物学的重要组成部分,其相应的研究能反映基因组、转录组和蛋白组受内外环境影响后相互协调作用的最终结果,更接近反映细胞或生物的表型,因此被越来越广泛地应用。而代谢组学的数据分析包括预处理和统计分析方法,多元统计分析方法主要分为两大类:非监督和监督方法,非监督方法包括主成分分析PCA;聚类分析CA等;监督方法包括显著性分析、偏最小二乘法等,本文就是主要综述代谢组学图谱信息转化为参数信息所采用的数据分析方法。 1预处理 数据的预处理过程包括以下:谱图的处理;生成原始的数据矩阵;数据的归一化以及标准化处理过程。针对实验性质、条件以及样品等因素采用不同的预处理方法。在实际应用过程中,预处理可以通过实验系统自带的软件如XCMS软件。进行,因此一般较容易获得所需的数据形式。 2数据分析方法 2.1 主成分分析PCA是多元统计中最常用的一种方法,它是在最大程度上提取原始信息的同时对数据进行降维处理的过程,其目的是将分散的信息集中到几个综合指标即主成分上,有助于简化分析和多维数据的可视化,进而通过主成分来描述机体代谢变化的情况。PCA 的具体过程是通过一种空间转换,形成新的样本集,按照贡献率的大小进行排序,贡献率最大的称为第一主成分,依次类推。经验指出,当累计贡献率大于85%时所提取的主成分就能代表原始数据的绝大多数信息,可停止提取主成分。在代谢组数据处理中,PCA是最早且广泛使用的多变量模式识别方法之一。,具有不损失样品基本信息、对原始数据进行降维处理的同时避免原始数据的共线性问题等优点,但在实际应用过程中,PCA存在着自身的缺点[1]:离群样本点的存在严重影响其生物标志物的寻找;非保守性的代谢组分扰乱正确的分类以及尺度的差异影响小浓度组分的表现等,其他的问题之前也有讨论[2]。针对PCA 的缺陷采用了不同的改进措施,与此同时,为了简化计算,侯咏佳等[3]。提出了一种主成分分析算法的FPGA实现方案,通过Givens算法和CORD IC算法的矢量旋转,用简单的移位和加法操作来实现协方差矩阵的特征分析,只需计算上三角元素,因此计算复杂度小、迭代收敛速度快。 2.2 聚类分析CA是用多元统计技术进行分类的一种方法。其主要原理是:利用同类样本应彼此相似,相类似的样本在多维空间里的彼此距离应较小,而不同类的样本在多维空间里的

代谢组学在医药领域的应用与进展

代谢组学在医药领域的应用与进展 一、学习指导 1.学习代谢组学的概念及内涵,掌握代谢组学的研究对象与分析方法。 2.熟悉代谢组学数据分析技术手段 3.了解代谢组学优势特点 4.了解代谢组学在医药领域的应用 5.了解代谢组学发展趋势 二、正文 基因组功能解析是后基因组时代生命科学研究的热点之一,由于基因功能的复杂性和生物系统的完整性,必然要从“整体”层面上来理解构成生物体系的各个模块功能。随着新的测量技术、高通量的分析方法、先进的信息科学和系统科学新理论的发展,加上生物学研究的深入和生物信息的大量积累,使得在系统水平上研究由分子生物学发现的组件所构成的生命体系成为可能[1]。系统生物学家们认为,将生命科学上升为“综合”科学的时机已经成熟,生命科学再次回到整合性研究的新高度,逐步由分子生物学时代进入到系统生物学时代[2]。系统生物学不同以往的实验生物学仅关注个别基因和蛋白质,它要研究所有基因、蛋白质,代谢物等组分间的所有相互关系,通过整合各组成成分的信息,以数学方法建立模型描述系统结构[3,4]。 (一)代谢组学的概念及内涵 代谢组学是继基因组学、转录组学和蛋白质组学之后,系统生物学的重要组成部分,也是目前组学领域研究的热点之一。代谢组学术语在国际上有两个英文名,即metabolomics 和metabonomics。Metabolomics是由德国的植物学家Fiehn等通过对植物代谢物研究提出来的,认为代谢组学(metabolomics)是定性和定量分析单个细胞或单一类型细胞的代谢调控和代谢流中所有低分子量代谢产物,从而监测机体或活细胞中化学变化的一门科学[5]。英国Nicholson研究小组从毒理学角度分析大鼠尿液成份时提出了代谢组学(Metabonomics)的概念,认为代谢组学是通过考察生物体系受扰动或刺激后(如某个特定基因变异或环境变化后),其代谢产物的变化或代谢产物随时间的变化来研究生物体系的代谢途径的一种技术[6]。国内的代谢组学研究小组基本用metabonomics一词来表示“代谢组学”。严格地说,代谢组学所研究的对象应该包括生物系统中所有的代谢产物。但由于实际分析手段的局限性,只对各种代谢路径底物和产物的小分子物质(MW<1Kd)进行测定和分析。 (二)代谢组学优势特点 代谢组学作为系统生物学的一个重要组成部分,代谢组可以更好地反映体系表型生物机体是一个动态的、多因素综合调控的复杂体系,在从基因到性状的生物信息传递链中,机体需通过不断调节自身复杂的代谢网络来维持系统内部以及与外界环境的正常动态平衡[7]。

代谢组学研究进展综述

代谢组学技术及其在中医研究中的探讨 姓名:郭欣欣学号:22009283 导师:刘慧荣 代谢组学(metabonomics) 是20世纪90年代中期发展起来的一门新兴学科,是关于生物体系受刺激或扰动后(如将某个特定的基因变异或环境变化后) 其代谢产物(内源代谢物质) 种类、数量及其变化规律的科学。它研究的是生物整体、系统或器官的内源性代谢物质的代谢途径及其所受内在或外在因素的影响。常用的方法是检测和量化一个生物整体代谢随时间变化的规律;建立内在和外在因素影响下,代谢整体的变化轨迹,反映某种病理(生理) 过程中所发生的一系列生物事件。 1 代谢组学研究技术平台 代谢组学研究的技术平台包括以下几个部分:前期的样品制备,中期的代谢产物检测、分析与鉴定以及后期的数据分析与模型建立。 前期代谢组学研究常用的检测技术,一般不需要对标本行特别的分离、纯化等。但离体条件下,细胞或组织内的代谢状态可迅速改变,代谢物的质与量亦随之变化,为正确反映在体的真实信息,须立即阻断内在酶的活性。最为常用的是冰冻/液氮降温法及冷冻、干燥的保存技术,尽管如此,细胞间仍始终有一低水平的代谢活动,需尽量避免氧化等活化因素。 中期代谢产物的检测、分析与鉴定是代谢组学技术的核心部分,最常用的是NMR及质谱(MS)两种。 核磁共振技术是利用高磁场中原子核对射频辐射的吸收光谱鉴定化合物结构的分析技术,生命科学领域中常用的是氢谱( 1H NMR ) 、碳谱(13C NMR)及磷谱(31P NMR)三种。可用于体液或组织提取液和活体分析两大类。 NMR技术在代谢组学中的应用越来越广泛,它具有如下优点: ①无损伤性,不破坏样品的结构和性质; ②可在一定的温度和缓冲范围内进行生理条件或接近生理条件的实验; ③与外界特定干预相结合,研究动态系统中机体化学交换、运动等代谢产物的变化规律; ④实验方法灵活多样。但仪器价格及维护费用昂贵限制了该技术的进一步普及。 质谱技术是将离子化的原子、分子或是分子碎片按质量或是质荷比(m/e)大小顺序排列成图谱,并在此基础上,进行各种无机物、有机物的定性或定量分析。新的离子化技术则使质谱技术的灵敏度和准确度均有很大程度的提高。NMR技术与MS技术相比,各有其优缺点,需要在研究中灵活选用。总体而言,NMR技术应用的更为广泛。此外,根据代谢组学的研究需要,还常用于其他的一些分析技术,如气相色谱(GC) ,高效液相色谱仪(HPLC) ,高效毛细管电泳(HPCE)等。它们往往与NMR或MS技术联用,进一步增加其灵敏性。但不容忽视的是,随着分析手段更新,敏感性及分辨率提高,“假阳性”的概率也就越大,可能是仪器技术方法固有的,亦或是数据分析过程中产生的。 后期代谢组学研究的后期需借助于生物信息学平台。它往往借助于一定的软件,联合多种数据分析技术,将多维、分散的数据进行总结、分类及判别分析,发现数据间的定性、定量关系,解读数据中蕴藏的生物学意义,阐述其与机体代谢的关系。如果说分析技术在我们面前打开了“一扇门”,正确的数据分析方法和模型建立便是“找到宝藏”的钥匙。 主成分分析法( PCA) 是最常用的分析方法。其将分散于一组变量上的信息集中于几个综合指标(PC)上,如糖代谢、脂质代谢、氨基酸代谢等,利用主成分描述机体代谢的变化情况,发挥了降维分析的作用,避免淹没于大量数据中。其他的模式识别技术,如聚类分析、辨别式功能分析、最小二乘法投影法等在代谢组学研究中亦有其重要的地位。 现实情况下,代谢组学的数据更为复杂,特别是NMR对病理生理过程的研究,将代谢物的表达谱与时间相联系,分析时更加困难,需要借助复杂的模型或是专家系统进行分析(在应用

代谢组学技术在烟草研究中的应用进展_王小莉

2016-02,37(1)中国烟草科学 Chinese Tobacco Science 89 代谢组学技术在烟草研究中的应用进展 王小莉,付博,赵铭钦*,贺凡,王鹏泽,刘鹏飞 (河南农业大学烟草学院,国家烟草栽培生理生化研究基地,郑州 450002) 摘要:简述了作为研究植物生理生化和基因功能新方法的代谢组学在烟草研究中的主要技术流程及其应用现状,归纳了不同生态环境和不同组织中烟草代谢物差异及产生原因,总结了生物和非生物胁迫及化学诱导处理等条件下的烟草生理生化变化及相关基因功能。最后提出了目前烟草代谢组学研究所面临的问题,并指出与其他组学整合应用是代谢组学在烟草研究领域的发展趋势。 关键词:烟草;代谢组学;胁迫;化学诱导;基因功能 中图分类号:S572.01 文章编号:1007-5119(2016)01-0089-08 DOI:10.13496/j.issn.1007-5119.2016.01.016 Research of Metabolomics in Tobacco WANG Xiaoli, FU Bo, ZHAO Mingqin*, HE Fan, WANG Pengze, LIU Pengfei (College of Tobacco Science, Henan Agricultural University, National Tobacco Physiology and Biochemistry Research Center, Zhengzhou 450002, China) Abstract: Metabolomics has been considered one of the most effective means of investigating physiological and biochemical processes and gene function of plants. Here we review the main process of metabolomics and its application status in tobacco research, the regulation mechanisms of physiological and biochemical reactions when tobacco responds to different environmental, biotic and abiotic stresses, chemically induced processes and genetic modifications. Finally, issues of critical significance to current tobacco metabolomics research are discussed and it is noted that integration with other omics is the trend of metabolomics research in tobacco. Keywords: tobacco; metabolomics; stress; chemical induction; gene function 代谢组学与基因组学、转录组学和蛋白质组学分别从不同层面研究生物体对环境或基因改变的响应,它们都是系统生物学的重要组成部分。植物代谢组学是21世纪初产生的一门新学科,主要通过研究植物的次生代谢物受环境或基因扰动前后差异来研究植物代谢网络和基因功能[1-2]。与微生物和动物相比,植物的独特性在于它拥有复杂的代谢途径,目前发现的次生代谢产物达20万种以上[3]。代谢物差异是植物对基因或环境改变的最终响应[4],因此,对代谢物进行全面解析,探索相关代谢网络和基因调控机制,是从分子层面深入认识植物生命活动规律的一个重要环节[5-7]。 烟草不仅是重要的经济作物,同时还是一种重要的模式植物,作为生物反应器在研究植物遗传、发育、防御反应和转基因等领域中具有重要意义[8-10]。烟草代谢物非常丰富,目前从烟叶中已鉴定出3000多种[11],且代谢物理化性质和含量差异较大,给烟草化学及代谢规律研究带来挑战。传统的烟草化学主要集中于研究某一类化学成分或某几种重要物质,如萜类[12]、生物碱类[13]、多酚类等[14],这很难全面地系统地阐述烟草代谢网络。随着系统生物学的发展,烟草越来越广泛地被用于基因组学、转录组学、蛋白质组学和代谢组学的研究中,例如采用系统生物学的方法找出 基金项目:中国烟草总公司浓香型特色优质烟叶开发(110201101001 TS-01);上海烟草集团责任有限公司“浓香型特色优质烟叶风格定位研究及样品检测”(szbcw201201150) 作者简介:王小莉(1983-),女,博士研究生,主要从事烟草生理生化研究。E-mail:xiaoliwang325@https://www.sodocs.net/doc/6215610756.html, *通信作者,E-mail:zhaomingqin@https://www.sodocs.net/doc/6215610756.html, 收稿日期:2015-09-09 修回日期:2015-11-19

代谢组学的发展与药物研究开发

专 论代谢组学的发展与药物研究开发X 刘昌孝 (天津药物研究院,天津药代动力学与药效动力学省部共建国家重点实验室,天津 300193) 摘 要 代谢组学是近年来新发展起来的一门组学,其主要研究体系有生物体液、生物组织及单个细胞的代谢组,利 用一些现代的分析技术,如N M R、L C-M S、G C-M S等,取得整个研究体系的多维数据后,利用模式识别和专家系统技术寻 找其中的系统生物学信息。本文从代谢组学的发展,代谢组学的研究范围和研究方法,以及在药物的作用机制和安全性评 价,疾病模型,特别是中药研究的应用等方面予以阐述。 关键词 代谢组学,药物研究开发,作用机制,安全性评价,中药现代研究,疾病诊断 中图分类号:R969 文献标识码:A 文章编号:1006-5687(2005)02-0001-06 Development of metabonomics and drug research and development Liu Chang xiao T ianjin K ey L abor ato ry of P harmaco kinetics and phar macodynamics,T ianjin I nstitute of Phar maceutical R esea rch,T ian-jin,300193 Abstract M etabo no mics is a new"-omics"science developed in r ecent year s.Its major r esearch objects co ver bio-fluid, bio-tissue and metabolome of sing le cell.M odern a nalyt ical techno lo gies such as N M R,L C-M S and G C-M S are used to obtain multi-dim ensio nal data fo r the w hole resear ch sy st em,then pat tern r eco gnit ion and ex pert sy stems are emplo yed to ext ract systemat ic bioinfo rmat ion.In this r eview,the development of met abo nomics,r esearch field,resear ch metho ds and applicatio ns fo r mechanism o f drug action,dr ug to xicity screening,clinical safety and disease diag no sis,specifically in tr aditio na l Chinese medicines ar e intr oduced. Key words M etabonomics,dr ug r esearch and development,m echanism o f dr ug action,dr ug to xicity,tr aditio nal Chinese medicine,disease diagnosis 1 代谢组学研究的形成和发展 基因组(g enome)是指某一生物的所有DNA;基因组学是一门研究生物的整个基因组的科学。转录物组(transcriptome)是指某一生物或细胞所有基因表达的RN A;转录物组学是一门对某一生物或细胞所有基因表达的RNA(如mRNA)进行全面分析的科学。蛋白质组(pro teom e)是指某一生物或细胞在各种不同环境条件下表达的所有蛋白质;蛋白质组学是一门对某一生物或细胞在各种不同环境条件下表达的所有蛋白质进行定性和定量分析的科学。转录组学和蛋白质组学是分别在基因的转录和转录后的蛋白质翻译与修饰两个水平上,研究基因的功能。代谢组学相对于其它组学而言还是一门较新的组学,不过已经显示了其在药物发现过程中的巨大潜力,它可以在药物发现过程的前期就能识别药物的毒性,避免了药物发现过程中的损耗。代谢组学研究有希望成为新药发现与研发过程的一个必需部分[1]。代谢组学作为一门新发展的技术,它是通过考察生物体系受刺激或扰动后(如将某个特定的基因变异或环境变化后)其代谢产物的变化或其随时间的变化,来研究生物体系的代谢途径的一种技术[2]。最初人们提出了代谢物组(m etabo lome)的概念,严格地说,代谢物组应该是指某一生物或细胞所有的代谢产物(m etabolite)。在实际工作中,由于分析手段的局限性,更多的人倾向于把代谢物组局限于某一生物或细胞中所有的低分子量代谢产物。与基因组学、转录组学和蛋白质组学相对应,即代谢物组学是一门对某一生物或细胞所有低分子量代谢产物进行定性和定量分析,以监测活细胞中化学变化的科学。 在人们逐步的研究过程中,提出了一些相关概念,如代谢物靶目标分析(m etabo lite target analysis),代谢轮廓(谱)分析(m etabolic profiling analy sis),代谢组学(metabo no mics)或代谢物组学(m etabo lomics), 1 X收稿日期:2005-04-01 作者简介:刘昌孝,男(1942-),中国工程院院士,研究员,教授,博士生导师,主要从事药理学和药物代谢动力学的研究。现任天津药代动力学与药效动力学部省共建国家实验室主任,国家医药管理局天津药代动力学与临床药理学研究室主任等职。承担国家重大研究项目25项,领导完成100余个新药的药代动力学研究,获得27项科技成果奖,在国内外发表论文200多篇,中英文版专著12部。

代谢组学分析系统技术指标

代谢组学分析系统 1.工作条件: 1.1 电压:220V(±10%)单相,50Hz(±1)。 1.2 环境温度:19-22o C 1.3 相对湿度:<70% * 2.设备用途和基本组成 2.1 仪器用途:所提供仪器为高分辨率,高灵敏度、高通量的分析系统,配以 专业的数据分析处理软件构成代谢组学专用分析系统,从而快速 寻找标记物。 2.2 仪器组成 2.2.1 仪器由超效液相色谱-四极杆/二级碰撞室/飞行时间质谱组成的系统,和 专用代谢组学分析软件以及代谢物分析软件构成,具有先进的中医药代 谢组学研究分析功能。 * 2.2.2 质谱主机要求配置同一厂家生产的液相色谱仪,具有良好的兼容性。 * 2.2.3 具备准确质量测定功能 准确质量测定的内标必须有独立于实测样品的通道进入离子源,内标不得 干扰实际样品的数据结果,并且质量准度<2ppm。 2.2.4 真空系统 要求完全被保护的多级真空系统,具有自动断电保护功能,采用分子涡轮 泵。离子源和质谱间有隔断阀。便于源清洗和日常维护。 * 2.2.5 碰撞室具有两级碰撞功能。分为以下部分: 捕获富集单元:具有离子传输富集、碰撞室两种功能 传输单元:具有离子传输、碰撞室两种功能 * 2.2.6 检测器 检测器由单个微通道板离子计数检测,可检测正负离子和采集MS和 MS/MS的数据, TDC转换速率>4.0 GHz。 * 2.2.7 数据采集和处理系统 工作站用于仪器控制和采集, 1024MB RAM, 200GB硬盘,DVD-ROM,

刻录光盘驱动器,1.44MB 3.5英寸软驱。 软件基于Windows XP 操作系统的应用软件包括集成化的仪器控制、数据处理等软件,代谢组学分析软件以及代谢物分析软件等。 3 仪器的详细技术指标 3.1 液相色谱仪 * 液相色谱仪必须是能够耐超高压(1000bar)的超高效液相色谱仪(UPLC)。3.1.1 可编程二元梯度泵。 溶剂数量:4 流速范围:0.010 - 2mL/min,步进0.001mL/min, 流速精度:< 0.075% RSD,流速准确度:±1%, 泵耐压:0 - 15000psi(1000bar) 梯度设定范围:0 - 100% *系统延迟体积:< 120uL 3.1.2 二极管阵列检测器 波长范围:190-700nm. *测量范围:0.0001~4.0000AUFS *采样速率:40点/秒 流通池:500nl低扩散 3.1.3 自动进样器系统 样品数量:96孔板、384孔板、24x4ml瓶、48x2ml瓶 进样范围:0.1- 50 μL, “针内针”样品探针。 温度范围:4-40摄氏度 3.1.4 在线脱气系统 真空脱气:六通道在线脱气机 3.1.5 柱加热系统 控温范围:室温+5---65摄氏度 3.1.6 专用色谱柱; * 1.7μ, 2.1 mm x 50 mm Column

代谢组学在植物研究领域中的应用

Botanical Research 植物学研究, 2016, 5(1), 26-33 Published Online January 2016 in Hans. https://www.sodocs.net/doc/6215610756.html,/journal/br https://www.sodocs.net/doc/6215610756.html,/10.12677/br.2016.51005 Application of Metabolomics in Plant Research Guixiao La1, Xi Hao1, Xiangyang Li1, Mingyi Ou2, Tiegang Yang1* 1Industrial Crops Research Institute, Henan Academy of Agricultural Sciences, Zhengzhou Henan 2China Tobacco Guizhou Industrial Co. Ltd., Guiyang Guizhou Received: Dec. 10th, 2015; accepted: Dec. 25th, 2015; published: Dec. 30th, 2015 Copyright ? 2016 by authors and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY). https://www.sodocs.net/doc/6215610756.html,/licenses/by/4.0/ Abstract Metabolomics is an emerging omics technology after genomics and proteomics, which can qualify and quantify all small molecular weight metabolites in an organism or cells in a short time. With the technology development of gas chromatography-mass spectrometer (GC-MS), liquid chroma-tography-mass spectrometer (LC-MS) and capillary electrophoresis-mass spectrometry (CE-MS), and the improvement of data process method and presented huge advantages, plant metabolomics has been used in multiple research fields such as functional genomics, metabolism pathway, crop improvement... In this paper, we reviewed the recent progress in plant metabolomics and the put-ative problem in this research field. Moreover, the application prospects of the plant metabolom-ics were also forecasted. Keywords Metabolomics, Plant, Advance, Prospect 代谢组学在植物研究领域中的应用 腊贵晓1,郝西1,理向阳1,欧明毅2,杨铁钢1? 1河南省农业科学院经济作物研究所,河南郑州 2贵州中烟工业有限责任公司,贵州贵阳 *通讯作者。

代谢组学综述

代谢组学综述 摘要:代谢组学是20世纪90年代中期发展起来的对某一生物或细胞所有低相对分子质量代谢产物进行定性和定量分析的一门新学科,由于其广泛的应用前景,目前已成为系统生物学的重要组成部分。现简要介绍了代谢组学的含义、代谢组学研究的历史沿革、当前代谢组学研究中的分析技术、数据解析方法,综述了代谢组学在药物毒理学研究、疾病诊断、植物和中药等领域的应用情况,并对当前代谢组学研究中存在的问题及发展趋势进行探讨。 关键词:代谢组学研究技术 随着人类基因组计划等重大科学项目的实施,基因组学、转录组学及蛋白质组学在研究人类生命科学的过程中发挥了重要的作用, 与此同时, 代谢组学(metabolomics)在20世纪90年代中期产生并迅速地发展起来, 与基因组学、转录组学、蛋白质组学共同组成系统生物学。基因组学、转录组学、蛋白质组学和代谢组学等各种组学0在生命科学领域中发挥了重要的作用, 它们分别从调控生命过程的不同层面进行研究, 使人们能够从分子水平研究生命现象, 探讨生命的本质, 逐步系统地认识生命发展的规律。这些组学手段加上生物信息学, 成为系统生物学的重要组成部分。 代谢组学的出现和发展是必要的, 同时也是必须的。对于基因组学和蛋白质组学在生命科学研究中的缺点和不足, 代谢组学正好可以进行弥补。代谢组学研究的是生命个体对外源性物质(药物或毒物)的刺激、环境变化或遗传修饰所做出的所有代谢应答, 并且检测这种应答的全貌及其动态变化。代谢组学方法为生命科学的发展提供了有力的现代化实验技术手段, 同时也为新药临床前安全性评价与实践提供了新的技术支持与保障。 1 代谢组学的概念及发展 代谢组学最初是由英国帝国理工大学Jeremy N icholson教授提出的, 他认为代谢组学是将人体作为一个完整的系统, 机体的生理病理过程作为一个动态的系统来研究, 并且将代谢组学定义为生物体对病理生理或基因修饰等刺激产生的代谢物质动态应答的定量测定。2000年, 德国马普所的Fiehn等提出了代谢组学的概念, 但是与N icholson提出的代谢组学不同, 他是将代谢组学定位为一个静态的过程, 也可以称为/代谢物组学, 即对限定条件下的特定生物样品中所有代

浅谈最常用的代谢组学分析方法

代谢组学是一门对某一生物或细胞所有低分子质量代谢产物(以相对分子质量<1000的有机和无机的代谢物为研究核心区)进行分析的新兴学科。生物样本通过NMR、GC-MS、LC-MS等高通量仪器分析检测后,能产生大量的数据,这些数据具有高维,少样本、高噪声等复杂特征,同时代谢物多且代谢物之间联系密切,因此从复杂的代谢组学数据中确定与所研究的现象有关的代谢物,筛选出候选生物标记物成为代谢物组学研究的热点和难点。 代谢组学分析数据用于统计分析时,数据集通常为一个N ×K 的矩阵(X矩阵),N表示N个样本数,每一行代表一个样品,K表示K个变量,每一列代表一个变量,在代谢组学中变量通常是指代谢物含量。常用的分析方法如图1所示: 数据分析方法 单变量分析 多变量分析差异倍数分析 显著性检验 无监督分析 有监督分析 PLS-DA PCA OPLS-DA 图1 代谢组学常用的数据分析方法 单变量分析 单变量分析方法仅分别分析单个变量,不考虑多个变量的相互作用与内在联系。具有简单性、易应用性和可解释性。但是无法基于整

体数据对所测样品的优劣、差异进行综合评价和分析。 (1)差异倍数分析 差异倍数变化大小(Fold Change,FC)表示实验组与对照组的含量比值,可以快速考察各个代谢物在不同组别之间的含量变化大小。(2)显著性检验 p值即概率,反映某一事件发生的可能性大小,用于区分该变量是否具有统计显著性,通常认为p<0.05具有统计显著性。常用的检验方法有t-test、方差分析(Analysis of Variance,ANOVA),但是由于代谢组学的变量较多,必要时需要进行多重假设检验,对p值进行校正,减少Ⅰ类错误,降低假阳性。 多变量分析 多变量分析方法能同时处理数百或数千个变量,并且能处理变量之间的相互关系。利用变量之间的协方差或相关性,使原始数据在较低维空间上的投影能尽可能地捕获数据中的信息。但是如果存在大量无信息变量可能会妨碍多变量分析的能力,无信息变量的数量越多,减少真阳性数量的效果就越显著。 多变量分析分为无监督分析方法和有监督分析方法。在代谢组学分析中无监督学习有主成分分析(Principal Component Analysis,PCA),只需要数据集X,而有监督分析方法主要是偏小二乘判别分析(Partial Least Squares Discrimination Analysis, PLS-DA)和正交偏小二乘判别分析(Orthogonal Partial Least Squares

植物代谢组学的研究方法及其应用

植物代谢组学的研究方法及其应用 近年来,随着生命科学研究的发展,尤其是在完成拟南芥(Arabidopsis thaliana) 和水稻(Oryza sativa) 等植物的基因组测序后,植物生物学发生了翻天覆地的变化。人们已经把目光从基因的测序转移到了基因的功能研究。在研究DNA 的基因组学、mRNA 的转录组学及蛋白质的蛋白组学后,接踵而来的是研究代谢物的代谢组学(Hall et al.,2002)。代谢组学的概念来源于代谢组,代谢组是指某一生物或细胞在一特定生理时期内所有的低分子量代谢产物,代谢组学则是对某一生物或细胞在一特定生理时期内所有低分子量代谢产物同时进行定性和定量分析的一门新学科(Goodacre,2004)。它是以组群指标分析为基础,以高通量检测和数据处理为手段,以信息建模与系统整合为目标的系统生物学的一个分支。 代谢物是细胞调控过程的终产物,它们的种类和数量变化被视为生物系统对基因或环境变化的最终响应(Fiehn,2002)。植物内源代谢物对植物的生长发育有重要作用(Pichersky and Gang,2000)。植物中代谢物超过20万种,有维持植物生命活动和生长发育所必需的初生代谢物;还有利用初生代谢物生成的与植物抗病和抗逆关系密切的次生代谢物,所以对植物代谢物进行分析是十分必要的。 但是,由于植物代谢物在时间和空间都具有高度的动态性(stitt and Fernie,2003)。尤其是次生代谢物种类繁多、结构迥异,且产生和分布通常有种属、器官、组织以及生长发育时期的特异性,难于进行分离分析,所以人们一直在寻找更为强大的检测分析工具。在代谢物分析领域,人们已经提出了目标分析、代谢产物指纹分析、代谢产物轮廓分析和代谢表型分析、代谢组学分析等概念。20世纪90年代初,Sauter 等(1991)首先将代谢组分析引入植物系统诊断,此后关于植物代谢组学的研究逐年增多。随着拟南芥等植物的基因组测序完成以及代谢物分析手段的改进和提高,今后几年进入此研究领域的科学家和研究机构将越来越多。 1研究方法 代谢组学分析流程包括样品制备、代谢物成分分析鉴定和数据分析与解释。由于植物中代谢物的种类繁多,而目前可用的成分检测和数据分析方法又多种多样,所以根据研究对象不同,采用的样品制备、分离鉴定手段及数据分析方法各不相同。 1.1样品制备 植物代谢物样品制备分为组织取样、匀浆、抽提、保存和样品预处理等步骤(Weckwerth and Fiehn,2002)。代谢产物通常用水或有机溶剂(如甲醇和己烷等)分别提取,获得水提取物和有机溶剂提取物,从而把非极性的亲脂相和极性相分开。分析之前,通常先用固相微萃取、固相萃取和亲和色谱等方法进行预处理(邱德有和黄璐琦,2004)。然而植物代谢物千差万别,其中很多物质稍受干扰结构就会发生改变,且对其分析鉴定所采用的设备也不同。目前还没有适合所有代谢物的抽提方法,通常只能根据所要分析的代谢物特性及使用的鉴定手段选择合适的提取方法。而抽提时间、温度、溶剂成分和质量及实验者的技巧等诸多因素也将影响样品制备的水平。 1.2成分分析鉴定

代谢组学的定义(1)

代谢组学的定义 代谢组学(metabolomics/metabonomics)[1, 2]是上世纪90 年代中期发展起来的一门新学科,它是研究生物体系受外部刺激所产生的所有代谢产物变化的科学,所关注的是代谢循环中分子量小于1000 的小分子代谢物的变化,反映的是外界刺激或遗传修饰的细胞或组织的代谢应答变化。代谢组学的概念来源于最初人们提出的“代谢物组”(metabolome),即指某一生物或细胞所有代谢产物,后来发展为代谢组学的概念。其最主要的特征是通过高通量的实验和大规模的计算,从系统生物学的角度出发,全面地综合地考察机体的代谢变化。作为一种崭新的方法学,代谢组学已成为国际上疾病与健康研究的一个重要热点。 Nicholson 研究小组于1999 年提出了metabonomics 的概念[1],并在疾病诊断、药物筛选等方面做了大量的卓有成效的工作[3, 4]。Fiehn 等[5]提出了metabolomics 的概念,第一次把代谢产物和生物基因的功能联系起来。之后很多植物化学家开展植物代谢组学的研究,使代谢组学得到了极大的发展,形成了当前代谢组学的两大主流领域:metabolomics 和metabonomics。前者是对生物系统整体的、动态的认识(不仅关心代谢物质的整体也关注其动态变化规律),而后者强调分析且是个静态的认识概念,因此可以认为metabolomics 是metabonomics 的一个组成部分。代谢组学经过不断的发展,一些相关层次的定义已被学术界广泛接受。第一个层次为靶标分析,目标是定量分析一个靶蛋白的底物和/或产物;第二个层次为代谢轮廓分析,采用针对性的分析技术,对特定代谢过程中的结构或性质相关的预设代谢物系列进行定量测定;第三个层次为代谢指纹,定性或半定量分析细胞内外全部代谢物;第四个层次为代谢组分析,定量分析一个生物系统全部代谢物,其目前还难以实现。 目前,代谢组学已在药物毒性和机理研究[6-7]、微生物和植物研究[8,9]、疾病诊断和动物模型[10, 11]、基因功能的阐明[12]等领域获得了较广泛的应用,在中药成分的安全性评估[13]、药物代谢分析[14]、毒性基因组学[15]、营养基因组[16]、药理代谢组学[17-19]、整合药物代谢和系统毒理学[20, 21]等方面也取得了新的突破和进展代谢组学的具体研究方法是:运用核磁共振(NMR)、质谱(MS)、气质联用(GC-MS)、高效液相色谱(HPLC)等高通量、高灵敏度与高精确度的现代分析技术,通过对细胞提取物、组织提取物、生物体液(血浆、血清、尿液、胆汁、脑脊液等)和完整的脏器组织等随时间变化的代谢物浓度进行检测,结合有效的模式识别方法进行定性、定量和分类,并将这些代谢信息与生理病理过程中的生物学事件关联起来,从而了解机体生命活动的代谢过程[22]。 基于核磁共振的代谢组学 作为众多化学分析方法中的一种,NMR 在代谢组学的研究中起着非常重要的作用。首先,NMR 分析生物体液或活体组织等复杂样品时,预处理过程简单,测试手段丰富,包括液体高分辨NMR、高分辨魔角旋转(HRMAS) NMR 和活体磁共振定域谱(MRS),因此能够在最接近生理状态的条件下对不同类型的样品进行检测。其次,NMR 是一种无创性的多参数动态分析技术,同时具有定性分析和定量分析的能力;NMR 谱本身携带有丰富的分子结构和动力学信息,通过扫描生物样品可以得到其所有含NMR 可观测核的、且含量在NMR 检测限上的代谢物的特征NMR 谱。再次,NMR 检测可以在很短的时间内完成(一般5 ~ 10 分钟),这对于实现高通量样品检测,并保证样品在检测期内维持原有生化性质至关重要。此外,低温探头、自动进样技术的出现和日趋完善,也使检测灵敏度和速度不断提高。最

代谢组学数据处理方法_主成分分析

◇专论◇ 中国临床药理学与治疗学 中国药理学会主办 CN 3421206/R ,ISSN 100922501 E 2mail :ccpt96@https://www.sodocs.net/doc/6215610756.html, 2010May ;15(5):481-489 2010203211收稿 2010204224修回E 2mail :ajiye333@hot https://www.sodocs.net/doc/6215610756.html, 代谢组学数据处理方法———主成分分析 阿基业 中国药科大学药代动力学重点实验室&代谢组学研究室,南京210009,江苏 摘要 代谢组学在生命科学领域得到了越来越 广泛的应用并展现出良好的前景。代谢组学分析产生的含有大量变量的数据难以用常规方法进行分析,如何正确分析和解释代谢组学的数据是研究的关键。本文主要介绍了在代谢组学数据分析中占主导地位的主成分分析基本方法,旨在加强代谢组学数据分析的基础知识并规范数据分析的方法。关键词 代谢组学;主成分分析;偏最小二乘投影关联分析;偏最小二乘投影判别分析;正交偏最小二乘投影分析 中图分类号:R969.1文献标识码:A 文章编号:100922501(2010)0520481209代谢组学(metabolomics 或metabonomics )是“后基因组学”时期新兴的一门学科,“代谢组学”一词虽然常以“metabonomics ”或“metabolo 2mics ”出现,但多数学者通常并不对其加以严格区分,绝大多数情况下这两个词被认为包含了等同的意义。根据研究的内容、目的、偏重点和对代谢 组学的认识不同,代谢组学被赋予了不同的英文 名称,如代谢物分析(metabolite p rofiling )、代谢谱分析(metabolic profiling )、代谢指纹谱分析(metabolic fingerp rinting )等;根据分析的目标化合物不同,还可以分为目标化合物分析(targeting analysis )和(无设定目标的)全谱分析(non -tar 2geting analysis )。无论采用了哪种名称和说法,代谢组学的研究对象都是体内“代谢组” (metabo 2lome ,即生物样本、系统、组织或细胞中小分子化合物的总称)。不管采用哪种测定方法,应用代谢 组学技术都可以测定到许多内源性化合物的定性/定量信息。这些信息在输出的谱图上表现为许多信号峰,在色谱质谱图上表现为不同保留时间出现色谱峰,在核磁共振谱图上表现为不同化学位移处的色谱信号。每个信号峰都既包含了检测分子的定性/结构信息,也包含了定量信息。以气相色谱-质谱检测为例,样品中的分子经过数十米长的石英毛细管色谱柱色谱分离后在色谱图上的不同时间出现,输出的总离子流图上的每个色谱峰都包含该物质定性信息(质谱图)和定量信息(峰高或峰面积),图1。对于特定化合物来说,其定性信息就是该化合物的特征谱图和色谱保留时间,是化合物鉴定的基础;其定量信息就是该化合物的色谱响应强度,如峰高、峰面积,是定量比较不同样品或组别之间差异的基础 。 中国药科大学药物代谢动力学重点实验室&代谢组学研究室副研究员, 主要从事药物代谢动力学、代谢组学、代谢性疾病发病机制、与代谢相关的药效或药物毒性的分子机制等方向的研究。 ? 184?

相关主题