搜档网
当前位置:搜档网 › 利用串联质谱鉴定氨基酸突变的生物信息学算法_余庆

利用串联质谱鉴定氨基酸突变的生物信息学算法_余庆

利用串联质谱鉴定氨基酸突变的生物信息学算法_余庆
利用串联质谱鉴定氨基酸突变的生物信息学算法_余庆

中国科学: 生命科学

2014年 第44卷 第11期: 1113 ~ 1124

SCIENTIA SINICA Vitae

https://www.sodocs.net/doc/167367514.html, https://www.sodocs.net/doc/167367514.html,

引用格式: 余庆, 吴松锋, 马洁, 等. 利用串联质谱鉴定氨基酸突变的生物信息学算法. 中国科学: 生命科学, 2014, 44: 1113–1124

Yu Q, Wu S F, Ma J, et al. Bioinformatics algorithms for identification of amino acid mutations in tandem mass spectrometry. SCIENTIA SINICA Vitae, 2014, 44: 1113–1124, doi: 10.1360/N052014-00099

《中国科学》杂志社

SCIENCE CHINA PRESS

评 述

利用串联质谱鉴定氨基酸突变的生物信息学算法

余庆

①②

, 吴松锋

②③

, 马洁

②③

, 朱云平

②③*

, 舒坤贤①

*

① 重庆邮电大学生物信息学研究所, 重庆 400065;

② 北京蛋白质组研究中心, 蛋白质组学国家重点实验室, 北京 102206; ③ 中国人民解放军军事医学科学院放射与辐射医学研究所, 北京 100850 * 联系人, E-mail: zhuyunping@https://www.sodocs.net/doc/167367514.html,; shukx@https://www.sodocs.net/doc/167367514.html,

收稿日期: 2014-03-05; 接受日期: 2014-04-22; 网络版发表日期: 2014-09-17

国家自然科学基金(批准号: 21105121, 21275160)、国家高技术研究发展计划(批准号: 2012AA020409, 2012AA020201)和北京市自然科学基金(批准号: 5122013)资助项目 doi: 10.1360/N052014-00099

摘要 氨基酸突变能够改变蛋白的结构和功能, 影响生物体的生命过程. 基于串联质谱的鸟枪法蛋白质组学是目前大规模研究蛋白质组学的主要方法, 但是现有的质谱数据鉴定流程为了提高鉴定结果的灵敏度往往会有意压缩数据库中的氨基酸突变信息. 因此, 如何挖掘数据中的氨基酸突变信息成为当前质谱数据鉴定的一个重要部分. 当前应用于氨基酸突变鉴定的串联质谱鉴定方法大致可以分为3大类: 基于序列数据库搜索的方法、基于序列标签搜索的算法以及基于图谱库搜索的算法. 本文首先详细介绍了这3种氨基酸突变鉴定算法, 并分析了各种方法的特点和不足, 然后介绍了氨基酸突变鉴定的研究现状和发展方向. 随着基于串联质谱的蛋白质组学的不断发展, 蛋白序列中的氨基酸突变信息将被更好地解析出来, 从而得以深入探讨由氨基酸突变引起的蛋白结构和功能改变, 为揭示氨基酸突变的生物学意义奠定基础.

关键词 氨基酸突变 串联质谱

鸟枪法蛋白质组学 氨基酸突变鉴定

单核苷酸变异(single nucleotide variations, SNVs)是由DNA 序列上单个碱基变异产生的, 包括碱基的缺失、插入、转换及颠换等. SNVs 是基因组序列变异的主要形式[1], 同时也是生物体生理和病理变异的遗传基础[2]. 从遗传学的角度看, SNVs 既可以存在于具有遗传性的生殖细胞中, 也可以存在于不具有遗传性的体细胞中. 其中, 只有位于基因编码区的SNVs 能够影响蛋白的编码. 位于编码区的SNVs 可以分为3类: (ⅰ) 同义SNVs, 不改变相应的氨基酸种类; (ⅱ) 无义SNVs, 突变成为终止密码子, 提早

结束编码; (ⅲ) 非同义SNVs(nonsynonymous SNVs, nsSNVs), 改变氨基酸的种类. nsSNVs 能够改变蛋白的结构、功能、表达以及亚细胞定位等[3], 进而对多种遗传性的特征、疾病以及癌症等产生影响[4~9], 如人类耳垢的类型[6]、腋窝的气味[7]、癌症与肿瘤的发生[8]、阿尔茨海默病[9]以及镰刀形红细胞贫血症[10]等. 因此, 对SNVs 展开研究可以揭示出基因与表型多样性和基因与疾病间的关系, 并且有可能研发出治疗疾病的新方法. 目前, 全基因组关联研究(genome- wide association studies, GWAS)[11]虽然在基因变异与

余庆等: 利用串联质谱鉴定氨基酸突变的生物信息学算法

1114

表型多样性的研究中产出了许多能够用来解释特 异性疾病分子途径的结果, 但是仍然难以对绝大部分具有复杂特征的分子机制以及SNVs 与复杂疾病表型间的关系进行解释[12]. 在这种情况下, 对突变蛋 白的研究提供了另一种了解基因型与表型间关联的方法[13].

由SNVs 引起的单个氨基酸的变异称为单氨基酸变异(single amino acid variations, SAVs), 因此SAVs 是SNVs 在蛋白水平上的表现. 对SAVs 的研究, 有助于了解基因型与表型间的关系, 进而从本质上了解基因是怎样在蛋白水平上影响生物体的生命过程的[14]. 目前, 基于串联质谱的鸟枪法蛋白质组学(shotgun proteomics)技术由于其自动化、高通量、高灵敏度和高分辨率等特点, 已成为大规模蛋白质研究的主要方法. 序列数据库搜索算法由于具有较高的可靠性以及灵敏度而成为当今鸟枪法蛋白质组学中蛋白鉴定的主要生物信息学方法. 然而, 通常蛋白质数据库在构建时为了减小数据库的冗余程度, 往往有意压缩对SAVs 信息的收录(如Swiss-Prot 数据 库[15,16], IPI 数据库[17]等), 从而使得常用的数据库搜索策略不能有效地鉴定出样本中的氨基酸突变信息. 为此, 研究人员提出了一系列鉴定突变蛋白的方法, 如构建包含有突变信息的蛋白质数据库、构建相似性图谱库等.

在基于串联质谱进行SAVs 鉴定时, 可以采用与蛋白质翻译后修饰(post-translational modifications, PTMs)鉴定[18]相同的方法, 这是因为肽段的突变和修饰在质谱图中的表现都是质量迁移, 如甲硫氨酸(Met)氧化与丙氨酸(Ala)突变为丝氨酸(Ser)在质量上都是增加16 Da [19], 所以鉴定PTMs 的算法和流程通常也能够鉴定SAVs(如Bonanza 算法[20]). 虽然PTMs 和SAVs 的质谱鉴定方法非常相似, 但由于其来源上的差别, 在实际的鉴定策略中有所不同. (ⅰ) PTMs 的种类远比SAVs 要多, 鉴定PTMs 所需的搜索空间一般会比鉴定SAVs 所需的大, 在质量控制方面具有更大的挑战; (ⅱ) 蛋白水平的SAVs 大部分是从基因组或转录组延续过来的, 充分利用SNVs 的数据能大大降低搜索空间, 从而得到更可靠的结果. 因此在计算方法与策略方面, SAVs 和PTMs 的鉴定具有一定的相似性, 也有其独有的特点.

本文从序列数据库搜索算法、序列标签搜索算法以及图谱库搜索算法3个大方面, 详细地介绍了目前

基于生物质谱数据鉴定SAVs 的各种生物信息学方法, 并分析了各种突变鉴定方法的不足之处, 最后介绍了基于生物质谱的SAVs 鉴定研究现状及其发展 方向.

1 氨基酸突变鉴定的算法

当前基于生物质谱的SAVs 鉴定算法都是由常规鉴定算法改进而来的, 因此根据常规串联质谱鉴定算法中对数据库的依赖程度以及使用的数据库种类, 可以将基于生物质谱的SAVs 鉴定算法分为3大类(表1): (ⅰ) 完全依赖序列数据库的搜索算法, 即基于序列数据库搜索的氨基酸突变鉴定算法. 此算法利用前体离子质量从序列数据库中筛选出候选肽段, 然后将候选肽段的理论图谱与目标图谱进行比对, 从而鉴定出样品中的突变肽段; (ⅱ) 将从头测序算法(de novo )与序列比对结合的算法, 即基于序列标签的氨基酸突变鉴定算法. 此算法首先通过de novo 测序算法推导出目标图谱中的肽序列标签(peptide sequence tags, PSTs), 然后利用PSTs 过滤数据库筛选出候选肽段, 最后结合PSTs 对理论谱图与目标图谱进行比较打分, 从而鉴定出样品中的突变肽段; (ⅲ) 依赖于图谱库的搜索算法, 即基于图谱库的氨基酸突变鉴定算法. 此算法将实验图谱与图谱库中的一致性图谱进行比对, 从而鉴定出样品中的突变肽段. 这3类方法和策略在实施过程中各有其优劣(表1), 相互之间暂无法替代, 因此在不同的目的下各有其适用性.

1.1 基于序列数据库搜索的氨基酸突变鉴定算法

基于序列数据库搜索的氨基酸突变鉴定算法, 根据不同的数据库构建方法可以细分为3类: (ⅰ) 基于穷举法的氨基酸突变鉴定算法, 即通过枚举数据库中氨基酸残基的所有可能突变种类进行突变肽段的鉴定; (ⅱ) 结合已知氨基酸突变信息对突变肽段进行鉴定, 即结合当前变异数据库(如dbSNP 数据 库[21]、

COSMIC 数据库[22]等, 表2列举了常用的氨基酸与基因突变数据库)中的变异信息构建数据库进行突变肽段的鉴定; (ⅲ) 基于样本特异性的数据库鉴定突变肽段, 即结合样本数据中可能存在的突变肽段信息构建数据库进行突变肽段的鉴定. 以下将对这3种方式进行逐一详细地说明.

中国科学: 生命科学 2014年 第44卷 第11期

1115

表1 氨基酸突变鉴定的算法

类别

优点

不足

基于序列数据库搜索的氨基酸突变鉴定算法 现有的蛋白突变序列信息相对比较丰富, 覆盖度比较广; 理

论上能够鉴定到所有可能的突变肽段

依赖于数据库所包含的信息; 搜索空间较大、

灵敏度较低

基于序列标签的氨基酸

突变鉴定算法 能够有效地过滤数据库, 降低搜索空间; 具有较强的处理能

力和用于突变肽段鉴定的潜能 依赖de novo 算法以及过滤算法 基于图谱库的氨基酸突

变鉴定算法

利用图谱的真实信息; 有较高的灵敏度

图谱库的覆盖范围小; 图谱搜索引擎对图谱的

解析度较低

表2 常用氨基酸及基因突变数据库

数据库 数据库简介 网址 参考文献

COSMIC 收录和展示体细胞突变的信息和相关细节, 以及与人类癌症有关的信息

https://www.sodocs.net/doc/167367514.html,/cancergenome/projects/cosmic/ [22]

OMIM 收录遗传疾病、表型与人类基因, 主要关注

遗传变异与表型间的关系

https://www.sodocs.net/doc/167367514.html,/omim/ [23] MS-CanProVar

收录各个数据库中有关癌症的蛋白变异数

据和dbSNP 数据库中的编码SNVs

https://www.sodocs.net/doc/167367514.html,/canprovar/ [24] HPMD 收录各个大型数据库中的蛋白突变信息

https://www.sodocs.net/doc/167367514.html,/HPMD [25] HGMD 收集已知的与人类遗传疾病有关的基因变

异信息

https://www.sodocs.net/doc/167367514.html,/ac/index.php [26] dbSNP

收录各种变异基因的信息

https://www.sodocs.net/doc/167367514.html,/snp/ [21]

(1) 基于穷举法的氨基酸突变鉴定算法. 在序

列数据库搜索中, 最早对突变肽段进行鉴定的自动化方法是穷举法, 此方法不仅原理简单而且理论上能够鉴定出样品中所有可能的突变肽段. 这类算法的大体步骤是: 通过穷举法罗列出所有可能的突变肽段序列, 然后用常规鉴定方法进行比对打分筛选出最有可能的突变肽段序列. 此类算法的代表有SEQUEST-SNP 算法[27]和Sipros v2.0算法[18]等. Gatlin 等人[27]在2000年, 利用改进的SEQUEST 算法(SEQUEST-SNP)率先实现了利用自动化的数据库搜索对突变肽段进行鉴定. 此方法特点在于动态生成所有可能的核苷酸突变序列, 将其翻译成肽段并构建成一个数据库用于对突变肽段的鉴定. 此后, 通过穷举蛋白序列中所有可能的氨基酸突变进行肽段突变鉴定的方法在Mascot [28]和X!Tandem [29]相继采用. 2012年, Hyatt 和Pan [18]提出了不受数据库约束的穷举法突变肽段鉴定算法Sipros v2.0, 此算法通过肽段产生模块和肽段打分模块实现对CPU 和内存效率的优化以应对穷举法产生的大数据库. 理论上, 穷举法能够鉴定出样品中所有的突变肽段, 但肽段中的每一个氨基酸残基都有18种可能的突变, 因此利用此方法会大大增加搜索空间[18,24], 延长搜索时间, 并且会增加假阳性风险从而降低结果的灵敏度.

(2) 结合已知氨基酸突变信息对突变氨基酸进

行鉴定. 为了避免穷举法引起搜索空间过大的问题, 一些团队提出结合已知的编码SNVs 信息或是与疾病等有关的突变信息构建蛋白质数据库, 以减小突变肽段的搜索范围. 此类数据库的代表有MSIPI [17]和MS-CanProVar [24]等. 2007年, Schandorff 等人[17]将一些来自dbSNP 数据库[21]的编码SNP(single nucleotide polymorphism)以及与IPI(the international protein index)数据库中数据有冲突的序列等整合到IPI 数据库[30]中构建了质谱友好型的变异数据库MSIPI. 其质谱友好型体现在, 在保留原始IPI 条目完整性的基础上, 将后加的肽段序列附加到原有序列中, 用不代表任何氨基酸的字母“J”将原始条目与附加肽段区分开来, 并且将在原始条目的表头信息中加入附加肽段信息. 同年, Bunger 等人[31]也利用dbSNP 数据库中人类基因变异信息构建变异蛋白质数据库K-SNPdb, 并构建相应的常规数据库. 然后对分开搜库结果进行比对打分, 筛选出高可信的变异肽段. Li 等人[24]在2011年基于人类癌症蛋白质变异数据库CanProVar [32]构建了一个MS-CanProVar 数据库, 此数据库中不仅包含了dbSNP 数据库中的编码的SNP 信息, 还包括了COSMIC [22]和OMIM [23]等数据库中与癌症相关的体细胞变异信息.

除了自定义构建突变数据库以外, 氨基酸突变信息也被一些在线平台收录、整合, 如Swiss-Var [33],

余庆等: 利用串联质谱鉴定氨基酸突变的生物信息学算法

1116

SysPIMP [34]和RAId_DbS [35]等. Swiss-Var 网站搜集的是Swiss-Prot 数据库[36]中突变肽段的信息, 主要为用户提供Swiss-Prot 数据库中的突变肽段信息及其与疾病间的关系. SysPIMP 主要用于鉴定与人类疾病有关的突变肽段序列, 它的数据主要来源于OMIM 数据库中等位基因突变信息、蛋白质突变数据库(protein mutation database, PMD)[37]以及Swiss-Prot 数据库中与人类疾病和多态性有关的序列信息. 而在RAId_DbS 数据库中不仅整合了SAVs 与疾病的信息, 同时也收录了PTMs 与疾病有关的信息.

2012年, Mathivanan 等人[25]提出的iMASp 策略即是利用现有的突变信息对突变肽段进行鉴定. 这种策略利用了分步搜索的方法, 即是第一次通过常规搜索鉴定出样本中的常规蛋白, 第二次利用突变数据库对第一次没有鉴定出的质谱图进行搜索鉴定样品中的突变肽段. 相比穷举法, 结合已知氨基酸突变信息对突变氨基酸进行鉴定的方法虽然在一定程度上缩小了搜索空间, 但在数据库中添加的上万条突变肽段序列绝大部分不会在样品数据集中出现. 因此, 这种方法并没有十分有效地规避假阳性升高以及鉴定结果灵敏性降低的缺点[14].

(3) 基于样本特异性的数据库鉴定突变肽段. 除了直接利用公共数据库中的突变数据外, 利用DNA/RNA 等信息提供的样本特异性突变构建的数据库能更好地贴合实际样本数据, 提高鉴定效率. 目前利用样本特异性鉴定突变肽段的方法有2种: 两次搜索数据库的方法以及利用转录组数据构建数据库的方法. 两次搜索数据库的方法与iMASp 策略中所使用的分步搜索以及Mascot 和X!Tandem 中的容错搜索相似, 不同的地方在于两次搜索数据库中所使用的突变数据库依赖于样本特异性的DAN/RAN 信息, 而iMASp 策略中的突变数据库是整合所有已知的蛋白突变信息, 不具有样本特异性; Mascot 和X!Tandem 则是对第一次搜索所得的蛋白序列进行穷举从而鉴定出突变或修饰肽段. Chernobrovkin 等人[38]提出的二次迭代法以及Su 等人[39]构建样本特异性突变数据库的策略都是样本特异性的两次搜索方法的代表.

另一种方法是利用转录组数据构建样本特异性数据库用于突变肽段的鉴定. 相对于利用公共的突变数据库, 利用转录组数据构建蛋白质数据库可以由样品转录组数据直接推导样本中可能存在的蛋白

及其突变序列并由其构建数据库[40]. 用此方法构建的数据库所包含的蛋白质信息更加接近样品中真实信息, 因此这种无偏性的数据库能高效地鉴定出样品中存在的突变序列[16,41]. 由于转录组数据十分庞大, 在现有的计算能力下要想利用转录组数据构建数据库就必须要对转录组数据进行压缩. 2007年, Edwards [16]提出了一个压缩表达序列标签(expressed sequence tags, ESTs)数据的策略, 实现了利用EST 数据库进行常规化的肽段序列和变异位点的鉴定. 此压缩策略的特点在于选用某种方法来表示肽段, 确保绝大多数的重复肽段序列被消除, 并且不影响肽段序列的鉴定. 随着下一代测序(next generation sequencing, NGS)技术的出现, RNA 测序(RNA- sequecing, RNA-Seq)的成本越来越低[14], 并且克服了EST 测序存在的克隆偏性和高花费等缺点[42], 因此利用RNA-Seq 数据构建样本特异性数据库逐渐受到人们的重视. Wang 等人[41]在2012年提出了一个利用RNA-Seq 数据构建样本特异性数据库的策略, 此策略通过两步来实现: (ⅰ) 利用一个经验性的RPKM (reads per kilo bases per million reads)值排除不表达或低表达基因以减小数据库中的条目; (ⅱ) 将由RNA-Seq 数据鉴定得来的高可靠性SNVs 的相应肽段添加到数据库中, 以寻找变异肽段. 此后, Wang 和Zhang [43]为生成自定义RNA-Seq 数据库编写了R 程序包customProDB, 能够生成含有突变、插入、缺失等变异肽段的RNA-Seq 数据库. 2013年, Sheynkman 等人[14]实践了Wang 和Zhang [43]的方法, 利用Jurkat 细胞系的RNA-Seq 数据构建一个自定义的变异蛋白质数据库, 并成功地应用在Jurkat 细胞系的质谱数据突变鉴定中. 同年, Woo 等人[44]在尽量不影响鉴定结果灵敏性的基础上, 将秀丽隐杆线虫(Caenorhabditis elegans )的RNA-Seq 数据压缩了近1000倍, 并利用此数据库成功地鉴定到了新型蛋白. 由于并不是所有的样本都同时拥有蛋白质数据和RNA-Seq 数据, 因此, Wang 和Zhang [43]利用64个大肠癌的RNA-Seq 数据构建了一致性蛋白质数据库, 并成功地将此数据库应用在蛋白鉴定中. 样本特异性的数据库, 特别是利用RNA-Seq 数据构建的样本数据库不仅能够有效地缩减搜索空间, 而且能够鉴定出样品中所有已知类型的蛋白种类以及新型的变异肽段序列. 随着计算方法的不断改进, 通过RNA-Seq 数据对样本进行突变肽段的鉴定方法有望成为常规的突变鉴定方法.

中国科学: 生命科学 2014年 第44卷 第11期

1117

(4) 基于序列数据库搜索的氨基酸突变鉴定算法的缺点. 在鉴定突变肽段的方法中, 虽然通过构建含有突变信息的序列数据库鉴定突变肽段的方法是目前被最广泛采用的方法, 但它的缺点也是不容忽视的. (ⅰ) 除了利用穷举法构建的突变数据库以外, 利用其他方法构建的突变数据库对突变信息包含得都不够全面, 如公共数据库通常会有意忽略对变异数据的收录, 而样本特异性数据库为了减小搜索空间通常也会去除低表达的蛋白质; (ⅱ) 序列数据搜索中, 当图谱中的碎裂信息不够完整、信噪比较低时, 搜索引擎就不能将候选肽段正确地区分开[45], 因而会增加假阳性的概率. 为了避免序列数据库的上述缺点, 提出了其他鉴定突变肽段的方法, 如序列标签算法、图谱库搜索算法等.

1.2 基于序列标签的氨基酸突变鉴定算法 相比序列数据库搜索算法利用肽段母离子质量从数据库中筛选候选肽段, 序列标签算法利用de novo 测序算法推导的PSTs 能够更有效地过滤数据库, 减少候选肽段的数目以缩小搜索空间, 使得更复杂和计算更密集的方法能够应用到对候选肽段的突变打分算法中[45], 从而提高了突变鉴定结果的灵敏性并且减少了结果中的假阳性率. 下面从序列标签搜索算法与de novo 测序算法之间的关系以及当前结合PSTs 进行氨基酸突变鉴定的主流工具两个方面对序列标签算法鉴定突变氨基酸进行介绍.

(1) 序列标签搜索算法与de novo 测序算法. 相比序列数据库搜索算法, de novo 算法在对质谱图进行氨基酸序列推导时不依赖蛋白质数据库, 因此它在鉴定氨基酸突变方面有独特的优势[45~47]. 当前使用de novo 测序算法的代表性工具有SHERENGA [48], PEAKS [49~51]以及PepNovo [52]等. 这些工具所使用的算法都是通过生成前缀残基质量图谱(prefix residue mass spectra)重构整个图谱进行肽段序列推导的, 因此这些算法对质谱图的质量具有较高的要求[45]. 但

通过诱导碰撞解离(collision-induced dissociation, CID)产生的串联图谱中不可避免地含有不完整的碎裂离子系列、噪音离子和精度较差的碎裂离子质量, 这使得de novo 算法常常产生一些不确定的序列区域, 导致de novo 算法通常只能准确地推导出肽段序列中的部分序列[46]. 因此, 结合de novo 算法鉴定的部分肽段序列进行数据库搜索的序列标签算法应运而生, 这种算法不仅可以利用de novo 推导出的PSTs 作为筛选候选肽段时的过滤指标, 有效地减少搜索空间, 而且可以通过改变PSTs 与候选肽段匹配的打分算法, 提高对突变肽段的鉴定效率.

(2) 结合肽序列标签的氨基酸突变鉴定算法. 最早结合PSTs 进行数据库搜索的方法是由Mann 和Wilm [53]在1994年提出的, 此方法不仅能有效地对常规图谱进行鉴定, 而且能够鉴定出带有突变或修饰图谱的肽段序列. 当前结合肽序列标签对氨基酸突变进行鉴定的算法或程序有GutenTag 程序[54], Opensea 工具[55], SPIDER 程序[56,57], InsPecT 搜索引 擎[45], DirecTag 算法[58]以及MoDa 算法[59]等. 鉴定突变氨基酸常用的序列标签软件及其网址见表3.

GutenTag 是由Yates 实验室开发出来的能够自动推导+2电荷母离子串联图谱PSTs 用于数据库搜索的算法, 其特点是利用碎片离子峰强度经验模型并结合相邻氨基酸和碎片离子的相对质量对肽段碎裂的影响推导PSTs, 之后用多个PSTs 进行搜库, 同时放宽对PST 两端质量匹配的限制, 从而能够有效地进行突变肽段的鉴定. 但由于GutenTag 算法没有考虑同源突变或修饰, 所以此算法只能对数据库中已存在的突变序列进行鉴定, 并且由于在打分方面存在漏洞[55], 所以鉴定出来的结果中存在较高的假阳性.

在GutenTag 算法发表后的第2年, Searle 等人[55]

首次将序列标签算法的思想应用于非限制翻译后修饰, 并提出了基于质量的序列比对算法工具Opensea. Opensea 的特点是利用基于质量的宽度优先的算法(“breadth-first search” algorithm)鉴定出突变位点或修

表3 鉴定氨基酸突变常用的序列标签软件及其下载地址

软件名称 网址 参考文献

GutenTag https://www.sodocs.net/doc/167367514.html,/downloads.php [54] SPIDER https://www.sodocs.net/doc/167367514.html,/peaks/features/spider.html [56,57]

DirecTag+TagRecon+IDPicker https://www.sodocs.net/doc/167367514.html,./software.php [47,58,60]

InsPecT https://www.sodocs.net/doc/167367514.html,/Software.html [45]

余庆等: 利用串联质谱鉴定氨基酸突变的生物信息学算法

1118

饰位点. 但宽度优先的算法是一种贪婪的匹配算法, 并且在Opensea 中没有考虑在一个位点上同时存在de novo 的测序错误和同源突变的情况, 所以它不能保证最终结果的可靠性. SPIDER 方法与Opensea 工具有相似的序列标签算法思想, 但与Opensea 不同的是, 它能够在一个位置上同时考虑de novo 的测序错误和同源突变的情况, 并且利用动态规划算法进行比对打分. SPIDER 算法已被整合进PEAKS 软件中, 专门用来对突变肽段和跨物种的同源性肽段进行鉴定.

在GutenTag 算法推出后, Pevzner 实验室迅速推出了InsPecT 序列标签算法搜索引擎[45], 它是最早实现规模化鉴定翻译后修饰肽段的搜索工具, 现在仍然被广泛使用. InsPect 搜索引擎推导PSTs 的算法的特点在于利用改进的de novo 算法推导出PSTs 作为过滤器缩小候选肽段的范围, 并利用树状快速搜索方法(fast tree-based search)找出与PSTs 匹配的候选肽段, 用基于动态规划算法(dynamic programming)的图谱比对方法鉴定修饰肽段, 并在打分算法中考虑肽段的碎裂模式. 在推导PSTs 时, InsPecT 需要构建前缀残基质量图, 而DirecTag 算法则是直接利用串联图谱的质核比值和峰强度信息对可能的标签进行打分. 由于DirecTag 只能用来推导PSTs, 因此其团队后续开发了TagRecon 算法[47]并将DirecTag, TagRecon 和IDPicker 工具[60]整合成鉴定突变和修饰肽段的流程, 其大致过程为: (ⅰ) 利用DirecTag 生成PSTs; (ⅱ) TagRecon 利用PSTs 对常规数据库进行候选肽段过滤, 并且定位数据集中的突变或修饰肽段; (ⅲ) 利用IDPicker 工具对鉴定结果进行质量控制并且装配成蛋白. 此流程算法在2013年由Abraham 等人[19]在鉴定胡杨树(Populus )单氨基酸多态性的实验中被成功地使用.

目前序列标签算法都依赖于de novo 测序构建PSTs, 但是由de novo 算法测出的肽片段往往存在部分构建错误的序列[56]. MoDa 算法[59]在搜索候选肽段时, 由于采用序列标签链算法(tag chain algorithm)[61], 能有效地避免由de novo 测序引起的错误匹配. 在MoDa 算法中, 将序列标签算法和动态规划算法结合, 同时利用多条序列标签与候选肽段进行比对, 找出存在质量差的位点, 然后利用基于动态规划算法的图谱比对算法找出最佳的肽段序列. 此方法能够大规模地鉴定出存在多个修饰位点或突变位点的肽段.

(3) 基于序列标签的氨基酸突变鉴定算法面临的问题. 基于肽段序列标签的氨基酸突变序列鉴定算法虽然能够有效地利用PSTs 过滤数据库, 弥补de novo 测序算法的测序错误并且提高对突变或修饰肽段鉴定的效率和准确性, 但目前已有的PSTs 算法仍然存在着许多不足, 如在GutenTag 算法中没有考虑同源突变或修饰, 所以不能鉴定出数据库中不存在的突变序列, 而在Opensea 软件中没有考虑到突变位点的出现可能是由de novo 的测序错误引起的等. 但是图谱质量是限制序列标签算法的主要因素, 因为低能CID 碎裂模式通常很难将质量相同或相近的碎裂离子区分开来, 如亮氨酸(Leu)和异亮氨酸(Ile)、赖氨酸(Lys)和谷氨酰胺(Gln)以及苯丙氨酸(Phe)和氧化的甲硫氨酸(Met)等[46]. 近年来, 随着电子转移解离(electron transfer dissociation, ETD)和高能碰撞解离(high-energy collision induced dissociation, HCD)的出现, 越来越多的比CID 质谱图质量高的、含有丰富的碎裂离子信息的高精度质谱图被产出, 这些高精度的质谱图能更好地适用于序列标签算法, 提高其准确性.

1.3 基于图谱库搜索的氨基酸突变鉴定算法

在肽段鉴定领域, 图谱库搜索是一种有望取代序列数据库搜索的鉴定策略[62]. 相比序列数据库搜索策略, 图谱库搜索策略有以下优点: (ⅰ) 直接利用图谱库中每一张真实图谱的各种不同的特征信息进行比对, 如碎片离子峰的峰强度信息、碎裂模式等, 使图谱比对算法具有更高的灵敏性; (ⅱ) 能够在一个更小、更精确的搜索空间内进行搜索, 可以比序列搜索速度快好几个数量级; (ⅲ) 能够轻松地鉴定出图谱库中已存在的变异肽段[63]. 对于依赖于图谱库搜索的蛋白突变鉴定来讲, 目前最大的限制来源于图谱库的覆盖范围, 尤其是对突变和修饰肽段图谱的包含[63,64]. 由于在相似的条件下, 肽段的图谱具有可再生性[65]并且相似序列的肽段通常能够产生相似的质谱图[20,66], 因此一批利用图谱库中已收录的肽段图谱来扩大图谱库对肽段的覆盖范围, 以实现对氨基酸突变进行鉴定的算法或工具应运而生. 目前常用的图谱搜索软件及其网址见表4.

在蛋白质组学中, 图谱库搜索概念早在1998年就由Yates 等人[70]率先提出, 但由于质谱仪通量不高、生物质谱数据缺乏以及质谱数据的自动化分析

中国科学: 生命科学 2014年 第44卷 第11期

1119

表4 常用的图谱搜索软件

工具名称 网址 参考文献 SpectraST https://www.sodocs.net/doc/167367514.html,/spectrast [64,67] X!Hunter https://www.sodocs.net/doc/167367514.html,/tandem/thegpm_hunter.html [68] pMatch https://www.sodocs.net/doc/167367514.html,/pmatch/ [63] DeltAMT https://www.sodocs.net/doc/167367514.html,/pcluster/ [69] Pepitome https://www.sodocs.net/doc/167367514.html,/software.php [62]

方法不完善等[71]原因使得图谱库搜索策略发展缓慢. 直到最近10年, 随着质谱和计算机技术的快速发展, 鉴定出的肽段图谱匹配对(peptide spectrum match, PSM)的数目与日俱增, 图谱库搜索策略才逐渐被应用到大规模数据集和数据库中. 最近, 图谱库搜索策略更是被用于发掘样品中的突变肽段. 要用图谱搜索策略来鉴定样品中的突变肽段, 就必须要扩大图谱库对突变肽段的覆盖范围. 目前用于扩大图谱库覆盖范围的算法有pMatch [63]、半经验算法[72,73]以及Ji 等人[66]提出的相似性算法等. pMatch 在构建图谱时, 利用肽段已知的实验图谱和理论图谱混合构建图谱, 用来缓冲由修饰或突变氨基酸残基引起的肽段碎裂模式的变化[64]. 由Hu 等人[72]在2011年提出的半经验方法通过利用图谱库中已收录的PSMs 构建突变肽段的质谱图以扩大对突变肽段的覆盖范围. 这种算法把图谱库中图谱对应的肽段序列替换为相应的突变肽段序列, 并将突变肽段的碎裂离子的质核比值替换到图谱中. 2013年, Ji 等人[66]提出的相似性算法通过利用相似序列肽段的图谱来推断目标肽段的图谱, 以达到扩充图谱库的覆盖范围的目的. 这种算法的特点是, 通过加权K 邻近相似算法[66](weighted K-nearest neighbor method)和支持向量机(support vector machine, SVM)[74], 利用与目标肽段序列相似且长度相等的肽段的图谱来精确地预测目标肽段序列的优势碎裂离子(如b, y 离子类型以及其中性丢失离子类型等)的峰强度, 并且利用SpectraST [64,67]创建的模型构建诱饵数据库进行数据过滤. 同时, Ji 等 人[66]指出, 将此算法应用于扩建美国国家标准与技术研究院(National Institute of Standards and Tech- nology, NIST)图谱数据库, 能有效地将NIST 图谱库的覆盖率提高20%~60%, 并且用此数据库能够鉴定到样品中更多的突变肽段.

除了通过扩大图谱库覆盖范围以提高图谱库搜索对样品突变肽段的鉴定率以外, 通过改善图谱-图谱匹配(spectrum-spectrum match, SSM)的打分算法也

是一条有效提高突变肽段鉴定效率的途径. 目前点积法是SSMs 打分的主流算法, 如SpectraST 和X!Hunter [68]等主流的图谱搜索工具都是利用点积算法进行匹配打分的. 近年来, 一些基于点积法、用于搜索变异肽段的图谱库搜索工具或算法也逐渐被开发出来, 如pMatch 工具[63], Bonanza 算法[20]等. pMatch 工具的特点在于, 利用电荷依赖型的质量位移进行离子峰匹配, 并且将常规的点积法与基于概率的模型相结合对图谱间的匹配进行打分. Bonanza 算法特点在于, 在筛选候选图谱时, 不限制母离子质量, 可以将不同母离子质量的图谱聚在一起作为候选图谱; 在对离子峰进行匹配时, 不仅将质量相近的子离子峰考虑进去, 还将母离子间的质量差考虑进去; 最后, 利用改进的点积法进行打分. 最近, 考虑到点积法不能提供一个清晰的统计学上的解释并且在打分中忽略了碎裂离子质核比值的差异等缺点, Dasari 等人[62]构建了一个利用概率评分标准对SSMs 的质量进行评估的搜索引擎Pepitome, 并且在错误发现率(false discovery rate, FDR)为2%的情况下, 成功地鉴定到比SpectraST 多10%~12%的肽段数目. 前面所提到的图谱鉴定方法都需要依赖图谱库, Fu 等人[69]在2011年提出了一个不需要搜索图谱库就能直接对突变肽段进行鉴定的统计学算法DeltAMT, 此算法通过二维高斯混合模型利用高精确度的母离子质量差和保留时间信息对变异肽段进行鉴定.

总体而言, 基于图谱库的蛋白质突变鉴定算法能够有效地缩小搜索空间, 降低搜索时间, 提高搜索的灵敏度. 目前, 由于存在谱图搜索软件对质谱图的整体解析度无法达到传统数据库搜索策略的程度以及谱库的覆盖范围小等原因, 谱图搜索更多的是作为传统数据库搜索策略的互补策略被使用. 但是随着算法的改进以及PeptideAtlas [75]计划的进行[62], 相信在不久的将来, 利用图谱库对串联质谱进行鉴定的方法会越来越广泛地被使用.

余庆等: 利用串联质谱鉴定氨基酸突变的生物信息学算法

1120

2 氨基酸突变鉴定的应用

当调节细胞增殖、分化、死亡的蛋白序列突变累积到一定程度就会引起癌变[76]. DNA 测序显示, 在复杂的癌症基因组中通常包含40~100个可能的氨基酸突变位点[25], 然而这些突变中只有小部分会对癌症与肿瘤的发生产生作用. 因此如果能够鉴定出与癌症或肿瘤发生有关的突变肽段, 进而对能够真正引发癌症的基因进行重注释就有机会从更深的层次上了解癌症或肿瘤病发的机理, 找寻到治疗癌症或肿瘤的新方法. 所以, 提高图谱的解析率, 鉴定出更多的高质量的突变图谱是找寻突变肽段的关键.

受限于质谱数据的质量、计算能力以及当前已知SAVs 的覆盖范围等因素, SAVs 鉴定首先应用在小规模的样品数据集中. 2000年, Gatlin 等人[27]通过动态构建人类血红蛋白变异数据库首次成功地对人类血红蛋白样品进行了突变鉴定. 随后, 2003年Tabb 等人[54]利用序列标签算法对32950张人类晶状体蛋白质样品(human lens sample)质谱数据中的突变肽段鉴定作出了尝试, 成功地鉴定出742条肽段, 其中134条与突变有关. 随着科技的进步和算法的优化, SAVs 鉴定逐渐被应用到大规模数据集的鉴定中. 2007年, Bunger 等人[31]通过搜索结合dbSNP 数据库的自建蛋白质数据库从DU4475乳腺肿瘤细胞样品质谱数据中鉴定出629个nsSNVs. 同时他们指出, 在大规模数据集中, 要想鉴定出高可信的SAVs, 不仅要依赖鉴定算法还要对假阳性鉴定结果进行过滤, 如通过诱饵数据库去除假阳性鉴定等. Tanner 等人[77]利用InsPecT 对1850万张人类蛋白质样品HEK293质谱图进行鉴定, 并结合PTMfinder [78]算法对鉴定结果进行了假阳性过滤, 从中发现了与308个nsSNVs 有关的肽段. 之后, SAVs 的鉴定被广泛地应用于组织、器官等复杂样品数据集中. 2012年, Hyatt 和Pan [18]将Sipros v2.0 算法应用于鉴定酸性矿坑水(acid mine drainage)环境中的微生物群落蛋白质的突变氨基酸, 在含有57001个蛋白的数据库中进行搜索, 鉴定出1683张图谱对应的755个突变肽段. 同时, Hyatt 和Pan [18]指出, 氨基酸突变中有些可能来自于氨基酸的修饰作用, 如在鉴定出的频率最高的突变氨基酸中, 谷氨酰胺(Gln)与谷氨酸(Glu)以及天冬酰胺(Asn)与天冬氨酸(Asp)之间都能经过脱氨基作用进行转换. Su 等人[39]利用自定义的人类血浆蛋白质突变数据库,

从290个亚洲人血浆样品中鉴定出2029个SAVs, 并挑选出3对与糖尿病和肥胖有关的SAVs 进行了绝对定量分析, 指出表型不仅和SAVs 的浓度有关, 也和SAVs 变种的相对率有关系. Mathivanan 等人[25]通过构建人类蛋白质突变数据库(HPMD), 从直肠癌细胞系中鉴定出2728个蛋白, 其中有57个突变蛋白是首次在直肠癌中被鉴定出来的. 这些新鉴定出来的突变蛋白在发展新的直肠癌生物标志物和研究治疗直肠癌的靶蛋白方面将会发挥巨大的作用.

近年来, 利用RNA-seq 数据对蛋白质组数据进行鉴定逐渐受到人们的青睐. 2012年, Wang 等人[41]基于RNA-Seq 数据构建了蛋白质数据库并对2个直肠癌细胞系SW480和RKO 进行了鉴定, 分别鉴定出18760和22623张质谱图. 这些图谱中共包含23条不存在于dbSNP54中的变异肽段, 其中鉴定到的TP53P309S 突变能够增加SW480细胞的增殖能力, 并且能够增强对细胞抗癌药物的耐受性; HSP90AA1D393N 突变对致癌蛋白的构象和稳定性有着巨大的影响.

虽然利用质谱数据结合序列数据库搜索是目前主流的蛋白鉴定的策略, 但在传统的数据库搜索中, 即使利用最好的质谱平台和最优的分析软件, 也有相当一部分质谱图不能被解析出来[79,80]. 随着越来越多的PSMs 被鉴定出来, 人们开始利用质谱图数据库来鉴定突变肽段, 并且成功地鉴定到了比序列数据库搜索更多的SAVs. 在FDR=0.0001%的条件下, Hu 等人[72,73]利用SpectraST 搜索半经验图谱库并结合PeptideProphet [81]对结果进行检验, 成功地从人类血浆样品中鉴定出了与SAVs 有关的2045条肽段, 而相同条件下, X!Tandem 则只从序列数据库中鉴定出来623条与SAVs 有关的肽段.

3 结语

随着DNA 测序成本大幅降低, 越来越多个体的基因组序列被鉴定出来[82]. 但即便在知道人类全基因序列信息的情况下, 科学家们对基因型与分子表型间关系的了解也只是冰山一角[83]. 而对分子表型的了解有助于科学家们对人类疾病发生机理的理解, 比如由RNA 、蛋白质以及翻译后修饰数据能够容易地推断出信号通路是否被激活. 虽然目前出现了许多能够预测基因突变对蛋白分子结构及功能影响的软件和在线工具, 如IntOGen [84], SIFT [85]和Poly-

中国科学: 生命科学 2014年 第44卷 第11期

1121

Phen-2[86]等, 但这些预测工具只能辅助性地对突变氨基酸进行筛选和排序, 以便减少实验验证的候选者[87]. 而结合了变异蛋白信息的基因信息能够有效地帮助科学家对特定生物学过程的分子途径以及疾病发生的机制等进行理解, 进而增加预防、诊断、治疗疾病的手段[88].

本文从数据库搜索、数据库搜索与de novo 结合的序列标签搜索以及新兴的图谱比对搜索方法3个方面对大规模鉴定突变蛋白的方法作出了比较全面的介绍. 目前, 无论哪一种搜索方法都受到离子碎裂模式理解程度的深入、计算能力高低以及数据库覆盖范围大小等因素的限制, 而结合不同搜索方法能够实现不同方法间的互补, 能有效地提高鉴定结果的

灵敏度. Dasari 等人[62]发现, 将序列数据库搜索和图谱库搜素结合起来对样品进行搜索能有效地提高搜索结果的覆盖范围, 并且成功地将此方法应用在了对MMR 细胞系的鉴定中. 相似地, 在PEAKS 软件中, 将de novo 测序、序列数据库搜索以及同源性搜索等方法整合到一起形成一个工作流程, 结合多个搜索引擎产出高可信的结果, 并且使得鉴定结果对样本数据库的覆盖范围最大化[49~51]. 随着质谱技术的不断发展和新型计算方法的出现, 序列数据库搜索算法和图谱库搜索算法以及de novo 测序算法的不断地改善、提高, 将来会有越多的突变蛋白被鉴定出来, 这些鉴定结果在寻找生物标记物、个性化医疗以及生理病理机制研究等方面将发挥重要的作用.

参考文献

1 Collins F S, Brooks L D, Chakravarti A. A DNA polymorphism discovery resource for research on human genetic variation. Genome Res, 1998, 8: 1229–1231

2 Frazer K A, Ballinger D G, Cox D R, et al. A second generation human haplotype map of over 3.1 million SNPs. Nature, 2007, 449:

851–861

3 Reva B, Antipin Y, Sander C. Predicting the functional impact of protein mutations: application to cancer genomics. Nucleic Acids Res,

2011, 39: e118

4 Nakamura Y. DNA variations in human and medical genetics: 2

5 years of my experience. J Hum Genet, 2009, 54: 1–8

5 Yin H, Liang Y, Yan Z, et al. Mutation spectrum in human colorectal cancers and potential functional relevance. BMC Med Genet, 2013,

14: 32

6 Martin A, Saathoff M, Kuhn F, et al. A functional ABCC11 allele is essential in the biochemical formation of human axillary odor. J

Invest Dermatol, 2010, 130: 529–540

7 Yoshiura K, Kinoshita A, Ishida T, et al. A SNP in the ABCC11 gene is the determinant of human earwax type. Nat Genet, 2006, 38:

324–330

8 Vogelstein B, Kinzler K W. Cancer genes and the pathways they control. Nat Med, 2004, 10: 789–799

9 Di Fede G, Catania M, Morbin M, et al. A recessive mutation in the APP gene with dominant-negative effect on amyloidogenesis. Science,

2009, 323: 1473–1477

10 Driscoll M C. Sickle cell disease. Pediatr Rev, 2007, 28: 259–268

11 McCarthy M I, Abecasis G R, Cardon L R, et al. Genome-wide association studies for complex traits: consensus, uncertainty and

challenges. Nature Rev Genet, 2008, 9: 356–369

12 Do R, Kathiresan S, Abecasis G R. Exome sequencing and complex disease: practical aspects of rare variant association studies. Hum

Mol Genet, 2012, 21: R1–R9

13 Hecht M, Bromberg Y, Rost B. News from the protein mutability landscape. J Mol Biol, 2013, 425: 3937–3948

14 Sheynkman G M, Shortreed M R, Frey B L, et al. Large-scale mass spectrometric detection of variant peptides resulting from

nonsynonymous nucleotide differences. J Proteome Res, 2014, 13: 228–240

15 Apweiler R, Bairoch A, Wu C H, et al. UniProt: the universal protein knowledgebase. Nucleic Acids Res, 2004, 32: D115–D119 16 Edwards N J. Novel peptide identification from tandem mass spectra using ESTs and sequence database compression. Mol Syst Biol,

2007, 3: 102

17 Schandorff S, Olsen J V, Bunkenborg J, et al. A mass spectrometry-friendly database for cSNP identification. Nat Methods, 2007, 4:

465–466

18 Hyatt D, Pan C. Exhaustive database searching for amino acid mutations in proteomes. Bioinformatics, 2012, 28: 1895–1901

19 Abraham P, Adams R M, Tuskan G A, et al. Moving away from the reference genome: evaluating a peptide sequencing tagging approach

for single amino acid polymorphism identifications in the genus Populus . J Proteome Res, 2013, 12: 3642–3651

余庆等: 利用串联质谱鉴定氨基酸突变的生物信息学算法

20Falkner J A, Falkner J W, Yocum A K, et al. A spectral clustering approach to MS/MS identification of post-translational modifications. J Proteome Res, 2008, 7: 4614–4622

21Sherry S T, Ward M H, Kholodov M, et al. dbSNP: the NCBI database of genetic variation. Nucleic Acids Res, 2001, 29: 308–311

22Forbes S A, Tang G, Bindal N, et al. COSMIC (the Catalogue of Somatic Mutations in Cancer): a resource to investigate acquired mutations in human cancer. Nucleic Acids Res, 2010, 38: D652–D657

23Hamosh A, Scott A F, Amberger J S, et al. Online Mendelian Inheritance in Man (OMIM), a knowledgebase of human genes and genetic disorders. Nucleic Acids Res, 2005, 33: D514–D517

24Li J, Su Z, Ma Z Q, et al. A bioinformatics workflow for variant peptide detection in shotgun proteomics. Mol Cell Proteomics, 2011, 10: M110.006536

25Mathivanan S, Ji H, Tauro B J, et al. Identifying mutated proteins secreted by colon cancer cell lines using mass spectrometry. J Proteomics, 2012, 76: 141–149

26Stenson P D, Mort M, Ball E V, et al. The human gene mutation database: 2008 update. Genome Med, 2009, 1: 13

27Gatlin C L, Eng J K, Cross S T, et al. Automated identification of amino acid sequence variations in proteins by HPLC/microspray tandem mass spectrometry. Anal Chem, 2000, 72: 757–763

28Creasy D M, Cottrell J S. Error tolerant searching of uninterpreted tandem mass spectrometry data. Proteomics, 2002, 2: 1426–1434

29Craig R, Beavis R C. TANDEM: matching proteins with tandem mass spectra. Bioinformatics, 2004, 20: 1466–1467

30Kersey P J, Duarte J, Williams A, et al. The International Protein Index: an integrated database for proteomics experiments. Proteomics, 2004, 4: 1985–1988

31Bunger M K, Cargile B J, Sevinsky J R, et al. Detection and validation of non-synonymous coding SNPs from orthogonal analysis of shotgun proteomics data. J Proteome Res, 2007, 6: 2331–2340

32Li J, Duncan D T, Zhang B. CanProVar: a human cancer proteome variation database. Hum Mutat, 2010, 31: 219–228

33Mottaz A, David F P, Veuthey A L, et al. Easy retrieval of single amino-acid polymorphisms and phenotype information using SwissVar.

Bioinformatics, 2010, 26: 851–852

34Xi H, Park J, Ding G, et al. SysPIMP: the web-based systematical platform for identifying human disease-related mutated sequences from mass spectrometry. Nucleic Acids Res, 2009, 37: D913–D920

35Alves G, Ogurtsov A Y, Yu Y K. RAId_DbS: mass-spectrometry based peptide identification web server with knowledge integration.

BMC Genomics, 2008, 9: 505

36Yip Y L, Famiglietti M, Gos A, et al. Annotating single amino acid polymorphisms in the UniProt/Swiss-Prot knowledgebase. Hum Mutat, 2008, 29: 361–366

37Kawabata T, Ota M, Nishikawa K. The protein mutant database. Nucleic Acids Res, 1999, 27: 355–357

38Chernobrovkin A L, Mitkevich V A, Popov I A, et al. Identification of single amino acid polymorphisms in MS/MS spectra of peptides.

Dokl Biochem Biophys, 2011, 437: 90–93

39Su Z D, Sun L, Yu D X, et al. Quantitative detection of single amino acid polymorphisms by targeted proteomics. J Mol Cell Biol, 2011, 3: 309–315

40Evans V C, Barker G, Heesom K J, et al. De novo derivation of proteomes from transcriptomes for transcript and protein identification.

Nat Methods, 2012, 9: 1207–1211

41Wang X, Slebos R J, Wang D, et al. Protein identification using customized protein sequence databases derived from RNA-Seq data. J Proteome Res, 2012, 11: 1009–1017

42Sultan M, Schulz M H, Richard H, et al. A global view of gene activity and alternative splicing by deep sequencing of the human transcriptome. Science, 2008, 321: 956–960

43Wang X, Zhang B. customProDB: an R package to generate customized protein databases from RNA-Seq data for proteomics search.

Bioinformatics, 2013, 29: 3235–3237

44Woo S, Cha S W, Merrihew G, et al. Proteogenomic database construction driven from large scale RNA-seq data. J Proteome Res, 2014, 13: 21–28

45Tanner S, Shu H, Frank A, et al. InsPecT: identification of posttranslationally modified peptides from tandem mass spectra. Anal Chem, 2005, 77: 4626–4639

46Ma B, Johnson R. De novo sequencing and homology searching. Mol Cell Proteomics, 2012, 11: O111.014902

47Dasari S, Chambers M C, Slebos R J, et al. TagRecon: high-throughput mutation identification through sequence tagging. J Proteome Res, 2010, 9: 1716–1726

48Dancik V, Addona T A, Clauser K R, et al. De novo peptide sequencing via tandem mass spectrometry. J Comput Biol, 1999, 6: 327–342 49Ma B, Zhang K, Hendrie C, et al. PEAKS: powerful software for peptide de novo sequencing by tandem mass spectrometry. Rapid

1122

中国科学: 生命科学 2014年第44卷第11期

Commun Mass Spectrom, 2003, 17: 2337–2342

50Zhang J, Xin L, Shan B, et al. PEAKS DB: de novo sequencing assisted database search for sensitive and accurate peptide identification.

Mol Cell Proteomics, 2012, 11: M111.010587

51Han X, He L, Xin L, et al. PeaksPTM: mass spectrometry-based identification of peptides with unspecified modifications. J Proteome Res, 2011, 10: 2930–2936

52Frank A, Pevzner P. PepNovo: de novo peptide sequencing via probabilistic network modeling. Anal Chem, 2005, 77: 964–973

53Mann M, Wilm M. Error-tolerant identification of peptides in sequence databases by peptide sequence tags. Anal Chem, 1994, 66: 4390–4399

54Tabb D L, Saraf A, Yates J R 3rd. GutenTag: high-throughput sequence tagging via an empirically derived fragmentation model. Anal Chem, 2003, 75: 6415–6421

55Searle B C, Dasari S, Turner M, et al. High-throughput identification of proteins and unanticipated sequence modifications using a mass-based alignment algorithm for MS/MS de novo sequencing results. Anal Chem, 2004, 76: 2220–2230

56Han Y, Ma B, Zhang K. SPIDER: software for protein identification from sequence tags with de novo sequencing error. J Bioinform Comput Biol, 2005, 3: 697–716

57Yuen D. SPIDER: reconstructive protein homology search with de novo sequencing tags. Master Thesis. Waterloo: University of Waterloo, 2011

58Tabb D L, Ma Z Q, Martin D B, et al. DirecTag: accurate sequence tags from peptide MS/MS through statistical scoring. J Proteome Res, 2008, 7: 3838–3846

59Na S, Bandeira N, Paek E. Fast multi-blind modification search through tandem mass spectrometry. Mol Cell Proteomics, 2012, 11: M111.010199

60Ma Z Q, Dasari S, Chambers M C, et al. IDPicker 2.0: improved protein assembly with high discrimination peptide identification filtering.

J Proteome Res, 2009, 8: 3872–3881

61Na S, Jeong J, Park H, et al. Unrestrictive identification of multiple post-translational modifications from tandem mass spectrometry using an error-tolerant algorithm based on an extended sequence tag approach. Mol Cell Proteomics, 2008, 7: 2452–2463

62Dasari S, Chambers M C, Martinez M A, et al. Pepitome: evaluating improved spectral library search for identification complementarity and quality assessment. J Proteome Res, 2012, 11: 1686–1695

63Ye D, Fu Y, Sun R X, et al. Open MS/MS spectral library search to identify unanticipated post-translational modifications and increase spectral identification rate. Bioinformatics, 2010, 26: i399–i406

64Lam H, Deutsch E W, Eddes J S, et al. Development and validation of a spectral library searching method for peptide identification from MS/MS. Proteomics, 2007, 7: 655–667

65Hoopmann M R, Moritz R L. Current algorithmic solutions for peptide-based proteomics data generation and identification. Curr Opin Biotechnol, 2013, 24: 31–38

66Ji C, Arnold R J, Sokoloski K J, et al. Extending the coverage of spectral libraries: a neighbor-based approach to predicting intensities of peptide fragmentation spectra. Proteomics, 2013, 13: 756–765

67Lam H, Deutsch E W, Eddes J S, et al. Building consensus spectral libraries for peptide identification in proteomics. Nat Methods, 2008, 5: 873–875

68Craig R, Cortens J C, Fenyo D, et al. Using annotated peptide mass spectrum libraries for protein identification. J Proteome Res, 2006, 5: 1843–1849

69Fu Y, Xiu L Y, Jia W, et al. DeltAMT: a statistical algorithm for fast detection of protein modifications from LC-MS/MS data. Mol Cell Proteomics, 2011, 10: M110.000455

70Yates J R 3rd, Morgan S F, Gatlin C L, et al. Method to compare collision-induced dissociation spectra of peptides: potential for library searching and subtractive analysis. Anal Chem, 1998, 70: 3557–3565

71Lam H. Building and searching tandem mass spectral libraries for peptide identification. Mol Cell Proteomics, 2011, 10: R111.008565

72Hu Y, Li Y, Lam H. A semi-empirical approach for predicting unobserved peptide MS/MS spectra from spectral libraries. Proteomics, 2011, 11: 4702–4711

73Hu Y, Lam H. Expanding tandem mass spectral libraries of phosphorylated peptides: advances and applications. J Proteome Res, 2013, 12: 5971–5977

74Joachims T. Learning to Classify Text Using Support Vector Machines: Methods, Theory and Algorithms. Dordrecht: Kluwer Academic Publishers, 2002

75Desiere F, Deutsch E W, King N L, et al. The PeptideAtlas project. Nucleic Acids Res, 2006, 34: D655–D658

76Davies H, Bignell G R, Cox C, et al. Mutations of the BRAF gene in human cancer. Nature, 2002, 417: 949–954

1123

余庆等: 利用串联质谱鉴定氨基酸突变的生物信息学算法

77Tanner S, Shen Z, Ng J, et al. Improving gene annotation using peptide mass spectrometry. Genome Res, 2007, 17: 231–239

78Tanner S, Payne S H, Dasari S, et al. Accurate annotation of peptide modifications through unrestrictive database search. J Proteome Res, 2008, 7: 170–181

79Resing K A, Meyer-Arendt K, Mendoza A M, et al. Improving reproducibility and sensitivity in identifying human proteins by shotgun proteomics. Anal Chem, 2004, 76: 3556–3568

80Yen C Y, Russell S, Mendoza A M, et al. Improving sensitivity in shotgun proteomics using a peptide-centric database with reduced complexity: protease cleavage and SCX elution rules from data mining of MS/MS spectra. Anal Chem, 2006, 78: 1071–1084

81Keller A, Nesvizhskii A I, Kolker E, et al. Empirical statistical model to estimate the accuracy of peptide identifications made by MS/MS and database search. Anal Chem, 2002, 74: 5383–5392

82Snyder M, Du J, Gerstein M. Personal genome sequencing: current approaches and challenges. Genes Dev, 2010, 24: 423–431

83Ng P C, Levy S, Huang J, et al. Genetic variation in an individual human exome. PLoS Genet, 2008, 4: e1000160

84Gonzalez-Perez A, Perez-Llamas C, Deu-Pons J, et al. IntOGen-mutations identifies cancer drivers across tumor types. Nat Methods, 2013, 10: 1081–1082

85Ng P C, Henikoff S. Predicting deleterious amino acid substitutions. Genome Res, 2001, 11: 863–874

86Adzhubei I A, Schmidt S, Peshkin L, et al. A method and server for predicting damaging missense mutations. Nat Methods, 2010, 7: 248–249

87Liu X, Jian X, Boerwinkle E. dbNSFP v2. 0: a database of human non-synonymous SNVs and their functional predictions and annotations.

Hum Mutat, 2013, 34: E2393–E2402

88Snyder M, Weissman S, Gerstein M. Personal phenotypes to go with personal genomes. Mol Syst Biol, 2009, 5: 273 Bioinformatics Algorithms for Identification of Amino Acid Mutations in

Tandem Mass Spectrometry

YU Qing1,2, WU SongFeng2,3, MA Jie2,3, ZHU YunPing2,3 & SHU KunXian1

1 Institute of Bioinformatics, Chongqing University of Posts and Telecommunications, Chongqing 400065, China;

2 State Key Laboratory of Proteomics, Beijing Proteome Research Center, Beijing 102206, China;

3 Beijing Institute of Radiation Medicine, Beijing 100850, China

Amino acid mutations can change the structures and functions of proteins, which affect life processes of organisms. Currently, shotgun proteomics based on tandem mass spectrometry is the main strategy for large-scale proteomics research, but the existing interpretation methods of mass spectrometry data focus more on improving the sensitivity of the identification results, and tend to compress the information of amino acid mutations in protein databases. Therefore, how to explore the mutations of identified proteins becomes an important task of proteomics research. The current available methods to identify protein mutations using mass spectrometry can be roughly divided into three categories: sequence database search based methods, sequence tags search based methods and spectral library search based methods. Here, firstly, we describe the three kinds of algorithms to identify protein mutations, and then the characteristics and limitations of each method were evaluated in details. Finally, we introduce the research status and development direction of the identification of amino acid mutations by mass spectrometry strategy. With the continuous development of tandem mass spectrometry-based proteomics, the mutations in the protein sequence information would be better interpreted, and it would be helpful for in-depth studies about the diseases caused by protein mutations.

amino acid variation, tandem mass spectrometry, shotgun proteomics, identification of amino acid mutations doi: 10.1360/N052014-00099

1124

什么是串联质谱遗传代谢病检测

如对您有帮助,可购买打赏,谢谢 什么是串联质谱遗传代谢病检测 导语:可能有一些朋友会听说过遗传代谢病这样的症状吧,但是真正了解遗传代谢病的人肯定是不多的,毕竟遗传代谢病并不是一种常见的疾病,我们周边 可能有一些朋友会听说过遗传代谢病这样的症状吧,但是真正了解遗传代谢病的人肯定是不多的,毕竟遗传代谢病并不是一种常见的疾病,我们周边也很少有人患上遗传代谢病,但是由于遗传代谢病的危害性很大,所以我们还是有必要多了解一些关于遗传代谢病的信息,下文我们介绍一下什么是串联质谱遗传代谢病检测。 遗传代谢病(Inherited metabolic disorders,IMD)又称先天性代谢缺陷(Inborn errors of metabolism,IEM),是参与体内代谢的某种酶、运载蛋白、膜或受体等的编码基因发生突变,从而导致机体生化代谢紊乱,造成中间或旁路代谢产物蓄积,或终末代谢产物缺乏,引起一系列临床症状的一组疾病。IEM可以表现为氨基酸、有机酸、脂肪、激素等先天性代谢缺陷。IEM多为常染色体隐性遗传病,少数为常染色体显性遗传或X、Y连锁伴性遗传及线粒体遗传等。 迄今发现的遗传代谢病已有500余种,IEM不仅病种数量繁多、发病机理复杂,而且其临床表现具有多样性和缺乏特异性,临床确认绝大多数依赖于对患儿体液中特异性异常代谢物质的实验室生化分析结果,或者进行酶学或基因分析。部分患儿在出生3-6个月内开始发病,有的甚至到几岁或十几岁开始发病。过去,限于分析技术手段,临床医生往往难以作出具体病因诊断。传统的辅助检查手段也难以提供确诊依据,所以此类疾病的具体病因诊断往往难度较大,许多患儿也因此错过了最佳干预期而致愚、致残、甚至致命。IEM危害严重,患儿大多预后不良,不仅给患者及其家庭造成极大的精神痛苦和经济负担, 预防疾病常识分享,对您有帮助可购买打赏

氨基酸测定方法

4.1 光度分析法[5] [6] β-氨基丙酸和茚三酮溶液在弱酸的条件下可以生成蓝紫色物质[7],其颜色深浅主要与β-氨基丙酸的浓度有关。因此可利用此显色反应采用比色法定量测量β-氨基丙酸。我在实验中发现很多因素如浓度、pH 值、反应温度、以及反应时间等对此显色反应有很大的影响。如忽视这些因素会使实验产生很大的误差。就此显色反应的最佳条件我做了初步的探究。 4.1.1试剂的配制: 缓冲液的配制:配制pH= 6.00的NaAc -HAc 缓冲溶液 β-氨基丙酸标准溶液的配制: 用电子天平准确称取1.020 g β-氨基丙酸(生化纯),溶于250ml pH=6.00缓冲溶液中,得到C = 4.080 g/L 标准溶液。 茚三酮试剂的配制:称取0.5g 茚三酮溶于100ml 蒸馏水中,得到5g/L 的茚三酮水溶液。 4.1.2标准曲线的确定 分别准确移取0.30ml 、0.40ml 、0.50ml 、0.60ml 、0.70ml 、0.80ml 、0.90ml 、1.00ml 标准液于8个比色管中,用pH=6.00的缓冲溶液稀释到5.00ml 再加入1ml 茚三酮水溶液充分摇匀,将其放在沸水浴中加热10min 。冷却到室温,用7230型分光光度计在569nm 下测其吸光度。以吸光度和浓度作一个标准曲线。 4.1.3样品的测定 稀释待测液于0.24mg/ml —0.73mg/ml,调pH 值到6.00,以相同的反应条件,测其吸光值并与上面的标准曲线对照查出稀释液的浓度,再乘以稀释倍数即为β-氨基丙酸的浓度。 4.1.4 标准曲线的测定结果 β-氨基丙酸浓度在0.24mg/ml —0.73mg/ml 范围内与茚三酮水溶液反应,颜色表现出由浅蓝到深蓝的递增变化。用茚三酮比色法测得的一组数据得到的标准曲线如图1: 0.20.30.40.50.60.70.80.9 1.0 1.1 0.4 0.6 0.8 1.0 1.2 1.4 吸光度加入标液体积(ml) B 图 1 标准曲线的测定 Fig 1 Determination of the standard curve 注:在沸水中加热10min ,β-氨基丙酸标准溶液5ml 、茚三酮水溶液1ml 、缓冲溶液pH=6.00 4.1.5样品的测定分析 将待测的一批稀释50倍,母液稀释的程度可以根据以与标准溶液在相同的

利用串联质谱鉴定氨基酸突变的生物信息学算法_余庆

中国科学: 生命科学 2014年 第44卷 第11期: 1113 ~ 1124 SCIENTIA SINICA Vitae https://www.sodocs.net/doc/167367514.html, https://www.sodocs.net/doc/167367514.html, 引用格式: 余庆, 吴松锋, 马洁, 等. 利用串联质谱鉴定氨基酸突变的生物信息学算法. 中国科学: 生命科学, 2014, 44: 1113–1124 Yu Q, Wu S F, Ma J, et al. Bioinformatics algorithms for identification of amino acid mutations in tandem mass spectrometry. SCIENTIA SINICA Vitae, 2014, 44: 1113–1124, doi: 10.1360/N052014-00099 《中国科学》杂志社 SCIENCE CHINA PRESS 评 述 利用串联质谱鉴定氨基酸突变的生物信息学算法 余庆 ①② , 吴松锋 ②③ , 马洁 ②③ , 朱云平 ②③* , 舒坤贤① * ① 重庆邮电大学生物信息学研究所, 重庆 400065; ② 北京蛋白质组研究中心, 蛋白质组学国家重点实验室, 北京 102206; ③ 中国人民解放军军事医学科学院放射与辐射医学研究所, 北京 100850 * 联系人, E-mail: zhuyunping@https://www.sodocs.net/doc/167367514.html,; shukx@https://www.sodocs.net/doc/167367514.html, 收稿日期: 2014-03-05; 接受日期: 2014-04-22; 网络版发表日期: 2014-09-17 国家自然科学基金(批准号: 21105121, 21275160)、国家高技术研究发展计划(批准号: 2012AA020409, 2012AA020201)和北京市自然科学基金(批准号: 5122013)资助项目 doi: 10.1360/N052014-00099 摘要 氨基酸突变能够改变蛋白的结构和功能, 影响生物体的生命过程. 基于串联质谱的鸟枪法蛋白质组学是目前大规模研究蛋白质组学的主要方法, 但是现有的质谱数据鉴定流程为了提高鉴定结果的灵敏度往往会有意压缩数据库中的氨基酸突变信息. 因此, 如何挖掘数据中的氨基酸突变信息成为当前质谱数据鉴定的一个重要部分. 当前应用于氨基酸突变鉴定的串联质谱鉴定方法大致可以分为3大类: 基于序列数据库搜索的方法、基于序列标签搜索的算法以及基于图谱库搜索的算法. 本文首先详细介绍了这3种氨基酸突变鉴定算法, 并分析了各种方法的特点和不足, 然后介绍了氨基酸突变鉴定的研究现状和发展方向. 随着基于串联质谱的蛋白质组学的不断发展, 蛋白序列中的氨基酸突变信息将被更好地解析出来, 从而得以深入探讨由氨基酸突变引起的蛋白结构和功能改变, 为揭示氨基酸突变的生物学意义奠定基础. 关键词 氨基酸突变 串联质谱 鸟枪法蛋白质组学 氨基酸突变鉴定 单核苷酸变异(single nucleotide variations, SNVs)是由DNA 序列上单个碱基变异产生的, 包括碱基的缺失、插入、转换及颠换等. SNVs 是基因组序列变异的主要形式[1], 同时也是生物体生理和病理变异的遗传基础[2]. 从遗传学的角度看, SNVs 既可以存在于具有遗传性的生殖细胞中, 也可以存在于不具有遗传性的体细胞中. 其中, 只有位于基因编码区的SNVs 能够影响蛋白的编码. 位于编码区的SNVs 可以分为3类: (ⅰ) 同义SNVs, 不改变相应的氨基酸种类; (ⅱ) 无义SNVs, 突变成为终止密码子, 提早 结束编码; (ⅲ) 非同义SNVs(nonsynonymous SNVs, nsSNVs), 改变氨基酸的种类. nsSNVs 能够改变蛋白的结构、功能、表达以及亚细胞定位等[3], 进而对多种遗传性的特征、疾病以及癌症等产生影响[4~9], 如人类耳垢的类型[6]、腋窝的气味[7]、癌症与肿瘤的发生[8]、阿尔茨海默病[9]以及镰刀形红细胞贫血症[10]等. 因此, 对SNVs 展开研究可以揭示出基因与表型多样性和基因与疾病间的关系, 并且有可能研发出治疗疾病的新方法. 目前, 全基因组关联研究(genome- wide association studies, GWAS)[11]虽然在基因变异与

液相色谱-串联质谱法

消毒产品中丙酸氯倍他索和盐酸左氧氟沙星测定?液相色谱-串联质谱法 Determination of clobetasol propionate and levofloxacin hydrochloride in disinfection product - LC-MS-MS method 1 范围 本方法规定了膏霜类消毒产品中丙酸氯倍他索和盐酸左氧氟沙星残留量液相色谱-串联质谱测定方法。 本方法适用于膏霜类消毒产品中丙酸氯倍他索和盐酸左氧氟沙星残留量的测定。 取样量为0.1g时,本方法对丙酸氯倍他索和盐酸左氧氟沙星的检出限见表1。 表1 丙酸氯倍他索和盐酸左氧氟沙星的检出限、保留时间和特征离子 中文名称英文名称 检出限 (μg/g) 保留时 间(min) 特征离子(m/z) 丙酸氯倍他索Clobetasol propionate 0.009 7.83 467.0/355.2/373.4 盐酸左氧氟沙星Levofloxacin hydrochloride 0.06 1.11 362.0/260.9/318.2 2 规范性引用文件 3 原理 试样中丙酸氯倍他索和盐酸左氧氟沙星用甲醇提取,提取液经0.45μm滤膜过滤,用C18柱分离后,用液相色谱-串联质谱仪测定,正离子扫描,离子对定性,峰面积定量。 4 试剂和材料 除另有说明外,所用试剂均为分析纯,水为不含有机物的纯水,纯水中干扰物的浓度需低于方法中待测物的检出限。 4.1甲醇:农药残留级。 4.2乙腈:农药残留级。 4.3甲酸:分析纯。

4.4标准品:丙酸氯倍他索和盐酸左氧氟沙星均购自中国药品生物制品检定所,纯度≥99.8%。 4.5标准溶液:准确称取丙酸氯倍他索适量,用乙腈-水(1:1)配制成100μg/mL 的标准贮备液。准确称取盐酸左氧氟沙星适量,用纯水配制成100μg/mL的标准贮备液。准确量取上述标准贮备溶液适量,用乙腈稀释配制成浓度为10.0μg/mL 的混合标准中间溶液,将标准中间溶液转移到安瓿瓶中于4 C保存。临用前,再根据需要用甲醇配制成不同浓度的标准使用溶液。 4.6甲酸溶液(0.2%,v/v):量取2mL甲酸,用纯水定容至1000mL。 4.7 0.45μm滤膜。 5 仪器 5.1 液相色谱-串联质谱联用仪:HP1100高效液相色谱仪(Agilent) - API 4000质谱仪(Applied Biosystems) ,电喷雾离子化源(ESIMS,NI/PI模式)。 5.2 分析天平:感量0.1mg和0.001g。 5.3实验室纯水机:Barnstead纯水机。 5.4涡旋振荡器:Scientific Industries 涡旋振荡器。 5.5 具塞试管:10mL。 6 试样的制备与保存 6.1 试样的制备 取有代表性样品5g,搅拌均匀,制成实验室样品。 6.2 试样保存 制备好的试样置于室温保存。 7 测定步骤 7.1样品前处理 称取0.1g~0.2g样品(精确到0.001 g) ,置于10mL试管中,加入3.00mL甲醇溶液,涡旋振摇使样品分散后,超声振荡10min。静置,吸取上清液经滤膜(4.7)过滤后,供液相色谱-串联质谱测定。

氨基酸测定

食物中氨基酸的测定方法 测定食物中的胱氨酸使用过甲酸氧化-氨基酸自动分析仪法,测定色氨酸使用荧光分光光度法,测定其它氨基酸使用氨基酸自动分析仪法。 一、氨基酸自动分析仪法 1.原理 食物蛋白质经盐酸水解成为游离氨基酸,经氨基酸分析仪的离子交换柱分离后,与茚三酮溶液产生颜色反应,再通过分光光度计比色测定氨基酸含量。一份水解液可同时测定天冬,苏,丝,谷,脯,甘,丙,缬,蛋,异亮,亮,酪,苯丙,组,赖和精氨酸等16种氨基酸,其最低检出限为10pmol。 2.适用范围 GB/T14965-1994食物中氨基酸的测定方法。 本法适用于食物中的16种氨基酸的测定。其最低检出限为10pmol。本方法不适用于蛋白质含量低的水果、蔬菜、饮料和淀粉类食物的测定 3.仪器和设备 3.1真空泵 3.2恒温干燥箱 3.3水解管:耐压螺盖玻璃管或硬质玻璃管,体积20~30ml。用去离子水冲洗干净并烘干。 3.4真空干燥器(温度可调节) 3.5氨基酸自动分析仪。 4.试剂 全部试剂除注明外均为分析纯,实验用水为去离子水。 4.1浓盐酸:优级纯 4.26mol/L盐酸:浓盐酸与水1:1混合而成。 4.3苯酚:需重蒸馏。 4.4混合氨基酸标准液(仪器制造公司出售):0.0025mol/L 4.5缓冲液: 4.5.1 pH2.2的柠檬酸钠缓冲液:称取19.6g柠檬酸钠(Na3C6H5O7.2H2O)和16.5ml浓盐酸加水稀释到1000ml,用浓盐酸或50%的氢氧化钠溶液调节pH至2.2 4.5.2 pH3.3的柠檬酸钠缓冲液:称取19.6g柠檬酸钠和12ml浓盐酸加水稀释到1000ml,用浓盐酸或50%的氢氧化钠溶液调节至pH至3.3。 4.5.3 pH4.0的柠檬酸钠缓冲液:称取19.6g柠檬酸钠和9ml浓盐酸加水稀释到1000ml,用浓盐酸或50%的氢氧化钠溶液调节pH至4.0。 4.5.4 pH6.4的柠檬酸钠缓冲液:称取19.6g柠檬酸钠和46.8g氯化钠(优级纯)加水稀释到1000ml,用浓盐酸或50%的氢氧化钠溶液调节pH至6.4。 4.6茚三酮溶液 4.6.1 pH 5.2的乙酸锂溶液:称取氢氧化锂(LiOH.H2O)168g,加入冰乙酸(优级纯)279ml,加水稀释到1000ml,用浓盐酸或50%的氢氧化钠调节pH至5.2。 4.6.2茚三酮溶液:取150ml二甲基亚砜(C2H6OS)和乙酸锂溶液(2.6.1)50ml

基于液相色谱鄄串联质谱的氨基酸代谢组学方法

DOI :10.3724/SP.J.1096.2013.20743 基于液相色谱?串联质谱的氨基酸代谢组学方法 研究黄芪注射液治疗脑缺血 吴宏伟1 高健2 李韶菁1 唐力英1 许海玉1 唐仕欢1 杨洪军*1 1 (中国中医科学院中药研究所,北京100700)  2 (河北医科大学药学院,石家庄071002) 摘 要 建立了基于液相色谱?串联质谱技术的氨基酸代谢组学分析方法三选用Diamonsil C 18色谱柱,乙腈?0.1%甲酸为流动相,梯度洗脱,三重四级杆质谱检测器,MRM 扫描方式,12min 内对血浆中12种氨基酸进行定量分析三应用本方法对脑缺血模型和黄芪注射液的治疗作用做出评价三通过偏最小二乘判别分析统计发现,脑缺血12h,其血浆中的氨基酸代谢表达存在显著差异,结合载荷图及VIP 值确定丝氨酸二天冬氨酸二甘胺酸等7种脑缺血生物标识物;采用黄芪注射液治疗后,从得分图上可以看到氨基酸代谢的轨迹发生了较大变化;与脑缺血模型组比较,丝氨酸二天冬氨酸二甘胺酸等生物标识物均向正常水平趋近三关键词 氨基酸代谢组;液相色谱?串联质谱;脑缺血;黄芪注射液  2012?07?17收稿;2012?10?15接受 本文系中国中医科学院自主选题研究项目(No.Z02067)资助*E ?mail:hongjun0420@https://www.sodocs.net/doc/167367514.html, 1 引 言 代谢组学是对某一生物或细胞所有低分子量代谢产物进行定性和定量分析的学科[1,2]三随着转化 医学理念的不断深入,代谢组学的分析目标应更加具有针对性三从所有小分子代谢产物中筛选出与疾病具有明确相关性的目标成分群进行分析,不仅可以降低分析的难度二增加准确性,而且可以使找到的生物标识物更有可能应用于临床及药物的评价三 氨基酸在脑代谢的过程中具有重要的生理功能三研究表明,兴奋性氨基酸的大量释放与脑缺血时神经元的损伤具有密切关系[3,4]三本研究建立了一种基于高效液相色谱?串联质谱检测血浆中多种氨基酸的分析方法三本方法与其它衍生化分析法比较[5,6],操作简单,分析时间短三在此基础上对脑缺血的模型及黄芪注射液治疗作用作了评价,脑缺血12h 后,血浆中氨基酸整体表达存在显著差异,确定了丝氨酸二天冬氨酸二甘胺酸等7种生物标识物;经黄芪注射液治疗后,从得分图上可以看到氨基酸代谢的轨迹发生了较大变化;与脑缺血模型组比较,丝氨酸二天冬氨酸二甘胺酸等生物标识物均向正常水平趋近三 2 实验部分 2.1 仪器、试剂与材料 6410三重四级杆质谱(ESI ?QQQ/MS ,Agilent 公司);台式高速离心机(美国Labnet 公司)三酌?氨基丁酸(Gaba ),甘氨酸(Gly ),丙氨酸(Ala ),丝氨酸(Ser ),谷氨酸(Glu ),天冬氨酸(Asp ),同型半胱氨酸(Hcy ),蛋氨酸(Met ),酪氨酸(Tyr ),N ?乙酰天门冬氨酸(Naa ),苯丙氨酸(Phe ),色氨酸(Trp ),氘代丙烯酰胺(Acrylamide ?d 3,内标)标准品(Sigma 公司);甲醇(色谱纯,Fisher 公司);实验用 水为Milli ?Q Water System (Millipore ,Bedfo ?rd ,MA ,ΜSA )过滤后的纯水三实验动物为Wistar 大鼠(雄性,体重180~220g ,由北京维通利华实验动物技术有限公司提供)三黄芪注射液(神威药业有限公司),生产批号:10083041)三 2.2 动物实验 选取Wistar 雄性大鼠,共分为5组,分别为假手术对照组二脑缺血模型组二黄芪注射液给药组(高二中二低3个剂量),每组10只三脑缺血造模方法为的线栓法致局灶性脑缺血(Middle cerebral artery occlusion,MCAO)[7]给药方法为腹腔注射给药,中剂量相当于药品说明书中标识的临床有效剂量,高剂 第41卷2013年3月 分析化学(FENXI HUAXUE ) 研究报告Chinese Journal of Analytical Chemistry 第3期344~348

氨基酸发酵

第一部分基础练习 一、名词解释 1.末端产物阻遏:是指由某代谢途径末端产物的过量累积时而引起的反馈阻遏,是一种较为重要的反馈阻遏。 2.分解代谢物阻遏:是指细胞内同时存在两种碳源(或两种氮源)时,利用快的那种碳源(或氮源)会阻遏利用慢的那种碳源(或氮源)的有关酶合成的现象。 3.代谢调控:在发酵工业中,为了大量积累人们所需要的某一代谢产物,常人为地打破微生物细胞内的自动代谢调节机制,使代谢朝人们所希望的方向进行,这就是所谓的代谢调控。 4.营养缺陷型菌株因基因突变致使某一合成途径中断,丧失合成其生长中必需的某种物质的能力,使末端产物减少,解除了末端产物参与的反馈抑制或调节,可使代谢途径中的某一中间产物过量积累,也可使分子代谢的中间产物和另一分支途径中的末端产物积累。 5.外源诱导物:抗生素生物合成过程中,参与次级代谢的酶,有些是诱导酶,诱导物有的是外界加入的,称外源诱导物。 二、问答题 1.答:氨基酸生产方法主要有合成法与发酵法两种。 2.答:野生型菌株,营养缺陷型突变株,或是氨基酸结构类似物抗性突变株. 3.答:氨基酸生物合成的基本调节机制有反馈控制和在合成途径分枝点处的优先合成,除此之外,还有一些特殊的调节机制,如协同反馈抑制、合作(或增效)反馈抑制、同功酶控制、顺序控制、平衡合成、代谢互锁等。 4.答:在乳糖发酵短杆菌中,赖氨酸合成分支上的第一个酶——二氢吡啶合成酶(DDP合成酶)受到与本途径无关的另一种氨基酸——亮氨酸的阻遏(即代谢互锁)。 5.答:具有分子代谢途径的分支点。即在分支合成途径中,分支点后的两种酶竞争同一种底物,由于两种酶对底物的Km值(即对底物的亲和力)不同,故 两条支路的一条优先合成。 第二部分技能训练 一、选择题 1.D 2.C 3.D 4.B 5.B 6.A 7.C 二、问答题

液相色谱串联质谱的小知识

一、开机 water 2695/micromass zq4000: 开机步骤 1. 分别打开质谱、液相色谱和计算机电源,此时质谱主机内置的CPU会通过网线与计算机主机建立通讯联系,这个时间大约需要1至2分钟。 2. 等液相色谱通过自检后,进入Idle状态,依照液相色谱操作程序,依次进行操作。(具体根据液相色谱不同型号来执行,下面以2695为例)。 a.打开脱气机(Degasser On)。 b.湿灌注(Wet Prime)。 c.Purge Injector。 d.平衡色谱柱。 3.双击桌面上的MassLynx 4.0图标进入质谱软件。 4.检查机械泵的油的状态(每星期),如果发现浑浊、缺油等状况,或者已经累积运行超过3000小时,请及时更换机械泵油。 5.点击质谱调谐图标(MS T une)进入质谱调谐窗口。 6.选择菜单“Options –Pump”,这时机械泵将开始工作,同时分子涡轮泵会开始抽真空。几分钟后,ZQ就会达到真空要求,ZQ前面板右上角的状态灯“Vacuum”将变绿。 7.点击真空状态图标,检查真空规的状态,以确认真空达到要求。 8. 确认氮气气源输出已经打开,气体输出压力为90 psi。 9.设置源温度(Source T emp)到目标温度。 关机 1.点击质谱调谐图标进入调谐窗口。 2.点击Standby 让MS 进入待机状态时,这时状态灯会由绿变红,这一过程是关质谱高电压的过程。 3.停止液相色谱流速,如果还需要冲洗色谱柱,可以将液相色谱管路从质谱移开到废液瓶。4.等脱溶剂气温度(ESI)或APCI探头温度降到常温,点击气体图标关闭氮气。 5.逆时针方向拧开机械泵上的Gas Ballast 阀,运行20分钟后关闭(镇气)。 a) 对于ESI源,至少每星期做一次。 b) 对于APCI源,每天做一次。 6.再次确认机械泵的Ballast阀是否已经关闭。 7.选择Option / Vent,这时质谱开始泄真空,ZQ 前面板的状态灯“Vacuum”开始闪烁,几分钟后机械泵会停止运行,这时可以关闭质谱电源。 FINNIGEN DECA 开关机及校正流程—— 1开机前准备事项 (1)确保质谱总电源开关(白色开关)及主板电源开关(黑色开关)处于关闭状态(O); (2)检查真空泵油液面,确保泵内油页面处于标定的上下两线之间; (3)查看离子源洁净程度,ESI源查看喷口是否有固体析出,毛细管口是否完好;APCI喷口是否有积液; (4)气体压力,打开高纯氮气钢瓶总阀,调节出口压力调至0.65MPa,打开高纯氦气钢瓶总阀,调节出口压力调至0.25Mpa; (5)检查壳气及辅助气接口连接紧固,松开液相管路与离子源的接口; (6)开启动力电源,电压稳定,正常;

食物中氨基酸的测定方法

食物中氨基酸的测定方法 测定食物中的胱氨酸使用过甲酸氧化-氨基酸自动分析仪法,测定色氨酸使用荧光分光光度法,测定其它氨基酸使用氨基酸自动分析仪法。 一、氨基酸自动分析仪法 1.原理 食物蛋白质经盐酸水解成为游离氨基酸,经氨基酸分析仪的离子交换柱分离后,与茚三酮溶液产生颜色反应,再通过分光光度计比色测定氨基酸含量。一份水解液可同时测定天冬,苏,丝,谷,脯,甘,丙,缬,蛋,异亮,亮,酪,苯丙,组,赖和精氨酸等16种氨基酸,其最低检出限为10pmol。 2.适用范围 GB/T14965-1994食物中氨基酸的测定方法。 本法适用于食物中的16种氨基酸的测定。其最低检出限为10pmol。本方法不适用于蛋白质含量低的水果、蔬菜、饮料和淀粉类食物的测定 3.仪器和设备 3.1真空泵 3.2恒温干燥箱 3.3水解管:耐压螺盖玻璃管或硬质玻璃管,体积20~30ml。用去离子水冲洗干净并烘干。 3.4真空干燥器(温度可调节) 3.5氨基酸自动分析仪。 4.试剂 全部试剂除注明外均为分析纯,实验用水为去离子水。 4.1浓盐酸:优级纯 4.26mol/L盐酸:浓盐酸与水1:1混合而成。 4.3苯酚:需重蒸馏。 4.4混合氨基酸标准液(仪器制造公司出售):0.0025mol/L 4.5缓冲液: 4.5.1 pH2.2的柠檬酸钠缓冲液:称取19.6g柠檬酸钠(Na3C6H5O7.2H2O)和16.5ml浓盐酸加水稀释到1000ml,用浓盐酸或50%的氢氧化钠溶液调节pH至2.2

4.5.2 pH3.3的柠檬酸钠缓冲液:称取19.6g柠檬酸钠和12ml浓盐酸加水稀释到1000ml,用浓盐酸或50%的氢氧化钠溶液调节至pH至3.3。 4.5.3 pH4.0的柠檬酸钠缓冲液:称取19.6g柠檬酸钠和9ml浓盐酸加水稀释到1000ml,用浓盐酸或50%的氢氧化钠溶液调节pH至4.0。 4.5.4 pH6.4的柠檬酸钠缓冲液:称取19.6g柠檬酸钠和46.8g氯化钠(优级纯)加水稀释到1000ml,用浓盐酸或50%的氢氧化钠溶液调节pH至6.4。 4.6茚三酮溶液 4.6.1 pH 5.2的乙酸锂溶液:称取氢氧化锂(LiOH.H2O)168g,加入冰乙酸(优级纯)279ml,加水稀释到1000ml,用浓盐酸或50%的氢氧化钠调节pH至5.2。 4.6.2茚三酮溶液:取150ml二甲基亚砜(C2H6OS)和乙酸锂溶液(2.6.1)50ml加入4g 水合茚三酮(C9H4O3.H2O)和0.12g还原茚三酮(C18H10O6.2H2O)搅拌至完全溶解。 4.7高纯氮气:纯度99.99%。 4.8 冷冻剂:市售食盐与冰按1:3混合 5.操作步骤 5.1样品处理:样品采集后用匀浆机打成匀浆(或者将样品尽量粉碎)于低温冰箱中冷冻保存,分析用时将其解冻后使用。 5.2称样:准确称取一定量样品,精确到0.0001g。均匀性好的样品如奶粉等,使样品蛋白质含量在10~20mg范围内;均匀性差的样品如鲜肉等,为减少误差可适当增大称样量,测定前再稀释。将称好的样品防于水解管中。 5.3水解:在水解管内加6mol/L盐酸10~15ml(视样品蛋白质含量而定),含水量高的样品(如牛奶)可加入等体积的浓盐酸,加入新蒸馏的苯酚3~4滴,再将水解管放入冷冻剂中,冷冻3~5min,再接到真空泵的抽气管上,抽真空(接近0psi),然后充入高纯氮气;再抽真空充氮气,重复三次后,在充氮气状态下封口或拧紧螺丝盖将已封口的水解管放在110±1℃的恒温干燥箱内,水解22h后,取出冷却。 打开水解管,将水解液过滤后,用去离子水多次冲洗水解管,将水解液全部转移到50ml 容量瓶内,用去离子水定容。吸取滤液1ml于5ml容量瓶内,用真空干燥器在40~50℃干燥,残留物用1~2ml水溶解,再干燥,反复进行两次,最后蒸干,用1mlpH2.2的缓冲液溶解,供仪器测定用。 5.4测定:准确吸取0.200ml混合氨基酸标准,用pH2.2的缓冲液稀释到5ml,此标准稀释浓度为5.00nmol/50μL,作为上机测定用的氨基酸标准,用氨基酸自动分析仪以外标

液相串联质谱检测方法前处理总结 doc.deflate

液相串联质谱检测方法前处理总结doc.deflate 首先,作为质检员,不但要掌握专业的检测知识,还需要认真仔细,才能发现问题,找出问题,解决问题。所以这三个月培训使我受益匪浅。在检验之前,要学会读懂相关的检验标准,并能融会贯通到实际当中去,并且要做好操作,及时的发现及纠正检验过程中存在的问题。 其次,经过实习,我认为这有助于提高自己的综合素质,全面发展了自己。古语说得好:流水不腐,户枢不蠹。我在大学期间一直学习食品质量安全与检测专业及相关知识。实习这段时间,我又对各种检测项目等基础知识有了一个清晰的认识。也是对自己专业知识的重新认识和深化,这也是干好这项工作的业务基础。 再次,我认为自己培养了该职务所必须的素养和品质。质检工作要求质检员的敬业精神比较强,工作认真负责,勤勤恳恳,任劳任怨,干一行,爱一行,专一行。尤其是严明的组织纪律性、吃苦耐劳的优良品质、雷厉风行的工作作风,这是干好一切工作的基础。同时思想上也要求比较活跃,接受新事物比较快,爱学习、爱思考、爱出点子,工作中注意发挥主观能动性,超前意识强,这有利于开拓工作新局面。其他的如办事稳妥,处世严谨,在廉洁自律信奉诚实、正派的做人宗旨,能够与人团结共事,而且具有良好的协调能力上更应该严格的要求自己,这是做好一切工作的保证,也是新人能够更快地进入质检员角色,开展工作的前提和保障。实习期间这些方面的要求都有所提高,可谓受益匪浅。 前处理总结 第一部分瘦肉精的检测 一尿样 1试剂:乙腈(色谱纯)、乙腈水(10+90)(所用水为超纯水) 2器材:50ml离心管、移液枪(200ul、1ml、10ml)、冷冻离心机、超声波清洗器、旋转蒸发仪、迷你震荡器、25ml蒸馏瓶、1ml针管、0.22um有机滤膜。3实验步骤:

分子生物学名词解释

弱化子是指原核生物操纵子中能显著减弱甚至终止转录作用的一段核苷酸序列,该区域能形成不同的二级结构,利用原核生物转录与翻译的偶联机制对转录进行调节。 分子伴侣是一类序列上没有相关性担忧共同功能的保守性蛋白质,它们在细胞内能帮助其他多肽进行正确的折叠、组装、运转和降解 基因家族在基因进化过程中一个基因通过基因重复产生两个或更多的拷贝,这些基因构成一个基因家族,是具有显著性的一组基因,编码相似的蛋白质的产物。 操纵子是指原核生物中由一个或多个相关基因以及转录翻译调控元件组成的基因表达单元。 重叠基因具有部分公用核苷酸序列的基因,即同一段DNA携带了不同蛋白质的编码信息。重叠的序列可以是调控基因,也可以是结构基因的部分。 基因重排是指将一个基因从远离启动子的地方移到距启动子很近的地方从而启动转录的方式。 看家基因(管家基因)在个体的所有细胞中持续表达的基因。 复制子单独复制的一个DNA单元被称为一个复制子,它是一个可移动的单位。一个复制子在任何一个细胞周期只复制一次。 逆转录以RNA为模板合成DNA的过程,即RNA指导下的DNA合成。此过程中,核酸合成与转录过程与遗传信息的流动方向相反,故称为逆转录。逆转录过程是RNA 病毒的复制形式之一,需逆转录酶的催化。 沉默突变(同义突变)是指碱基的改变不引起氨基酸改变的突变。 同工tRNA指几个代表相同的氨基酸,能够被一个特殊的氨酰—tRNA合成酶识别的tRNA. 无义突变在DNA序列中任何导致编码氨基酸的三联密码子转变为终止密码子的突变,它使蛋白质合成提前终止,合成无功能的或无意义的多肽。 端粒是存在于真核细胞线状染色体末端的一小段DNA-蛋白质复合体,它与端粒结合蛋白一起构成了特殊的“帽子”结构,作用是保持染色体的完整性和控制细胞分裂周期。 核心启动子是指保证RNA聚合酶II转录正常起始所必需的、最少的DNA序列,包括转录起始位点上游 -25 ~ -30bp处的TATA区。 切除修复DNA损伤的一种修复机制,直接切除受损伤的一条DNA片段,以其互补链为模板新合成DNA来取代切除的受损片段。 错配修复是对DNA错配区的修复。通过母链甲基化原则找出区分母链与子链从而修正子链上错配的碱基。 转座子能够在没有序列相关性的情况下独立插入基因组新位点上的一段DNA序列,是存在于染色体DNA上可自主复制和位移的基本单位。参与转座子移位及DNA链整合的酶称为转座酶。 密码的简并由一种以上密码子编码同一氨基酸的现象,对应于同一氨基酸的密码子称为同义密码子。 基因组一个细胞或病毒携带的全部遗传信息或整套基因,包括每一条染色体和所有亚细胞器的DNA序列信息。顺式作用元件是指启动子和基因的调节序列,主要包括启动子、增强子和沉默子。 DNA有义链DNA分子两条链中只有一条具有转录功能叫做模板链或反义链,无转录功能的链叫做编码链或有义链,这个基因的有义链可能是另一个基因的反义链。 -35序列23.-10序列在RNA合成开始位点的上游大约10bp和35bp处有两个共同的顺序,称为-10和-35序列。顺反子功能基因,意为通过顺式及反式试验所确定的一个遗传学单位。 核酶是一类具有催化活性的RNA分子,通过催化靶位点RNA链中磷酸二酯键的断裂,特异性的剪切底物RNA分子,从而阻断基因的表达。 比较基因组学在基因组图谱和序列分析的基础上,对已知基因和基因结构进行比较,了解基因的功能、表达调控机制和物种进化过程的学科。 SD 序列存在于原核生物起始密码子AUG上游7~12个核苷酸处的一种4~7个核苷酸的保守片段,它与168-rRNA 3'端反向互补,所以可以将mRNA的AUG起始密码子置于核糖体的适当位置以便起始翻译作用。根据首次识别其功能意义的科学家命名。 基因敲除针对一个序列已知但功能未知的基因,从DNA水平设计实验,彻底破坏该基因的功能或消除其表达机制,从而推测该基因的生物学功能 冈崎片段是在DNA半不连续中产生的长度1000—2000个碱基的短的DNA片段,能被连接形成一条完整的DNA 链 C 值反常. 也称C值谬误,指C指往往与种系的进化复杂性不一致的现象,即基因组大小与遗传复杂性之间没有必要的联系,某些较低等的生物C值却很大。 弱化子是指原核生物操纵子中能显著减弱甚至终止转

串联质谱

串联质谱如何定量? 串联质谱定量时,是以后面产生的碎片峰(子离子)定量,但是这一子离子是由母离子在碰撞室产生的特征性碎片,所以用MRM定量灵敏度会比用SIM定量好很多。 建立方法的步骤是:用一定溶度的标准品溶液(1-10 ug/mL)Tune化合物的一级质谱条件,找到母离子的最佳质谱条件,然后对母离子进行打碎,优化碰撞能量,得到其特征性的子离子。最后利用该质谱条件和该母离子->子离子对进行定量。 API和ABI如何区别? 但API也是Atmosphere Pressure Ionization (大气压电离,包括ESI、APCI和最新的大气压光电离APPI)的简称,API是LCMS的关键,因为这一技术最开始是ABI公司发明的,所以ABI的LCMS和LCMSMS都以API命名,常见的型号有API2000,API3000,API4 000。您问的API也可能是指这个。 Q-Tof中的Q是什么意思?? Q就是指的四极杆,TOF是指的飞行时间。QQQ是三重四极杆。两者是四极杆-飞行时间的串联一般的四极杆串联都是三重四极杆的空间串联,至于纯粹的二重四极杆没有听说过,但是QQ-TOF有没有就不是很清楚 质量偏差怎么办? 不知道你用的是哪个厂家的仪器,应该每个厂家都会随机带有校正液。 质谱的质量数偏了,说明你的仪器该校正了,一般3个月就要校一次机。 做样前-检查氮气,流动相,质谱仪的真空度,毛细管温度,… 1 最好不用直接进样(容易污染离子源)! 2 做联用时最好分流(a可以使用常规柱,b缩短分析时间,c 延长质量分析器寿命) 3 最好使用在线切换阀,降前每个样品的前后1-2分钟的流动相切入废液(避免样品中的盐进入质谱,做Sequence时可以把平衡柱子的流动相切入废液) 4 开始联用前,直接运行质谱数分钟,可以先将温度(毛细管温度和离子源温度(APCI))加热到预设定值(如果是APCI源还可以避免将烧掉heater,很贵的,我烧掉过一个) 5 待机时将切换阀置于waste,避免刚开液相时将流动相打入离子源, 6 关机前毛细管的温度先降下来,稳定一段时间后再关闭电源,避免风扇停止转动后毛细管外围的热量向里扩散,容易引起内部线路及电子元器件老化加速, 7 每天清理毛细管口外部,擦洗干净,每次停机时注意清洗Skimmer,用无尘擦拭纸,kimberly 那种, 8 如果用的是钢瓶而且天天做样的话,将两个钢瓶并联,当然,一月不做一次的话就算了, 9 做定量时注意离子源喷针的具体位置,否则标准曲线就不能用了, 10 不要不经过柱子分离进行定量分析,结果不可靠(竞争性抑制目标分子离子化) 11 如果是负离子检测的话,可以相流动相中加入少量异丙醇, 12 不好使用不挥发性盐,可以使用挥发性盐,但浓度不要超过20mmol/l 13 需要使用酸的情况下可以用甲酸,乙酸,三氟乙酸可以用,但能用甲酸或乙酸时就别用TFA

氨基酸含量分析法

新增附录 附录XX 氨基酸分析法 氨基酸分析法是指用于测定蛋白质、肽及其他药物制剂的氨基酸组成或含量的方法。 根据氨基酸组成分析可以对蛋白质及肽进行鉴别,氨基酸分析法可用于确定蛋白质、肽及氨基酸的含量,及测定可能存在于蛋白质及肽中的非典型氨基酸。进行氨基酸分析前,必须将蛋白质及肽水解成单个氨基酸,具体水解方法由各品种项下规定。蛋白质及肽水解后,其氨基酸分析过程与用于其他药物制剂中游离氨基酸的分析过程相同。 本法包括四种柱前衍生法,分别为异硫氰酸苯酯(PITC)法、6-氨基喹啉-N-羟基琥珀酰亚氨基氨基甲酸酯(AQC)法、邻苯二醛(OPA)和9-芴甲基氯甲酸甲酯(FMOC)法、2,4-二硝基氟苯(DNFB)法,以及一种茚三酮柱后衍生法。不同的品种应针对自身所含的氨基酸种类及各氨基酸的含量选择适宜的氨基酸分析方法并做相应的方法学验证。 由于本法衍生过程中衍生溶液量较少,且容易挥发,外标法极易出现较大的误差,建议采用内标法进行测定,内标的确定由各品种项下规定。在本法中,由于半胱氨酸或胱氨酸的衍生产物不稳定,因此对于含半胱氨酸或胱氨酸的样品衍生后应尽快测定,或者在衍生前对半胱氨酸或胱氨酸进行适当的处理,使其转化为稳定地产物(如磺基丙氨酸或半胱氨酸-硫代丙酸)后再衍生测定,具体方法由各品种项下规定。在测定过程中,可根据所用的仪器、色谱柱品牌、色谱柱的长度及要分离的氨基酸种类,对流动相的有机溶剂和洗脱梯度作适当调整以获得较好的分离度。 第一法 PITC柱前衍生氨基酸分析法 本法系根据氨基酸与异硫氰酸苯酯(PITC)反应,生成有紫外响应的氨基酸衍生物苯氨基硫甲酰氨基酸(PTC-氨基酸),PTC-氨基酸经反相高效液相色谱分离后用紫外检测,在一定的范围内其吸光值与氨基酸浓度成正比。本方法的线性浓度范围为0.025~1.25μmol/ml。 试剂(1)流动相A 0.1mol/L醋酸钠溶液(取无水醋酸钠8.2g,加水900ml溶解,用冰醋酸调pH至6.5,然后加水至1000 ml)-乙腈(93:7)。(2)流动相B 乙腈-水(8:2)。 对照品溶液按各品种项下规定的方法制备。 供试品溶液按各品种项下规定的方法制备。 色谱条件与系统适用性试验用十八烷基硅烷键合硅胶为填充剂(4.6×250mm,5μm);流速为每分钟 1.0ml;柱温为40℃;检测波长为254nm。各氨基酸峰间的分离度均应大于1.0。洗脱梯度如下:

串联质谱

串联质谱技术在新生儿疾病筛查中的应用 遗传性代谢病( inborn error of metabolism,IEM)是一类涉及氨基酸、有机酸、脂肪酸、尿素循环、碳水化合物、类固醇等多种物质代谢的疾病。其种类繁多,是儿科临床的疑难杂症。虽然其单一病种患病率较低,但总体发病率较高,对人口素质、家庭乃至社会的发展构成了极大的威胁。其诊断主要依赖实验室的特异性检查。我国每年出生约2200万新生儿,仅高苯丙氨酸血症(包括苯丙酮尿症)这类疾病,每年就新增患儿1600~1800例。LC-MS/MS 技术的发展使得这类疾病在发病前进行干预成为可能。即在新生儿出生后体内某些代谢产物出现异常,而尚未出现临床症状或者症状不明显时就早期明确诊断,并进行及时而有效的对症治疗,以避免患儿的重要脏器出现不可逆性损害,进而保障儿童正常的体格发育和智能发育。这就是新生儿疾病筛查(neonatal screening)。国际新生儿疾病筛查发展趋势逐步提高到以串联质谱(MS/MS)技术为中心的筛查,如欧美等国目前已经广泛采用LC-MS/MS法对新生儿遗传疾病筛查。串联质谱即两个质谱仪串联后一次进行二级质谱检测,利用超敏性、高特异性、高选择性和快速检验的串联质谱技术,能在2~3 min内对1个标本进行几十种代谢产物分析,通过对这些产物的分析,可以对40种左右遗传性代谢病(包括氨基酸代谢紊乱、有机酸代谢紊乱和脂肪酸代谢紊乱性疾病)进行筛查和诊断。2004年12月美国食品药品管理局(FDA)专门制订了“用串联质谱法分析新生儿氨基酸,游离肉毒碱和酰基肉碱筛选检测系统”的指导性文件。串联质谱技术不仅实现了“一项实验检测一种疾病”向“一项实验检测多种疾病”的转变,提高了检测的效率,同时使筛查过程中常见的假阳性或者假阴性的发生率显著降低,使新生儿疾病筛查在内容和质量上都提高到一个新的水平。串联质谱在临床遗传性代谢病高危患儿选择性筛查方面也发挥着重要作用,上海第二医科大学附属新华医院新生儿筛查中心检测了1000多例全国各地送检的遗传性代谢病高危标本,发现阳性标本达9% ~10%,在22700例新生儿中筛查出阳性病例6例。因此,串联质谱技术是目前开展新生儿筛查和临床遗传性代谢病高危患儿筛查诊断较好的方法和发展方向。目前,LC-MS/MS技术检测相对发生率比较高的一些新生儿代谢疾病如下:中链脂肪酸脱氢酶缺乏症、短链脂肪酸脱氢酶缺乏症、长链脂肪酸代谢异常、卡尼丁(肉碱)吸收障碍、卡尼丁结合酶缺乏、卡尼丁穿透障碍、丙酸血症、甲基丙二酸血症、异戊酸血症、戊二酸血症、3-hydroxy-3-methylglutaric aciduria、中链槭糖尿症(MCAD)、短链槭糖尿症(SCAD)、长链槭糖尿症(LCAD)、超长链槭糖尿症(VLCAD)、瓜氨酸血症、酪氨酸代谢紊乱、高胱氨酸尿、高苯丙氨酸血症、精氨酸酶缺乏症、精氨琥铂酸尿症、高甲硫氨酸血症、苯丙酮尿症、Argininosuccinic acidemia、非酮性高甘胺酸血症、Glutaric Acidemia、3-Hydroxy-3-methylglutaryl-CoA-lyase De?ciency、?-Ketothiolase De?ciency、Multiple Carboxylase De?ciency等。检测方法与原理:方法一,衍生化法:通过把样品进行“一步法”衍生,可以减少干扰,提高灵敏度。取1~2个滤纸血点(直径3 mm的干血滤纸片,相当于3.2 μL全血),置于96孔过滤板中,每孔加入含氨基酸和酰基肉碱同位素内标的无水甲醇100 μL,室温放置20 min,以提取血片中的氨基酸和酰基肉碱,然后离心至另一个96孔板中,氮气保护下50℃吹干,加入60 μL正丁醇((含3 mol/L HCl),密封,65℃孵育15 min进行衍生化。氨基酸衍生反应:

氨基酸生产工艺

氨基酸生产工艺 主讲人:韩北忠 刘萍 氨基酸是构成蛋白成分 目前世界上可用发酵法生产氨基酸有20多种。 氨基酸 α 碳原子分别以共价键连接氢原子、羧基和氨基及侧链。侧链不同,氨基酸的性质不同。 氨基酸的用途 1. 食品工业: 强化食品(赖氨酸,苏氨酸,色氨酸于小麦中) 增鲜剂:谷氨酸单钠和天冬氨酸 苯丙氨酸与天冬氨酸可用于制造低热量二肽甜味剂(α-天冬酰苯丙氨酸甲酯),此产品1981年获FDA批准,现在每年产量已达数万吨。 2. 饲料工业: 甲硫氨酸等必需氨基酸可用于制造动物饲料 3. 医药工业: 多种复合氨基酸制剂可通过输液治疗营养或代谢失调 苯丙氨酸与氮芥子气合成的苯丙氨酸氮芥子气对骨髓肿瘤治疗有效,且副作用低。 4. 化学工业:谷氨基钠作洗涤剂,丙氨酸制造丙氨酸纤维。 氨基酸的生产方法 发酵法: 直接发酵法:野生菌株发酵、营养缺陷型突变发酵、抗氨基酸结构类似物突变株发酵、抗氨基酸结构类似物突变株的营养缺陷型菌株发酵和营养缺陷型回复突变株发酵。 添加前体法 酶法:利用微生物细胞或微生物产生的酶来制造氨基酸。 提取法:蛋白质水解,从水解液中提取。胱氨酸、半胱氨酸和酪氨酸 合成法:DL-蛋氨酸、丙氨酸、甘氨酸、苯丙氨酸。 传统的提取法、酶法和化学合成法由于前体物的成本高,工艺复杂,难以达到工业化生产的目的。 生产氨基酸的大国为日本和德国。 日本的味之素、协和发酵及德国的德固沙是世界氨基酸生产的三巨头。它们能生产高品质的氨基酸,可直接用于输液制剂的生产。 日本在美国、法国等建立了合资的氨基酸生产厂家,生产氨基酸和天冬甜精等衍生物。 国内生产氨基酸的厂家主要是天津氨基酸公司,湖北八峰氨基酸公司,但目前无论生产规模及产品质量还难于与国外抗衡。 在80年代中后期,我国从日本的味之素、协和发酵以技贸合作的方式引进输液制剂的制造技术和仿造产品, 1991年销售量为二千万瓶,1996年达六千万瓶,主要厂家有无锡华瑞,北京费森尤斯,昆明康普莱特,但生产原

相关主题