[发明专利]质谱母离子选择有效
申请号: | 200680005209.0 | 申请日: | 2006-02-17 |
公开(公告)号: | CN101171586A | 公开(公告)日: | 2008-04-30 |
发明(设计)人: | M·梅;姚精文 | 申请(专利权)人: | 岛津研究所(欧洲)有限公司 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 永新专利商标代理有限公司 | 代理人: | 林晓红 |
地址: | 英国*** | 国省代码: | 英国;GB |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 质谱母 离子 选择 | ||
本发明涉及质谱中选择用于片段化的样品多肽的母离子的方法,以及确定样品多肽的至少一个推定的氨基酸序列的方法、设备和计算机程序。
质谱是一种鉴定蛋白质样品的日益重要的工具。目前,使用质谱证实样品蛋白质/多肽(这两个术语在这里是可互换的,除非有其他的陈述)的同一性,在本领域中是众所周知的。诸如MASCOT(基于MOWSE算法)的蛋白质质量指纹程序采用蛋白质的酶消化(例如,采用胰蛋白酶)所产生的质谱数据从而试图从一级序列数据库鉴定该蛋白质(Matrix Science有限公司,英国;Perkins等,Electrophoresis,1999年12月;20(18):3351-67;PMID:10612281)。从质谱数据鉴定蛋白质的方法包括使用来自酶消化蛋白质的肽分子量(采用质荷比的形式)。其他方法采用来自一个或多个肽的串联质谱数据(也称作MS/MS和MS2),选择和片段化目的离子种类以给出分级的子离子谱。还有一些将质量数据和氨基酸序列数据组合。模糊逻辑系统已经被用于控制MALDI质谱系统中的激光影响-Jensen ON等(Anal Chem.1997年5月1日;69(9):1706-14;PMID:9145026)。
WO 03/102572提供一种确定样品肽的至少一种从头推定(即候选的)氨基酸序列。这里公开的本发明在采用n>=2的MSn的质谱数据时是特别有用的。本文中,它被称作“测序仪”。
然而,产生较高水平的MSn质谱数据需要选择离子峰(即m/z峰)以用作进一步片段化的母离子,并且这目前要求专家输入以便作出最佳的选择。因此,为了从WO 03/102572(以及其他的质谱技术)获得最可能的结果,有必要由专家选择用于片段化的m/z峰(即母离子)。
当试图确定样品多肽的推定的氨基酸序列时,具体情况可能出现,其中在质谱的至少一个m/z峰上进行进一步的片段化是必要的。例如,当使用以及
(ii)采用人工智能技术分析所述至少两个候选m/z峰集合的m/z峰,以选择至少一个m/z峰用于片段化。
具体而言,如下详述,模糊逻辑技术可以用作所述人工智能技术。然而,其他人工智能技术可以用作模糊逻辑技术的替代或者补充,并且这些包括但是不局限于:数据挖掘技术、人工神经网络、决策树、基因算法和诸如C4.5的规则推理系统以及机器学习技术。
如下详述,在模糊逻辑技术中所使用的规则是基于在那些对应于所述质谱的所选变量中的知识和专门技术。从这些规则,确定作为母离子的候选m/z峰的合适性。作为对模糊逻辑的替代或者补充,数据挖掘方法,例如神经网络、决策树和基因算法可用于发现用于特定仪器数据组的这些规则。这些方法通常通过训练从一组试验数据中导出结论。该组训练数据可以是取自具有相对强度值的特定谱的所有质量峰。
一旦应用这些方法创建了模型,这个模型就可以用于预测新的数据。它可以独立应用于一组新数据从所述模型选择母离子。如果它和模糊逻辑系统组合以具有在线控制系统(例如去控制可能的母离子的选择),那么可以在规则库中形成源于这些方法的模型,以通过模糊逻辑技术帮助作出人工智能决策。可以采用不同数目的变量从不同方法定义模型。
典型地,三种数据挖掘技术用于创建预测模型-神经网络、决策树和规则推理系统。如果可以找到预测规则(例如,选择哪个峰作为母离子/不选择哪个峰作为母离子),神经网络提供数字格式的答案。当用于预测时,规则推理系统通过比较不同的导出规则,可以给出更多的决策的解释,并且揭示哪一个并另一个更好。神经网络可以是更适合的在该系统中执行的数据挖掘算法。
这些方法所导出的规则或者预测模型的精确性和覆盖率对于确定在这个系统中的实际使用是重要的。识别和显示规则中的不确定性将直接影响模糊逻辑的选择结果。覆盖率表示包括涉及或应用于这些规则中的数据量。高覆盖率可以给出更加可靠的结果。
MALDI-QIT质谱仪时,仪器中的离子阱的限制造成具有前体(precursor)的三分之一或更小质量的离子是不可检测的。类似地,在低于三分之一质量范围内一般也不能观察到片段离子。为了得到关于不可检测区域的进一步的质谱数据,必须选择来自质谱的m/z峰作为进一步片段化的母离子以提供信息。理论上,该方法可以进一步获得母肽的串联谱,MSn。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于岛津研究所(欧洲)有限公司,未经岛津研究所(欧洲)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680005209.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用