[发明专利]一种提高质谱磷酸化修饰位点鉴定通量和准确性的方法有效
申请号: | 202010318724.6 | 申请日: | 2020-04-21 |
公开(公告)号: | CN111489789B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 薛宇;周嘉琦;林少峰;王晨玮 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B40/00 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 许恒恒;李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 提高 磷酸化 修饰 鉴定 通量 准确性 方法 | ||
本发明属于生物信息领域,公开了一种提高质谱磷酸化修饰位点鉴定通量和准确性的方法,包括以下步骤:(1)将磷酸化组质谱数据库中多个样本的质谱鉴定磷酸化修饰组原始数据用多种搜库引擎按假阳性率FDR要求进行重新搜库;(2)去冗合并得到训练集;(3)将训练集作为机器学习输入样本,构建基于训练数据的机器学习模型;(4)利用模型对位点进行预测得到每个位点的打分排序,再利用该打分筛选出FDR满足目标FDR要求的位点,从而得到各搜库引擎工具整合之后的总位点。本发明通过对方法的整体处理流程的设计进行改进,同时采用多种搜库引擎,能够有效克服现有技术中对于蛋白质磷酸化修饰位点鉴定无法跨样本、准确性差和通量低方面的缺陷。
技术领域
本发明属于生物信息领域,更具体地,涉及一种提高质谱磷酸化修饰位点鉴定通量和准确性的方法,能够针对现阶段高通量质谱技术鉴定翻译后修饰位点,利用整合多工具和机器学习的方法提高蛋白质磷酸化修饰位点鉴定通量和准确性。
背景技术
蛋白质磷酸化是细胞内十分重要的翻译后修饰,是由特定位点的蛋白质激酶催化把磷酸基团转移到蛋白质底物上的过程,该过程调控着细胞基本进程,例如细胞周期、细胞生长和分化等。近年来,随着蛋白质领域相关技术的发展,运用串联质谱技术鉴定蛋白质的磷酸化修饰位点成为主流,其主要方法是将磷酸化蛋白质经过蛋白酶消化后,纯化出磷酸化多肽,再通过串联质谱,采集原始数据,利用开源软件即搜库引擎进行数据库检索,最终筛选假阳性率(False Discovery Rate,FDR)小于1%的磷酸化修饰肽段,从而鉴定出磷酸化修饰位点。
在中国普通发明专利说明书CN103268432A中公开了一种基于串联质谱鉴定蛋白质磷酸化修饰位点的方法,其利用开源软件将质谱采集的原始数据转化为可视化格式的数据,并利用Mascot和pFind搜库引擎进行数据库检索,筛选假阳性概率FDR值小于1%的磷酸化修饰肽段,利用p-value做为重新定位后的磷酸化修饰位点可信度值,Score做为重新定位后磷酸化修饰位点对应的得分,并对鉴定获得的蛋白质磷酸化修饰位点重新定位及评估。
上述方法操作简单,在一定程度上提高了基于串联质谱进行蛋白质磷酸化修饰位点鉴定结果的可信度,但却不能有效提高修饰位点鉴定通量;另一方面,该方法仅仅使用了两种搜库引擎进行数据库检索,却未能明确两种程序各自在修饰位点鉴定准确性当中的贡献度,且不能说明这两种程序与其他常用搜库引擎(如MaxQuant、MyriMatch、Comet等)在位点鉴定通量和准确性当中的优劣性;再者,由于技术水平的种种局限,譬如提升基础质谱鉴定水平技术的难度较大、其中有一种搜库引擎Mascot为商用程序难以获取等,该方法未能在大样本,尤其像不同癌症病人样本当中得到广泛应用。
发明内容
针对现有技术的以上缺陷或改进需求,本发明的目的在于提供一种提高质谱磷酸化修饰位点鉴定通量和准确性的方法,其中通过对方法的整体处理流程的设计进行改进,同时采用多种搜库引擎,与现有技术相比能够有效克服现有技术中对于蛋白质磷酸化修饰位点鉴定无法跨样本、准确性差和通量低方面的缺陷,得到的跨样本多引擎整合提高蛋白质磷酸化修饰位点鉴定通量和鉴定准确性的方法,可直接在已有质谱原始数据上进行操作,可用于各类蛋白质相关组学,尤其是疾病相关的蛋白质组学和修饰组学分析。
为实现上述目的,按照本发明,提供了一种提高质谱磷酸化修饰位点鉴定通量和准确性的方法,其特征在于,包括以下步骤:
(1)将预先选定的磷酸化组质谱数据库中多个样本的质谱鉴定磷酸化修饰组原始数据用多种搜库引擎按预先设定的初始假阳性率FDR要求进行重新搜库;
(2)将所述步骤(1)中多种搜库引擎鉴定到的磷酸化修饰位点进行去冗合并,得到训练集;
(3)将所述步骤(2)得到的训练集作为机器学习输入样本,该训练集中的每一个位点在每种搜库引擎当中的最高分值作为特征值,构建基于训练数据的机器学习模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010318724.6/2.html,转载请声明来源钻瓜专利网。