[发明专利]一种基于质谱数据的N-糖链结构鉴定Denovo方法及系统在审
申请号: | 202111235025.6 | 申请日: | 2021-10-22 |
公开(公告)号: | CN114166925A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 张军英;杨芝;吴金辉;刘继源;孙士生 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G01N27/626 | 分类号: | G01N27/626 |
代理公司: | 西安长和专利代理有限公司 61227 | 代理人: | 李霞 |
地址: | 710071 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 链结 鉴定 denovo 方法 系统 | ||
本发明属于糖组学技术领域,公开了一种基于质谱数据的N‑糖链结构鉴定Denovo方法及系统,包括:通过提取质谱数据中糖链碎片离子的结构和组成信息,基于基础峰、交叉峰、广义单糖字典进行N‑糖链鉴定,利用剪枝策略缩小鉴定结果候选结构的搜索空间,得到质谱对应的N‑糖链结构。本发明基于N‑糖链的质谱数据和从头测序(Denovo)的思想,通过提取质谱数据中糖链碎片离子的结构和组成信息,鉴定出质谱对应的N‑糖链结构。在鉴定过程中,引入基础峰、交叉峰并基于此进行N‑糖链鉴定;引入广义单糖字典,提高谱图质量,提升鉴定方法对质谱数据中噪声的鲁棒性;用剪枝策略缩小鉴定结果候选结构的搜索空间。本发明提升了质谱鉴定的质量。
技术领域
本发明属于糖组学技术领域,尤其涉及一种基于质谱数据的N-糖链结构鉴定Denovo方法及系统。
背景技术
目前:蛋白质的糖基化是生物体内普遍存在的蛋白质翻译后修饰,其N-糖链结构在很大程度上决定着糖蛋白的生物功能。随着质谱技术的飞速提升,运用质谱数据对糖链结构进行鉴定,已是认识糖蛋白生物功能的重要方式。
N-糖链是具有五糖核心固定结构的一种树状结构,目前N-糖链结构鉴定的方法大体分为两类:1)数据库搜索方法;2)从头测序(Denovo)法;3)标签法。其中标签法是数据库搜索方法与从头测序法的结合。下面对数据库搜索方法和从头测序方法分别进行介绍。
1.数据库搜索方法:参照了GlycoSearchMS、GlycoPep DB、GlyDB等数据库,将某个未知结构的待测糖肽质谱图与带有注释的糖链结构的真实谱图进行相似性匹配,从而获得一个表示相似性的分值,将最佳匹配的糖链结构作为鉴定结果。基于该类方法的算法有GRIP、ArMone 2.0、GlycoPep Detector、Byonic、Protein-Prospector、pGlyco 2.0等。
2.通常从头测序方法由两个过程组成,即枚举可能的糖链结构和评估这些候选结构,将具有最高分数的糖链结构作为鉴定结果。理想的枚举程序应当尽可能生成少量候选结构用于进一步评估,但不应缺失目标糖链结构。
现阶段从头测序方法主要分为三类:
第一类是详尽搜索:考虑到研究中的糖肽的母离子质量,可以使用Knapsack算法容易地计算出糖链的单糖组成。STAT、StrOligo、OSCAR等详尽的搜索方法列举了与单糖组成匹配的所有可能的分支结构。由于候选糖链结构的数量会与单糖的数量呈指数增长,故该类策略仅用于具有最多十个单糖残基的糖链的鉴定。
通过对候选糖链结构应用生物合成规则加以限制约束,可以大大缩小搜索空间,但是现实情况是对形成糖链的生物规则并不完全知晓,限制了利用生物合成规则的普遍适用性。
第二类是启发式方法:在谱图中的每个峰只能使用一次的条件下,生成候选糖链的问题已被证明是NP难问题。为此目前存在多种启发式方法,例如,每个峰的位置仅保留有限数量的子结构,降低计算复杂度以节省时间和空间。现有技术1建议逐步重建糖链结构,并在每次迭代中考虑固定数量的高质量结构。现有技术2提出了一种基于固定参数算法的精确算法,其中参数为峰数,对于具有大量峰的质谱,最多只需要使用k个最强烈的峰,而其他峰则可以多次使用。
第三类是基于动态规划的方法:类似于从头肽链测序,GLYCH使用动态规划技术从串联MS质谱图中找到最可能的分支结构,仅适用于释放糖链的MS/MS谱图,无法处理糖肽数据。现有技术3将候选结构生成问题公式化为整数线性规划问题,然后用动态规划技术来推断最可能的结构。为了使计算易于管理,动态规划方法通常返回固定数量的最高评分结构,例如GLYCH报告了最高200个候选结构以进行后续评估。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111235025.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置