[发明专利]从头测序方法及装置有效
申请号: | 201611019740.5 | 申请日: | 2016-11-14 |
公开(公告)号: | CN106770605B | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 杨皓;迟浩;周文婧;何昆;曾文锋;刘超;孙瑞祥;贺思敏 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G01N27/62 | 分类号: | G01N27/62 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇;苏晓丽 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 候选肽 肽段鉴定 修饰边 测序 质谱 肽谱 修饰 匹配 肽段序列 大影响 细粒度 准确率 肽段 解析 转化 统计 发现 | ||
1.一种从头测序方法,包括:
将待解析的谱图转化为质谱连接图,其中所述谱图中每根谱峰被转化为所述质谱连接图的节点,在所述质谱连接图中如果两两节点之间的质量差为氨基酸质量或普通修饰质量,则这两个节点之间连接有普通边,该普通边的打分基于质量大的节点对应的谱峰的强度来确定,如果两两节点之间的质量差为意外修饰质量,则这两个节点之间连接有修饰边,该修饰边的打分基于质量大的节点对应的谱峰的强度来确定;
统计所述质谱连接图中各条路径的得分,提取路径得分高的前若干条普通路径和修饰路径作为候选肽段,其中,所述普通路径为仅由普通边组的路径,所述修饰路径为由普通边和修饰边组成的路径且其中仅包含一条修饰边;
对于每个候选肽段进行肽谱匹配打分,取肽谱匹配打分最高的候选肽段作为所述谱图对应的肽段。
2.一种从头测序方法,包括:
将待解析的谱图转化为质谱连接图,其中所述谱图中每根谱峰被转化为所述质谱连接图的节点,在所述质谱连接图中如果两两节点之间的质量差为氨基酸质量或普通修饰质量,则这两个节点之间连接有普通边,该普通边的打分基于质量大的节点对应的谱峰的强度来确定,如果两两节点之间的质量差为意外修饰质量,则这两个节点之间连接有修饰边,该修饰边的打分基于质量大的节点对应的谱峰的强度来确定;
统计所述质谱连接图中各条路径的得分,提取路径得分高的前若干条普通路径和修饰路径作为候选肽段,并记录各候选肽段的路径排名,其中,所述普通路径为仅由普通边组的路径,所述修饰路径为由普通边和修饰边组成的路径且其中仅包含一条修饰边;
对于每个候选肽段进行肽谱匹配打分;
将每个候选肽段的肽谱匹配打分、路径排名及该候选肽段的修饰丰度作为特征提供给预先训练好的排序分类器来给该候选肽段进行打分,取得分最高的候选肽段作为所述谱图对应的肽段。
3.根据权利要求1或2所述的方法,其中两个节点之间普通边的打分为质量大的节点对应的谱峰的强度取以自然数为底的对数,两个节点之间修饰边的打分为质量大的节点对应的谱峰的强度取以自然数为底的对数。
4.根据权利要求1或2所述的方法,其中两个节点之间的修饰边的打分为质量大的节点对应的谱峰的强度乘以该修饰边对应的意外修饰的丰度,其中该意外修饰的丰度为该修饰边连接的两个节点之间相差的意外修饰质量对应的意外修饰可能出现的概率或频度。
5.根据权利要求4所述的方法,其中修饰边对应的意外修饰的丰度等于在该修饰边连接的两个节点之间相差的意外修饰质量在所述质谱连接图的所有节点之间出现的次数除以所述质谱连接图中修饰边的总数。
6.根据权利要求4所述的方法,其中意外修饰的丰度是预先设定的。
7.根据权利要求6所述的方法,还包括通过下面的方式来设定某种意外修饰的丰度:
随机提取多个现有谱图,统计其中某种意外修饰出现的次数;
将该种意外修饰在所述多个谱图中出现的次数与所有意外修饰在所述谱图中出现次数总和的比值作为该种意外修饰的丰度。
8.根据权利要求1或2所述的方法,其中将所述谱图中每根谱峰转化成质谱连接图中的两个节点,其中一个节点对应b离子,另一个节点对应y离子。
9.根据权利要求8所述的方法,其中对于每根谱峰,对应b离子的节点质量为该谱峰质量减去1,对应y离子的节点质量为所述谱图中母离子的质量减去该谱峰质量和1个水分子质量。
10.根据权利要求4所述的方法,其中对于每个候选肽段,如果该候选肽段来自普通路径,则其修饰丰度为1;如果该候选肽段来自修饰路径,则其修饰丰度为该修饰路径中修饰边对应的意外修饰的丰度。
11.根据权利要求10所述的方法,其中所述排序分类器是以一组已知其对应肽段和修饰的谱图为样本集,以从各样本提取的肽段的肽谱匹配打分、路径排名和修饰丰度为特征来训练的。
12.一种从头测序装置,包括:
转化单元,用于将待解析的谱图转化为质谱连接图,其中所述谱图中每根谱峰被转化为所述质谱连接图的节点,在所述质谱连接图中如果两两节点之间的质量差为氨基酸质量或普通修饰质量,则这两个节点之间连接有普通边,该普通边的打分基于质量大的节点对应的谱峰的强度来确定,如果两两节点之间的质量差为意外修饰质量,则这两个节点之间连接有修饰边,该修饰边的打分基于质量大的节点对应的谱峰的强度来确定;
路径提取单元,用于统计所述质谱连接图中各条路径的得分,提取路径得分高的前若干条普通路径和修饰路径作为候选肽段,其中,所述普通路径为仅由普通边组的路径,所述修饰路径为由普通边和修饰边组成的路径且其中仅包含一条修饰边;
匹配打分单元,用于对于每个候选肽段进行肽谱匹配打分,取肽谱匹配打分最高的候选肽段作为所述谱图对应的肽段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611019740.5/1.html,转载请声明来源钻瓜专利网。