[发明专利]从头测序方法及装置有效
申请号: | 201611019740.5 | 申请日: | 2016-11-14 |
公开(公告)号: | CN106770605B | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 杨皓;迟浩;周文婧;何昆;曾文锋;刘超;孙瑞祥;贺思敏 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G01N27/62 | 分类号: | G01N27/62 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇;苏晓丽 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 候选肽 肽段鉴定 修饰边 测序 质谱 肽谱 修饰 匹配 肽段序列 大影响 细粒度 准确率 肽段 解析 转化 统计 发现 | ||
本发明提供了从头测序方法,其包括将待解析的谱图转化为质谱连接图,统计所述质谱连接图中各条路径的得分,提取路径得分高的前若干条普通路径和修饰路径作为候选肽段,其中,所述普通路径为仅由普通边组的路径,所述修改路径为由普通边和修饰边组成的路径且其中仅包含一条修饰边;以及对于每个候选肽段进行肽谱匹配打分,取肽谱匹配打分最高的候选肽段作为所述谱图对应的肽段。该方法可以支持上千种意外修饰的发现,而且不会对肽段鉴定的速度有较大影响。另外,还可以更细粒度地区分相似肽段序列,改善了肽段鉴定的准确率。
技术领域
本发明属于生物信息学,尤其涉及从头测序肽段的鉴定。
背景技术
蛋白质组学在最近十多年得到快速的发展,研究人员使用质谱技术用来分析生物样品时,肽段和蛋白质鉴定方法学已经成为非常关键的环节。目前,基于串联质谱数据的肽段鉴定方法主要分两类:数据库搜索方法和从头测序方法。数据库搜索方法针对每个谱图从数据库中查找所有候选肽段进行匹配打分。但如果正确肽段不在数据库中,比如新物种或者基因组未测序物种,则通常采用从头测序方法。从头测序方法不依赖于数据库,直接从谱图中获取肽段序列。
但是相比数据库搜索方法,从头测序方法候选肽段数量大,鉴定速度慢。通常,从头测序方法的候选肽段数量要比数据库搜索方法的候选肽段数量大15个量级。而且随着质谱仪精度越来越高,突变以及意外修饰成为未解析谱图的关键因素。目前大约已有上千种意外修饰。如果从头测序算法要支持这上千种意外修饰的发现,那么其所要处理的候选肽段数量至少会在现有基础上再增加两个数量级,这无疑又会大大地降低肽段鉴定速度。而且在考虑上千种意外修饰后,候选肽段之间的序列相似度非常接近甚至元素组成完全一致,很难区分相似肽段序列。
发明内容
因此,本发明的目的在于克服上述现有技术的缺陷,提供一种新的从头测序方法。
本发明的目的是通过以下技术方案实现的:
一方面,本发明提供了一种从头测序方法,包括:
将待解析的谱图转化为质谱连接图,其中所述谱图中每根谱峰被转化为所述质谱连接图的节点,在所述质谱连接图中如果两两节点之间的质量差为氨基酸质量或普通修饰质量,则这两个节点之间连接有普通边,该普通边的打分基于质量大的节点对应的谱峰的强度来确定,如果两两节点之间的质量差为意外修饰质量,则这两个节点之间连接有修饰边,该修饰边的打分基于质量大的节点对应的谱峰的强度来确定;
统计所述质谱连接图中各条路径的得分,提取路径得分高的前若干条普通路径和修饰路径作为候选肽段,其中,所述普通路径为仅由普通边组的路径,所述修改路径为由普通边和修饰边组成的路径且其中仅包含一条修饰边;
对于每个候选肽段进行肽谱匹配打分,取肽谱匹配打分最高的候选肽段作为所述谱图对应的肽段。
又一方面,本发明提供了一种从头测序方法,包括:
将待解析的谱图转化为质谱连接图,其中所述谱图中每根谱峰被转化为所述质谱连接图的节点,在所述质谱连接图中如果两两节点之间的质量差为氨基酸质量或普通修饰质量,则这两个节点之间连接有普通边,该普通边的打分基于质量大的节点对应的谱峰的强度来确定,如果两两节点之间的质量差为意外修饰质量,则这两个节点之间连接有修饰边,该修饰边的打分基于质量大的节点对应的谱峰的强度来确定;
统计所述质谱连接图中各条路径的得分,提取路径得分高的前若干条普通路径和修饰路径作为候选肽段,并记录各候选肽段的路径排名,其中,所述普通路径为仅由普通边组的路径,所述修改路径为由普通边和修饰边组成的路径且其中仅包含一条修饰边;
对于每个候选肽段进行肽谱匹配打分;
将每个候选肽段的肽谱匹配打分、路径排名及该候选肽段的修饰丰度作为特征提供给预先训练好的排序分类器来给该候选肽段进行打分,取得分最高的候选肽段作为所述谱图对应的肽段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611019740.5/2.html,转载请声明来源钻瓜专利网。