[发明专利]一种基于半监督学习的交联质谱多谱排序方法有效
申请号: | 201610905670.7 | 申请日: | 2016-10-18 |
公开(公告)号: | CN106529204B | 公开(公告)日: | 2019-05-07 |
发明(设计)人: | 尹吉澧;孟佳明;刘超;迟浩;陈镇霖;孙瑞祥;董梦秋;贺思敏 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G16B15/00 | 分类号: | G16B15/00 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇;叶北琨 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于半监督学习的交联质谱多谱排序方法,包括:1)分别对每个谱图进行单谱匹配和排序,得到对应的最优的交联二肽单谱匹配结果;提取当前每一个肽谱匹配结果的多谱匹配特征向量,其中包括SVM分数、母离子误差比例特征和修饰比例特征等动态特征;2)在所得到的交联二肽匹配结果中,取FDR在预设的FDR阈值以内的属于正样本的结果构建正样本库,取所有负样本的结果构建反样本库;基于新的训练样本更新各个多谱匹配特征向量;3)训练SVM分类器;4)用本轮训练后的SVM分类器对所有交联二肽结果进行重打分;5)根据预设的迭代条件判断是否继续进行迭代,结束迭代时基于当前SVM分数输出多谱排序结果。本发明的多谱排序方法灵敏度高且性能稳定。 | ||
搜索关键词: | 一种 基于 监督 学习 交联 质谱多谱 排序 方法 | ||
【主权项】:
1.一种基于半监督学习的交联质谱多谱排序方法,其特征在于,包括下列步骤:1)对于参与多谱排序的多个谱图,分别对每个谱图进行单谱匹配和排序,得到对应的最优的交联二肽单谱匹配结果;对于每个谱图对应的谱肽匹配结果提取相应的特征向量作为其多谱匹配特征向量,构成所述多谱匹配特征向量的特征包括:动态特征和静态特征;所述动态特征包括SVM分数、母离子误差比例特征和修饰比例特征;2)选择训练样本构建本次迭代的训练样本库,其中,在所得到的交联二肽单谱匹配结果中,取假发现率FDR在预设的FDR阈值以内的属于正样本的结果构建正样本库,取所有负样本的结果构建反样本库;然后,基于所选择的训练样本更新各个交联二肽单谱匹配结果的多谱匹配特征向量;3)利用本次迭代的训练样本库训练SVM分类器;4)用本轮训练后的SVM分类器对所有交联二肽结果进行重打分;5)根据预设的迭代条件判断是否继续进行迭代,如果是,则返回步骤2)进行新的迭代,如果否,则输出基于当前SVM分数的多谱排序结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610905670.7/,转载请声明来源钻瓜专利网。