[发明专利]基于表位保守性的免疫多肽组鉴定方法在审
| 申请号: | 202011457825.8 | 申请日: | 2020-12-11 |
| 公开(公告)号: | CN114694743A | 公开(公告)日: | 2022-07-01 |
| 发明(设计)人: | 张乐;邱思;李京宇;李波 | 申请(专利权)人: | 深圳吉诺因生物科技有限公司;武汉华大吉诺因生物科技有限公司 |
| 主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B35/20;G06N20/00;G06K9/62;G06F16/22 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 周慧云 |
| 地址: | 518083 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 保守 免疫 多肽 鉴定 方法 | ||
1.一种免疫多肽组鉴定方法,其特征在于,包括:
(1)将来自待测样本的免疫多肽组质谱数据与参考蛋白库进行一次搜库鉴定,并选择高可信度肽段构成搜库集合1,所述参考蛋白库含有多个已知的蛋白质序列;
(2)基于所述搜库集合1作为训练集,构建机器学习模型,所述机器学习用于预测所述肽段属于预定的蛋白质类型;
(3)将所述参考蛋白库中的蛋白质序列切分为肽段序列,以便形成候选多肽库,采用所述机器学习模型对所述候选多肽库进行预测打分,按照所述分数对所述候选多肽库进行过滤,过滤获得的肽段作为子库1;
(4)将所述搜库集合1与所述子库1进行合并,以便获得特异性多肽库;
(5)将所述免疫多肽组质谱数据的至少一部分与所述特异性多肽库进行二次搜库鉴定,以便获得最终肽段,所述最终肽段属于预定的蛋白质类型。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述搜库集合1中肽段进行降维聚类,聚类完成后,选取最优聚类数结果,剔除离群肽段,将其他各个聚类肽段作为训练集,训练机器学习模型。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括在二次搜库的基础上,重复步骤(2)~(5),进行多次搜库,直至鉴定量达到饱和。
4.根据权利要求1所述的方法,其特征在于,所述机器学习的特征维度包括氨基酸序列、多肽mRNA表达量、多肽亲疏水性、热稳定性,
任选地,所述机器学习模型的数据来源还包括多批次同类型的鉴定结果和/或外部数据,
任选地,在步骤(3)中,利用所述机器学习模型过滤所述参考蛋白库的阈值依据得分百分比、背景序列得分估算或序列得分分布情况。
5.根据权利要求1所述的方法,其特征在于,所述方法包括:
(1)将免疫多肽组质谱数据与参考蛋白库进行一次搜库鉴定,保留FDR=1%的可信度肽段,获得搜库集合1;
(2)将所述搜库集合1中肽段进行GibbsCluster聚类,聚类完成后,选取最优聚类数结果,剔除离群肽段,将其他各个聚类肽段作为训练集,训练PSSM模型;
(3)将所述参考蛋白库切分为肽段序列,形成候选多肽库,采用所述PSSM模型对所述候选多肽库进行预测打分,按照肽段所得分数进行过滤,保留PSSM Score=0.4的肽段,将过滤获得的肽段记为子库1;
(4)将所述搜库集合1与所述子库1合并,获得特异性多肽库;
(5)将所述免疫多肽组质谱数据中的至少一部分与所述特异性多肽库进行二次搜库鉴定,获得最终鉴定肽段。
6.根据权利要求5所述的方法,其特征在于,在步骤(1)中,进行所述一次搜库鉴定时,设置酶切方式为非特异性酶切,
任选地,将搜库所得肽段序列剔除常见污染肽、诱饵肽序列,之后再进行FDR过滤,
任选地,将二次搜库所得肽段序列剔除常见污染肽、诱饵肽序列,之后再进行FDR过滤。
7.一种免疫多肽组鉴定系统,其特征在于,包括:
搜库单元,所述搜库单元用于将免疫多肽组质谱数据在参考蛋白库中进行搜库鉴定,根据可信度筛选肽段,获得搜库集合1;
机器学习单元,所述机器学习单元用于将所述搜库集合1中肽段进行降维聚类,聚类完成后,选取最优聚类数结果,剔除离群肽段,将其他各个聚类肽段作为训练集,训练机器学习模型;
特异性多肽库生成单元,所述特异性多肽库生成单元用于将所述参考蛋白库切分为肽段序列,形成候选多肽库,采用所述机器学习模型对所述候选多肽库进行预测打分,按照肽段所得分数进行过滤,将过滤获得的肽段记为子库1,将搜库集合1与字库1合并,获得特异性多肽库;
二次搜库单元,所述二次搜库单元用于将所述免疫多肽组质谱数据与所述特异性多肽库进行二次搜库鉴定,获得最终鉴定肽段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳吉诺因生物科技有限公司;武汉华大吉诺因生物科技有限公司,未经深圳吉诺因生物科技有限公司;武汉华大吉诺因生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011457825.8/1.html,转载请声明来源钻瓜专利网。





