[发明专利]基于表位保守性的免疫多肽组鉴定方法在审
| 申请号: | 202011457825.8 | 申请日: | 2020-12-11 |
| 公开(公告)号: | CN114694743A | 公开(公告)日: | 2022-07-01 |
| 发明(设计)人: | 张乐;邱思;李京宇;李波 | 申请(专利权)人: | 深圳吉诺因生物科技有限公司;武汉华大吉诺因生物科技有限公司 |
| 主分类号: | G16B15/20 | 分类号: | G16B15/20;G16B35/20;G06N20/00;G06K9/62;G06F16/22 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 周慧云 |
| 地址: | 518083 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 保守 免疫 多肽 鉴定 方法 | ||
本发明涉及生物信息领域,具体地,本发明涉及基于表位保守性的免疫多肽组鉴定方法。本发明提供的基于表位保守性的免疫多肽组鉴定方法,通过自适应启发式学习免疫多肽组序列的氨基酸位点保守性,解决免疫多肽组“无酶”特性造成的搜库空间过大,并由此引发的质谱搜库鉴定灵敏度过低的问题。通过将一轮搜库结果纳入上述特异性免疫多肽组数据库中,并进行二轮搜库,基于经典目标诱饵库策略进行质控,解决现有技术方案普遍缺乏可信FDR的问题。
技术领域
本发明涉及生物信息领域,具体地,本发明涉及基于表位保守性的免疫多肽组鉴定方法。
背景技术
由I类和II类人类白细胞抗原(Human leukocyte antigen,HLA)分子呈递到细胞表面的短肽的集合被称为免疫多肽组,对基础科研和转化医学具有重要意义。对于基础科研而言,对免疫肽组的全面分析有助于理解免疫系统的关键组成部分。对于转化医学而言,对免疫肽组的确切了解可以直接推动和指导针对自身免疫疾病,传染性疾病和癌症的新一代疫苗和细胞免疫疗法的发展。
免疫多肽组的发现主要基于高通量质谱鉴定技术。目前应用于免疫多肽组质谱数据分析的软件和工具,最初都是为传统的自上而下蛋白质组学所开发的。这些软件和工具通过将质谱二级谱图与参考蛋白序列进行匹配完成质谱数据鉴定。然而,免疫多肽组与传统蛋白组相差较大,传统蛋白组样本制备中需采用胰蛋白酶进行酶切,软件进行算法匹配时,只需将参考蛋白序列经胰蛋白酶电子酶切生成的肽段加入搜库空间(Search Space),可能性有限,经匹配打分后进行显著性检验即可鉴定得到高可信度肽段。然而,免疫多肽组样本中的短肽序列来源于细胞内蛋白酶体的非特异性酶切,参考蛋白序列所包含的长度合适的所有肽段均需加入搜库空间,造成搜库空间的过度膨胀。过大的搜库空间增加了肽段谱图匹配(Peptide spectrum match,PSM)的候选数目,减小了肽段谱图匹配之间的分数区分度,干扰了质控的统计学效应,高估了错误发现率(False Discovery Rate,FDR),进而降低了鉴定结果的灵敏度。另外,越来越多免疫多肽组的全新产生机制和来源被阐明,例如免疫多肽组可能来源于非编码区,可能经历蛋白酶体的剪接作用等等。这进一步加剧了搜库空间的膨胀,进一步降低了鉴定的灵敏度,甚至使搜库鉴定难以进行。
因此,亟需开发一种新的准确度高的免疫多肽组鉴定方法。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明提供一种基于表位保守性的免疫多肽组鉴定方法,通过自适应启发式学习免疫多肽组序列的氨基酸位点保守性,解决免疫多肽组“无酶”特性造成的搜库空间过大,并由此引发的质谱搜库鉴定灵敏度过低的问题。通过将一轮搜库结果纳入上述特异性免疫多肽组数据库中,并进行二轮搜库,基于经典目标诱饵库策略进行质控,解决现有技术方案普遍缺乏可信FDR的问题。
为此,本发明第一方面提供一种免疫多肽组鉴定方法。根据本发明的实施例,所述方法包括:
(1)将来自待测样本的免疫多肽组质谱数据与参考蛋白库进行一次搜库鉴定,并选择高可信度肽段构成搜库集合1,所述参考蛋白库含有多个已知的蛋白质序列;
(2)基于所述搜库集合1作为训练集,构建机器学习模型,所述机器学习用于预测所述肽段属于预定的蛋白质类型;
(3)将所述参考蛋白库中的蛋白质序列切分为肽段序列,以便形成候选多肽库,采用所述机器学习模型对所述候选多肽库进行预测打分,按照所述分数对所述候选多肽库进行过滤,过滤获得的肽段作为子库1;
(4)将所述搜库集合1与所述子库1进行合并,以便获得特异性多肽库;
(5)将所述免疫多肽组质谱数据的至少一部分与所述特异性多肽库进行二次搜库鉴定,以便获得最终肽段,所述最终肽段属于预定的蛋白质类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳吉诺因生物科技有限公司;武汉华大吉诺因生物科技有限公司,未经深圳吉诺因生物科技有限公司;武汉华大吉诺因生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011457825.8/2.html,转载请声明来源钻瓜专利网。





