[发明专利]基于深度学习的白细胞抗原与多肽结合亲和力预测方法在审
申请号: | 202010732369.7 | 申请日: | 2020-07-27 |
公开(公告)号: | CN111951887A | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 叶一林;万季;汪健;徐韵婉;潘有东;王奕;宋麒 | 申请(专利权)人: | 深圳市新合生物医疗科技有限公司 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B40/00;G06N3/04;G06N3/08 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 安琪 |
地址: | 518055 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 白细胞 抗原 多肽 结合 亲和力 预测 方法 | ||
本发明提供一种基于深度学习的白细胞抗原与多肽结合亲和力预测方法,包括:步骤S101:对人类白细胞抗原序列进行编码;步骤S102:构建人类白细胞抗原序列与肽段对序列;步骤S103:构建人类白细胞抗原序列与肽链对编码矩阵;步骤S104:人类白细胞抗原与肽段结合的亲和力预测模型构建。本发明综合考虑了人类白细胞抗原蛋白序列与肽段各自的序列对亲和力强度的影响,开发了一种基于深度学习的白细胞抗原与多肽结合亲和力预测方法。
技术领域
本发明涉及免疫治疗和人工智能技术领域,特别涉及一种基于深度学习的白细胞抗原与多肽结合亲和力预测方法。
背景技术
目前,人类白细胞抗原与多肽的结合对于表位多肽的递呈到细胞表面并激活随后的T细胞免疫反应具有非常重要的作用。通过构建机器学习模型来预测人类白细胞抗原和多肽的结合亲和力已经成功被应用于免疫治疗的靶标选择。一般来说人类白细胞抗原与多肽的结合预测可以分为抗原亚型特异和泛抗原亚型两种方法。抗原亚型特异方法需要为每一种人类白细胞抗原亚型构建预测模型。另一方面,泛人类白细胞抗原亚型方法可以通过整合白细胞抗原核心区域进行编码,从而对所有的人类白细胞抗原亚型及多肽进行亲和力预测。在过去的若干年中,人类白细胞抗原与多肽结合的实验数据以及机器学习算法共同提高了结合力的预测精度。然而现有的方法由于实验数据的偏向性(与人类白细胞抗原I型A和B类相比,I型C类的实验数据量相对较少),对于I型C类的预测精度有待进一步提高。同时由于I型人类白细胞抗原结合的多肽的长度为8个氨基酸至15个氨基酸,现有算法对于相对较长的多肽(12到15个氨基酸)的预测精度远次于短多肽。因此开发精度更高的人类白细胞抗原与多肽的结合力预测算法具有重要的临床意义。
发明内容
针对存在的上述问题,本发明综合考虑了人类白细胞抗原蛋白序列与肽段各自的序列对亲和力强度的影响,开发了一种基于深度学习的白细胞抗原与多肽结合亲和力预测方法。
本发明实施例提供的一种基于深度学习的白细胞抗原与多肽结合亲和力预测方法,包括:
步骤S101:对人类白细胞抗原序列进行编码;
步骤S102:构建人类白细胞抗原序列与肽段对序列;
步骤S103:构建人类白细胞抗原序列与肽链对编码矩阵;
步骤S104:人类白细胞抗原与肽段结合的亲和力预测模型构建。
优选的,步骤S104:人类白细胞抗原与肽段结合的亲和力预测模型构建,包括:
步骤S201:捕获编码矩阵序列信息;
步骤S202:从多个角度为氨基酸分配权重;
步骤S203:计算人类白细胞抗原序列-肽段的亲和力。
优选的,步骤S201:捕获编码矩阵序列信息,包括:
将所述编码矩阵序列中的每一个氨基酸视为所述人类白细胞抗原序列中的一个结点;
将所述结点的编码向量依次送入双向长短期记忆网络中;所述双向长短期记忆网络可以分别按照所述编码矩阵序列的正向与逆向顺序对所述编码矩阵序列进行特征学习。
优选的,步骤S202:从多个角度为氨基酸分配权重,包括:
通过多头注意力机制将所述编码矩阵序列的特征映射至多个特征空间,并分别计算在每个特征空间下各氨基酸的注意力权重来量化各氨基酸对人类白细胞抗原序列与肽段关联的重要性。
在多个子空间下,我们能得到每个特征空间下各氨基酸的注意力权重。为了将各个特征空间的权重进行整合,我们还通过一个滤片尺寸为head*1*1的卷积神经网络单独为每个特征空间分配权重,随后分别对于每个氨基酸的多个注意力权重进行加权求和,从而得到序列的重要性向量,公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市新合生物医疗科技有限公司,未经深圳市新合生物医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010732369.7/2.html,转载请声明来源钻瓜专利网。