[发明专利]一种肿瘤新抗原预测方法、预测装置及存储介质有效
| 申请号: | 202010587400.2 | 申请日: | 2020-06-24 |
| 公开(公告)号: | CN111798919B | 公开(公告)日: | 2022-11-25 |
| 发明(设计)人: | 石毅;贺光 | 申请(专利权)人: | 上海交通大学 |
| 主分类号: | G16B5/00 | 分类号: | G16B5/00;G06N3/04;G06N3/08;G16B20/30;G16B20/50;G16B45/00 |
| 代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 翁惠瑜 |
| 地址: | 200240 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 肿瘤 抗原 预测 方法 装置 存储 介质 | ||
1.一种基于染色质高级构象与深度稀疏学习的肿瘤新抗原预测方法,其特征在于,该方法通过一经训练的基于组特征选择的深度神经网络预测模型对待预测对象进行处理,获得与所述待预测对象对应的肿瘤新抗原免疫原性信息;
其中,所述深度神经网络预测模型进行训练时采用的每个样本的特征集合由染色质3D构象信息与其他基于多肽氨基酸序列产生的特征组合而成,所述染色质3D构象信息采用基于分子动力学的人类基因组三维构象建模方法获得,样本的每个特征都属于某个组,在所述神经网络模型训练中,某一组内的特征或者全部被选中,或者全部被剔除;
所述每个样本的特征包括目标肽对应DNA位点在染色质3D空间上的x,y,z3D坐标、目标肽对应DNA位点距离细胞核中心或细胞核膜的距离、递呈抗原肽的MHC分子的HLA亚型编码、20种氨基酸在目标肽中的出现频率、抗原肽序列的氨基酸稀疏编码、抗原肽序列的氨基酸BLOSM编码、抗原肽序列的氨基酸BLOMAP编码、抗原肽序列的氨基酸侧链分类编码、抗原肽序列的氨基酸侧链极性编码、抗原肽序列的氨基酸侧链电荷编码、抗原肽序列的氨基酸侧链亲疏水性编码、抗原肽序列的氨基酸侧链分子量编码、抗原肽序列的氨基酸侧链在生物种群中的出现频率编码和基于AAindex数据库中所列的所有氨基酸AAindex指标的编码。
2.根据权利要求1所述的基于染色质高级构象与深度稀疏学习的肿瘤新抗原预测方法,其特征在于,每个所述样本的特征数量级为数千个级。
3.根据权利要求1所述的基于染色质高级构象与深度稀疏学习的肿瘤新抗原预测方法,其特征在于,所述基于组特征选择的深度神经网络预测模型的输出包括对潜在新抗原肿瘤免疫原性的预测以及与该新抗原关联度最高的若干个特征。
4.根据权利要求1所述的基于染色质高级构象与深度稀疏学习的肿瘤新抗原预测方法,其特征在于,所述基于组特征选择的深度神经网络预测模型采用全连接层形式。
5.根据权利要求1所述的基于染色质高级构象与深度稀疏学习的肿瘤新抗原预测方法,其特征在于,所述染色质3D构象信息来源于通过Hi-C实验获得的细胞染色质3D构象热力图矩阵。
6.根据权利要求1所述的基于染色质高级构象与深度稀疏学习的肿瘤新抗原预测方法,其特征在于,所述染色质3D构象信息由公开Hi-C数据集获取。
7.根据权利要求1所述的基于染色质高级构象与深度稀疏学习的肿瘤新抗原预测方法,其特征在于,所述基于多肽氨基酸序列产生的特征包括含氨基酸突变位点的多肽特征和具有包含了该突变的基因的高表达信息。
8.一种基于染色质高级构象与深度稀疏学习的肿瘤新抗原预测装置,其特征在于,包括:
数据获取单元,获取用于训练的样本,每个样本的特征集合由染色质3D构象信息与其他基于多肽氨基酸序列产生的特征组合而成,所述染色质3D构象信息采用基于分子动力学的人类基因组三维构象建模方法获得;
模型训练单元,基于所述样本训练获得一基于组特征选择的深度神经网络预测模型,样本的每个特征都属于某个组,在神经网络模型训练中,某一组内的特征或者全部被选中,或者全部被剔除;
预测单元,获取待预测对象,通过所述基于组特征选择的深度神经网络预测模型对待预测对象进行处理,获得与所述待预测对象对应的肿瘤新抗原免疫原性信息;
所述每个样本的特征包括目标肽对应DNA位点在染色质3D空间上的x,y,z3D坐标、目标肽对应DNA位点距离细胞核中心或细胞核膜的距离、递呈抗原肽的MHC分子的HLA亚型编码、20种氨基酸在目标肽中的出现频率、抗原肽序列的氨基酸稀疏编码、抗原肽序列的氨基酸BLOSM编码、抗原肽序列的氨基酸BLOMAP编码、抗原肽序列的氨基酸侧链分类编码、抗原肽序列的氨基酸侧链极性编码、抗原肽序列的氨基酸侧链电荷编码、抗原肽序列的氨基酸侧链亲疏水性编码、抗原肽序列的氨基酸侧链分子量编码、抗原肽序列的氨基酸侧链在生物种群中的出现频率编码和基于AAindex数据库中所列的所有氨基酸AAindex指标的编码。
9.一种计算机可读存储介质,其特征在于,包括计算机程序,所述计算机程序能够被处理器执行以实现如权利要求1-7任一所述的预测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010587400.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种模型训练以及视觉定位方法及装置
- 下一篇:一种抽屉式可调节隐蔽承放机构





