[发明专利]一种预测抗体重链轻链配对概率的方法及其应用有效
| 申请号: | 201910730394.9 | 申请日: | 2019-08-08 |
| 公开(公告)号: | CN110428870B | 公开(公告)日: | 2023-03-21 |
| 发明(设计)人: | 吴婷婷;侯强波;蔡晓辉;杨平 | 申请(专利权)人: | 苏州泓迅生物科技股份有限公司 |
| 主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B40/00 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 巩克栋 |
| 地址: | 215123 江苏省苏州市苏州工业*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 预测 抗体 重链轻链 配对 概率 方法 及其 应用 | ||
1.一种预测抗体重链轻链配对概率的方法,其特征在于,所述方法包括如下步骤:将已知配对信息的抗体样本重链、轻链的氨基酸序列特征转换为数字信号后,输入卷积神经网络中进行训练,获得最终的模型参数,再利用该模型参数对待预测的抗体重链轻链的配对概率进行预测;
所述获得最终的模型参数的方法具体包括如下步骤:
(1)获取抗体样本的重链、轻链氨基酸序列配对信息,作为基础样本;
(2)将基础样本分成第一部分和第二部分,提取第一部分基础样本的氨基酸序列特征、位点特异性打分矩阵特征、抗体CDR3区长度特征、氨基酸二级结构特征和氨基酸的溶液可及性特征,将上述特征进行信息汇总,得到一个包含抗体样本信息的数据集,作为训练集;
(3)提取第二部分基础样本的氨基酸序列特征、位点特异性打分矩阵特征、抗体CDR3区长度特征、氨基酸二级结构特征和氨基酸的溶液可及性特征,将上述特征进行信息汇总,得到一个包含抗体样本信息的数据集,作为测试集;
(4)获取阳性数据集和阴性数据集;
(5)将训练集输入卷积神经网络,进行卷积神经网络训练;
(6)输出配对信息并优化卷积神经网络训练的目标函数,得到全卷积神经网络的权重和偏置,获得最终的模型参数。
2.如权利要求1所述的预测抗体重链轻链配对概率的方法,其特征在于,所述基础样本的获取方式为:先获取未配对重链、轻链可变区的全基因序列信息,再获取抗体样本基因配对信息,对上述信息进行处理,得到抗体样本的重链、轻链氨基酸序列配对信息。
3.如权利要求1所述的预测抗体重链轻链配对概率的方法,其特征在于,所述氨基酸序列特征的提取方式为:
将一种氨基酸定义为一种二十位二进制数,进而将一种氨基酸序列定义为一个[x×20]的矩阵数据,其中x表示抗体重链或轻链氨基酸序列中氨基酸的个数。
4.如权利要求1所述的预测抗体重链轻链配对概率的方法,其特征在于,所述位点特异性打分矩阵特征的提取方式为:
将位点特异性打分矩阵定义为一个如下式所示的[L×20]的矩阵,其中L表示抗体重链或轻链氨基酸序列的长度;使用PSI-BLAST工具计算基础样本的位点特异性打分矩阵;然后将PSSM矩阵的行列所得到的值,利用sigmoid函数变换到0-1区间;
其中,Ei-j表示氨基酸序列的第i个氨基酸在进化中突变为氨基酸j的概率log值,j=1-20分别为按字母排列的20种天然氨基酸。
5.如权利要求1所述的预测抗体重链轻链配对概率的方法,其特征在于,所述抗体CDR3区长度特征的提取方式为:将抗体CDR3区的氨基酸个数定义为不同的七位二进制数,由此提取抗体CDR3区长度特征。
6.如权利要求1所述的预测抗体重链轻链配对概率的方法,其特征在于,所述氨基酸二级结构特征的提取方式为:使用SCRATCH工具预测氨基酸序列中每个氨基酸的二级结构,并将三种二级结构定义为三种不同的三位二进制数,由此提取氨基酸二级结构特征。
7.如权利要求1所述的预测抗体重链轻链配对概率的方法,其特征在于,所述氨基酸的溶液可及性特征的提取方式为:
使用SCRATCH工具预测氨基酸序列中每个氨基酸的溶液可及性,并将两种状态定义为两种不同的二位二进制数,由此提取氨基酸的溶液可及性特征。
8.如权利要求1所述的预测抗体重链轻链配对概率的方法,其特征在于,所述将上述特征进行信息汇总的方法为:
将提取到的氨基酸序列特征、位点特异性打分矩阵特征、抗体CDR3区长度特征、氨基酸二级结构特征和氨基酸的溶液可及性特征进行汇总,将汇总信息定义为一个五十二位二进制数,进而将一种氨基酸序列定义为一个[y×52]的矩阵数据,其中y表示抗体重链或轻链氨基酸序列中氨基酸的个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州泓迅生物科技股份有限公司,未经苏州泓迅生物科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910730394.9/1.html,转载请声明来源钻瓜专利网。





