[发明专利]一种训练分子结合模型的方法、分子筛选方法及装置在审
申请号: | 202111213797.X | 申请日: | 2021-10-19 |
公开(公告)号: | CN114283899A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 卞亚涛;徐挺洋 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G16C20/30 | 分类号: | G16C20/30;G16C20/20;G16C20/70;G16C20/64 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 朱佳 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 训练 分子 结合 模型 方法 筛选 装置 | ||
1.一种训练分子结合模型的方法,其特征在于,包括:
获得各个样本蛋白质分子各自的蛋白质特征信息,以及获得各个样本备选分子各自的分子特征信息;
基于各个蛋白质特征信息和各个分子特征信息,对待训练的分子结合模型进行多轮迭代训练,直到所述待训练的分子结合模型的训练损失满足训练目标时,输出所述待训练的分子结合模作为目标分子结合模型,其中,针对多轮迭代训练,分别执行以下操作:
采用所述待训练的分子结合模型,基于蛋白质特征信息和分子特征信息,确定所述样本蛋白质分子与所述样本备选分子之间的结合活性特征信息、嵌入特征信息和共晶特征信息,其中,所述结合活性特征信息用于表征所述样本蛋白质分子与所述样本备选分子进行虚拟结合后的活性,所述嵌入特征信息用于表征所述样本蛋白质分子与所述样本备选分子之间的结合程度,所述共晶特征信息用于表征所述样本蛋白质分子和所述样本备选分子之间是否存在共晶结构,所述待训练的分子结合模型用于预测;
基于所述结合活性特征信息、所述嵌入特征信息和所述共晶特征信息,确定所述待训练的分子结合模型的训练损失。
2.根据权利要求1所述的方法,其特征在于,获得各个样本蛋白质分子的蛋白质特征信息,以及获得各个样本备选分子的分子特征信息,包括:
获得训练样本集合,其中,所述训练样本集合包括各个训练样本,每个训练样本包括样本蛋白质分子和样本备选分子;
采用特征提取模型,分别对所述各个训练样本进行特征提取处理,获得各个样本蛋白质分子各自的蛋白质特征信息,以及各个样本备选分子各自的分子特征信息。
3.根据权利要求2所述的方法,其特征在于,采用特征提取模型,分别对所述各个训练样本进行特征提取处理,获得各个样本蛋白质分子各自的蛋白质特征信息,以及各个样本备选分子各自的分子特征信息,包括:
针对所述各个训练样本,分别执行以下操作:
基于训练样本中的样本蛋白质分子,确定所述样本蛋白质分子的邻接矩阵,其中,所述样本蛋白质分子的邻接矩阵用于表征所述样本蛋白质分子包含的各个样本氨基酸分子,以及每两个样本氨基酸分子之间的分子结构距离;
基于所述训练样本中的样本备选分子,确定所述样本备选分子的邻接矩阵,其中,所述样本备选分子的邻接矩阵用于表征所述样本备选分子包含的各个样本备选原子,以及,所述各个样本备选原子之间的化学键结构;
分别对所述样本蛋白质分子的邻接矩阵和所述样本备选分子的邻接矩阵进行特征提取处理,获得所述样本蛋白质分子的蛋白质特征信息,以及所述样本备选分子的分子特征信息。
4.根据权利要求1所述的方法,其特征在于,采用所述待训练的分子结合模型,基于蛋白质特征信息和分子特征信息,确定所述样本蛋白质分子与所述样本备选分子之间的嵌入特征信息和共晶特征信息,包括:
基于所述蛋白质特征信息和所述分子特征信息,预测所述样本蛋白质分子与所述样本备选分子进行虚拟结合后,所述样本蛋白质分子包含的各个样本氨基酸分子,与所述样本备选分子包含的各个样本备选原子之间的结合距离;
基于获得的各个结合距离,确定所述样本蛋白质分子与所述样本备选分子之间的嵌入特征信息和共晶特征信息。
5.根据权利要求4所述的方法,其特征在于,基于获得的各个结合距离,确定所述样本蛋白质分子与所述样本备选分子之间的嵌入特征信息和共晶特征信息,包括:
基于指定样本氨基酸分子与各个样本备选原子之间取值最小的结合距离,确定所述样本蛋白质分子与所述样本备选分子之间的嵌入特征信息;
基于各个样本氨基酸分子、各个样本备选原子和各个氨基酸分子与各个样本备选原子之间的结合距离,确定所述样本蛋白质分子与所述样本备选分子之间的共晶特征信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111213797.X/1.html,转载请声明来源钻瓜专利网。