[发明专利]一种用于DTA预测的多模态信息融合模型及方法在审
申请号: | 202310188140.5 | 申请日: | 2023-03-02 |
公开(公告)号: | CN116206688A | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 欧阳纯萍;刘永彬;张琳琳;万亚平;田纹龙;余颖 | 申请(专利权)人: | 南华大学 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B15/30;G06N3/0455;G06N3/0464;G06N3/08;G06N3/048;G06N3/047 |
代理公司: | 长沙新裕知识产权代理有限公司 43210 | 代理人: | 颜田庆 |
地址: | 421001 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 dta 预测 多模态 信息 融合 模型 方法 | ||
1.一种用于DTA预测的多模态信息融合模型,其特征在于,包括药物分子结构信息编码器、靶标结构信息编码器、多模态平衡模块和药物靶标融合模块;
所述药物分子结构信息编码器使用Transformer模型对药物字符串模态信息进行编码,并使用GIN模型提取药物图模态信息特征;
所述靶标结构信息编码器使用Transformer模型对靶标字符串模态信息进行编码,并使用GCN模型提取药物图模态信息特征;
所述多模态平衡模块使用对比学习的方法将药物字符串和图模态信息进行平衡与整合,以及将靶标字符串和图模态信息进行平衡与整合;
所述药物靶标融合模块将多模态平衡模块得到的药物和靶标的两种模态特征连接起来,用于DTA预测。
2.一种用于DTA预测的多模态信息融合方法,其特征在于,包括:
步骤S1,字符串模态的嵌入;
将药物SMILES代码视为字符串,对其进行整数编码,融入该编码的位置编码得到向量表示,通过Transformer模型对该向量进行特征提取得到SMILES字符串的最终向量表示;
将靶标序列视为字符串,对其进行整数编码,融入该编码的位置编码得到向量表示,通过Transformer模型对该向量进行特征提取得到靶标字符串的最终向量表示;
步骤S2,图模态的嵌入;
将每个原子作为药物分子图中的节点,原子间的联系作为药物分子图的邻接矩阵,并将原子的属性作为药物分子图节点的属性特征;将药物分子图和其节点的特征向量作为输入,通过GIN模型进行节点嵌入,得到药物分子图的表示向量;
将每个残基作为靶标结构图中的节点,残基对间是否接触的概率作为靶标结构图的邻接矩阵,并将每个残基位置通过序列比对结果进行评分,作为靶标结构图节点的属性特征;将靶标结构图和其节点的特征向量作为输入,通过GCN模型进行节点嵌入,得到靶标结构图的表示向量;
步骤S3,多模态表示的对比学习和表示的融合;
通过最大化字符串模态和图模态的一致性来学习特征表示,分别得到药物和靶标的两种模态最终的表示之后,将其进行拼接,得到用于DTA预测的药物和靶标模态信息。
3.根据权利要求2所述的用于DTA预测的多模态信息融合方法,其特征在于:步骤S1中,在对药物和靶标字符串进行整数编码之后,利用药物原子和靶标残基的排列信息来捕获字符串模态的位置信息,并通过Transformer模型从输入中学习不同级别的抽象特征,再应用最大池化层来获得药物和靶标字符串的最终向量表示。
4.根据权利要求3所述的用于DTA预测的多模态信息融合方法,其特征在于:步骤S1中,采用如下公式表示字符串模态的位置信息:
PE(pos,2i)=sin(pos/100002i/dmodel) (1)
PE(pos,2i+1)=cos(pos/100002i/dmodel) (2)
其中,pos代表字符串中的字符,i是字符编码的维度,dmodel是该字符的编码。
5.根据权利要求4所述的用于DTA预测的多模态信息融合方法,其特征在于:所述Transformer模型包括一个MSA层和一个MLP块,所述MSA层的函数表示为:
zm=MSA(LN(zl-1))+zl-1,l=1...L (3)
其中,zl-1表示MSA层的输入,zm表示MSA的输出,LN表示归一化层,L表示输入长度的批次;
所述MLP块包含两个CNN层和一个归一化层,其函数表示为:
zl=MLP(LN(zm))+zm,l=1...L (4)
其中,zl表示MLP的输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南华大学,未经南华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310188140.5/1.html,转载请声明来源钻瓜专利网。