[发明专利]一种基于图卷积和词向量的药物-靶标相互作用预测方法有效
| 申请号: | 201910460463.9 | 申请日: | 2019-05-30 |
| 公开(公告)号: | CN110289050B | 公开(公告)日: | 2023-06-16 |
| 发明(设计)人: | 全哲;郭燕;林轩;何楠;王梓旭 | 申请(专利权)人: | 湖南大学 |
| 主分类号: | G16C20/10 | 分类号: | G16C20/10;G16C20/50;G16C20/70 |
| 代理公司: | 深圳市兴科达知识产权代理有限公司 44260 | 代理人: | 王翀;阳江军 |
| 地址: | 410082 湖*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 图卷 向量 药物 靶标 相互作用 预测 方法 | ||
本发明提供了一种基于图卷积和词向量的药物-靶标相互作用预测方法,从药物中提取分子指纹特征和邻接矩阵特征,然后利用图卷积训练这些特征,将一个蛋白质分子表达式3个一组切割,并用一个100维的向量表示这一组,利用CNN训练靶标的词向量特征,最后把训练好的药物和靶标结合在一起,进行最后的结果预测。本发明的有益效果如下:可以提供关于药物的更多特征,从而达到更高的准确性;利用词向量构建蛋白质特征,大大减少了构建特征的时间;可以完整保存药物分子图的有关信息,而不会损失特征;可以大大加快训练时间。
【技术领域】
本发明涉及药物-靶标相互作用预测技术领域,尤其涉及一种基于图卷积和词向量的药物-靶标相互作用预测方法。
【背景技术】
现代新药研发的关键是寻找,确定和制备药物分子靶标。化合物成药所具备的重要前提之一就是与靶标蛋白的结合力够强,作用时间够长。然而,近些年,新药研发速率不断下降,研发成本不断上升。原因就在于:1.药物研发的早期阶段依靠耗时耗力的实验手段;2.大部分人类疾病是由多因素引起的复杂疾病,而生物系统具有一定的冗余度和鲁棒性,单一药物对单一靶点的干扰不能引起系统表型的改变。
目前通常的预测药物-靶标亲和力的做法主要分为以下几种:
1.基于特征的方法,已知的药物-靶相互作用通过由药物化学描述符的描述符与用于结合靶标。利用这些特征向量作为输入,然后利用诸如支持向量机(SVM),朴素贝叶斯(NB)或神经网络(NN)的标准机器学习方法可用于预测新药物-目标对的相互作用。此方法药物特征较难获取,普适性较差,结果误差较大。将药物-靶标任务规定为二元分类问题,没有区分真正的负相互作用和未经测试的药物-目标对,并且没有很好地涵盖整个相互作用谱,包括真正的正相互作用和真正的负相互作用。
2.基于相似性的方法,生成两者的药物-药物对和所述目标-目标对的相似性矩阵。可以使用不同类型的相似性度量来生成这些矩阵;通常,化学结构指纹用于计算药物之间的相似性,蛋白质序列比对评分用于靶标。使用相似性的最简单方法之一是最近邻分类器,预测来自最相似药物/目标的相互作用谱的加权(通过相似性)总和的新相互作用。和基于特征的方法一样将任务规定为二元分类问题。
3.利用梯度提升方法用于连续药物-靶标结合亲和力预测。给定持续结合亲和力的训练数据集以及药物之间和目标之间的相似性,这种方法构建药物,靶标和药物-靶标对的特征,并使用梯度增强机器来预测药物-靶标对的结合亲和力并生成预测间隔。这种方法药物和蛋白质特征构建比较困难,预测能力有限。
综上所述,药物-靶标亲和力预测的各种方法都会受限于自身的特点。其中基于特征和相似性的方法将此任务定义为二分类问题,没有很好地涵盖整个相互作用谱,而利用梯度提升的方法药物和蛋白质特征构建困难,预测能力有限。
【发明内容】
本发明的目的是提出了一种基于图卷积和词向量的药物-靶标相互作用预测方法,其中图卷积用于对药物进行特征提取,词向量用于表示蛋白质特征,然后用CNN(卷积神经网络)对蛋白质进行特征提取,可以提高药物-靶标亲和力预测准确性,从而降低药物生产过程的成本,帮助我们选择更好的药物。
为实现上述目的,本发明的技术方案为:
一种基于图卷积和词向量的药物-靶标相互作用预测方法,包括如下步骤:
步骤1、构建数据集,对数据集进行切分,生成80%的训练集和20%的测试集;
步骤2、对训练集中的药物构建邻接矩阵并提取分子指纹特征;
步骤3、构建靶标的氨基酸序列的三元组词向量表;
步骤4、利用Embedding层对分子指纹特征做映射,同时利用Embedding层将每个靶标的氨基酸序列转换成一个100维的矩阵;
步骤5、利用图卷积对处理好的药物特征进行训练,利用CNN对处理好的靶标特征进行训练;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910460463.9/2.html,转载请声明来源钻瓜专利网。





