[发明专利]基于多样子结构特征融合的分子活性预测方法有效
申请号: | 202010729533.9 | 申请日: | 2020-07-27 |
公开(公告)号: | CN111916143B | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 丁静怡;宋健;焦李成;吴建设;成若晖 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B40/00;G16C20/30;G16C20/70 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 田文英;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多样 结构 特征 融合 分子 活性 预测 方法 | ||
本发明公开了一种基于多样子结构特征融合的分子活性预测方法,通过提取分子图子结构特征对神经网络进行训练,克服了现有技术中提取子结构闭环,网络预测精度差,计算困难的问题。本发明实现的步骤是:1)药物分子信息转化成分子特征矩阵;2)挑选初始节点;3)获得多个子结构;4)计算子结构的相似度;5)融合子结构特征矩阵;6)训练神经网络;7)判断训练神经网络是否收敛;8)获得待预测分子活性。本发明具有分辨不同子结构之间的差异性、解决分子图噪声问题和预测分子活性精度高的优点。
技术领域
本发明属于生物技术领域,更进一步涉及生物活性技术领域中的一种基于多样子结构特征融合的分子活性预测方法。本发明可利用一类药物分子子结构信息和其所对应的生物活性去预测未知的同类药物分子对生物活性的影响。
背景技术
分子活性预测技术是指利用一种类别药物分子结构信息和其对应的生物活性影响训练神经网络模型,该模型可以利用未知的同类药物分子的结构信息预测其生物活性的影响。这样模型可以从大范围的同类分子中筛选出更适合于生物实验室中进行生物活性分析的药物化合物分子。为了将药物分子转化为计算机所能识别的信息,所以将分子结构信息转为分子图,同时将药物分子对生物活性的影响量化为分子图标签。目前,分子活性预测技术不但能够简化药物开发流程,降低生物实验安全隐患,而且可以节省生物实验成本。目前的分子活性预测技术面对分子图节点标签噪声问题所带来的挑战。
Pinar Yanardag在其发表的论文“Deep Graph Kernels”(knowledge discoveryand data mining会议2015年)中提出一种通过比较一类分子图之间子结构的相似性来预测其分子活性的方法。该方法将一类分子图分为训练集合和测试集合,将训练集分子图划分为多个子结构,利用训练集合子结构及标签训练神经网络模型,最后模型利用测试集合的分子图子结构和训练集合分子图子结构的相似性得出测试集合的分子图标签。该方法存在的不足之处是,由于一张分子图随机划分为多种不同子结构,不同子结构可能会预测出不同的结果,导致预测分子图标签精度下降。
J.B.Lee在其发表的论文“Graph classification using structuralattention”(knowledge discovery and data mining会议2018年)中提出一种基于注意力神经网络的分子活性预测方法。该方法将一类分子图分为训练集合和测试集合,利用注意力机制寻找训练集合中分子图子结构,利用其子结构和分子图标签训练LSTM模型。最后该模型利用注意力机制寻找测试集合分子图的子结构并预测其测试集合分子图标签。该方法存在的不足之处是,由于寻找到的分子图子结构存在闭环,而导致训练网络无法分辨子结构之间的差异性问题。
发明内容
本发明的目的在于针对上述已有的分子活性预测技术存在的不足之处,提出了一种基于多样子结构特征融合的分子活性预测方法,用于解决在分子活性预测过程中对具有噪声的分子图提取结构特征难,且预测精度差的问题。
实现本发明目的的思路是:根据分子图子结构中独有的结构特征和节点标签特征,利用随机游走的方式提取分子图子结构集合,完善分子图子结构特征信息,并且将部分子结构的融合特征输入到构建好的神经网络训练模型,实现更准确、快速的预测分子活性的目的。
本发明的具体实现步骤包括如下:
(1)获得药物分子信息对应的特征矩阵:
将一种药物分子中的原子基于字节进行独热编码后,得到独热编码特征矩阵,将该种药物原子之间的键值对表示成邻域特征矩阵,将该种药物分子活性基于字节进行独热编码,得到独热编码标签特征矩阵;
(2)挑选初始节点:
(2a)将药物分子的原子表示成节点,原子之间的化学键表示成连边,药物分子活性表示成分子图标签,由节点、连边和分子图标签组成分子图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010729533.9/2.html,转载请声明来源钻瓜专利网。