[发明专利]一种小分子活性预测方法、装置和计算设备在审
| 申请号: | 202010202803.0 | 申请日: | 2020-03-20 |
| 公开(公告)号: | CN111445945A | 公开(公告)日: | 2020-07-24 |
| 发明(设计)人: | 宋哲炜;李远鹏;唐麒淳;胡笑文;赖力鹏;温书豪;马健 | 申请(专利权)人: | 北京晶派科技有限公司 |
| 主分类号: | G16B15/30 | 分类号: | G16B15/30;G16H20/10 |
| 代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 谢建云;赵爱军 |
| 地址: | 100190 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 分子 活性 预测 方法 装置 计算 设备 | ||
本发明公开了一种小分子活性预测方法,适于在计算设备中执行,该计算设备中存储有训练好的小分子活性预测模型,该模型能够预测小分子和蛋白质的结合活性,该方法包括步骤:接收用户输入的蛋白质和小分子序列,并生成该蛋白质和小分子的晶体构象数据;从该晶体构象数据中提取多个子图,生成每个子图的距离矩阵,并提取各距离矩阵的多个特征值来生成该晶体构象数据的特征向量;以及将该特征向量输入到所述训练好的小分子活性预测模型中,得到预测的该小分子活性值。本发明还一并公开了该小分子活性预测模型的训练方法、以及小分子活性预测装置、小分子活性预测模型的训练装置和用于执行该方法的计算设备。
技术领域
本发明涉及药物虚拟筛选领域,尤其涉及一种小分子活性的预测方法、装置和计算设备。
背景技术
众所周知,药物研发是一个漫长的过程,存在着研发周期长,研发成果率低,研发费用高的困境。而随着计算机技术的更新以及大数据技术的发展,人工智能正在各行各业中发挥巨大的应用价值,在制药行业也受到了广泛的关注。在新药发现过程中,虚拟筛选可以提高活性分子的富集,通过对化合物的性能进行预测,可以节约大量的人力、物力,缩短药物研发周期,加速研究成果的转化,因此近年来已引起科研机构和制药公司的高度重视。
在药物的早期设计阶段,针对某个疾病相关的蛋白质靶点,寻找具有优良活性、成药属性及可合成的小分子是一个关键工作。而如何能从分子库中快速又准确地筛选出活性优良的小分子,以实现基于固定靶点的小分子化合物活性预测的虚拟筛选,就成为了药物研发工作的重中之重。
发明内容
为此,本发明提供了一种小分子活性预测方法、装置和计算设备,以力图解决或至少缓解上面存在的至少一个问题。
根据本发明的一个方面,提供了一种小分子活性预测模型的训练方法,适于在计算设备中执行,包括:收集多个已知蛋白质和小分子结合的晶体构象数据和活性数据;从每个晶体构象数据中提取多个子图,每个子图代表一种蛋白质原子和一种小分子原子之间的所有连接信息;生成每个子图的距离矩阵,并提取各距离矩阵的多个特征值来生成对应晶体构象数据的特征向量;以及以特征向量为样本输入,以小分子的活性值为样本输出,以对应的活性数据为样本标签,对预训练的小分子活性预测模型进行训练,得到训练后的模型。
可选地,在根据本发明的训练方法中,晶体构象数据包括蛋白质和小分子的每个原子的原子坐标、原子类型和原子间的连接方式;活性数据和活性值包括小分子和蛋白质的结合亲和力;子图M(A,B)的连接信息包括该晶体构象数据中所有蛋白质原子A和所有小分子原子B的原子坐标和连接方式。
可选地,在根据本发明的训练方法中,从每个晶体构象数据中共提取m*n个子图,其中,m为蛋白质的原子种类,n为小分子的原子种类。
可选地,在根据本发明的训练方法中,小分子的原子种类包括C、N、O、S中的至少一种;蛋白质的原子种类包括H、C、N、O、S、P、F、Cl、Br、I中的至少一种。
可选地,在根据本发明的训练方法中,生成每个子图的距离矩阵的步骤包括:对于子图M(A,B),统计该子图中蛋白质原子A的个数p和小分子原子B的个数q;分别计算该p个A原子与q个B原子之间的距离,生成(p+q)*(p+q)的距离矩阵,作为该子图M(A,B)的距离矩阵。
可选地,在根据本发明的训练方法中,提取各距离矩阵的多个特征值来生成该晶体构象数据的特征向量的步骤包括:对于每一距离矩阵,提取该距离矩阵的多个特征值,并计算该多个特征值的统计标量;以及将该晶体构象数据的所有距离矩阵的统计标量进行拼接,得到该晶体构象数据的特征向量。
可选地,在根据本发明的训练方法中,提取各距离矩阵的多个特征值来生成该晶体构象数据的特征向量的步骤包括:对于每一距离矩阵,提取该距离矩阵的迹以及多个特征值,并计算该多个特征值的统计标量;以及将该晶体构象数据的所有距离矩阵的迹和统计标量进行拼接,得到该晶体构象数据的特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京晶派科技有限公司,未经北京晶派科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010202803.0/2.html,转载请声明来源钻瓜专利网。





