[发明专利]亲和度预测方法及模型的训练方法、装置、设备及介质在审
| 申请号: | 202110011160.6 | 申请日: | 2021-01-06 |
| 公开(公告)号: | CN112331262A | 公开(公告)日: | 2021-02-05 |
| 发明(设计)人: | 王凡;何径舟;方晓敏;张肖男;吴华;吴甜;王海峰 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G16B15/30 | 分类号: | G16B15/30;G06K9/62;G06N20/20 |
| 代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 亲和 预测 方法 模型 训练 装置 设备 介质 | ||
本公开公开了一种亲和度预测方法及模型的训练方法、装置、设备及介质,涉及机器学习与智能医疗等人工智能技术领域。具体实现方案为:采集多条训练样本,各条训练样本中包括训练靶点的信息、训练药物的信息以及训练靶点对应的测试数据集;采用所述多条训练样本,对亲和度预测模型进行训练。另外,还公开了一种亲和度预测方法。根据本公开的技术,可以有效地提升训练的亲和度预测模型的准确性和训练效果。并在亲和度预测时,通过获取待检测靶点对应的测试数据集一起参与预测,可以使得预测的待检测靶点和待检测药物的亲和度的准确性更高。
技术领域
本公开涉及计算机技术领域,具体涉及机器学习与智能医疗等人工智能技术领域,尤其涉及一种亲和度预测方法及模型的训练方法、装置、设备及介质。
背景技术
人类疾病的靶点通常是疾病发展中具有关键作用的蛋白质,亦可以称为蛋白质靶点。药物通过和靶点蛋白质的结合来使得对应的蛋白质丧失原有功能,从而实现疾病的抑制作用。在新药研发过程中,蛋白质靶点(Target)和化合物分子(Drug)的亲和度的预测是非常重要的环节。通过亲和度预测,寻找到和蛋白质靶点能够紧密结合的高活性的化合物分子,持续优化最终形成可以用于治疗的药物。
最传统的方法需要将最终形成的药物的化合物分子一一进行体外活性实验,以准确检测药物与蛋白质靶点的亲和度。尽管现在高通量实验能做到短时间进行几百上千次实验,但是这种实验成本依旧非常高,而且面对几乎无限大的化合物空间,上千万的化合物结构,这种实验方式仍然不可行。
发明内容
本公开提供了一种亲和度预测方法及模型的训练方法、装置、设备及介质。
根据本公开的一方面,提供了一种亲和度预测模型的训练方法,其中,所述方法包括:
采集多条训练样本,各条所述训练样本中包括训练靶点的信息、训练药物的信息以及训练靶点对应的测试数据集;
采用所述多条训练样本,对亲和度预测模型进行训练。
根据本公开的另一方面,提供了一种亲和度预测方法,其中,所述方法包括:
获取待检测靶点的信息、待检测药物的信息以及所述待检测靶点对应的测试数据集;
基于所述待检测靶点的信息、所述待检测药物的信息以及所述待检测靶点对应的测试数据集,采用预先训练的亲和度预测模型,预测所述待检测靶点与所述待检测药物的亲和度。
根据本公开的再一方面,提供了一种药物数据的筛选方法,其中,所述方法包括:
基于预设靶点对应的测试数据集,采用预先训练的亲和度预测模型,从预设的药物库中筛选与所述预设靶点的预测亲和度最高的数个药物的信息;
基于筛选的所述数个药物的信息,获取实验得出的所述数个药物中各所述药物与所述预设靶点的真实亲和度;
基于所述数个药物的信息以及各所述药物与所述预设靶点的真实亲和度,更新所述预设靶点对应的测试数据集。
根据本公开的又一方面,提供了一种亲和度预测模型的训练装置,其中,所述装置包括:
采集模块,用于采集多条训练样本,各条所述训练样本中包括训练靶点的信息、训练药物的信息以及训练靶点对应的测试数据集;
训练模块,用于采用所述多条训练样本,对亲和度预测模型进行训练。
根据本公开的再另一方面,提供了一种亲和度预测装置,其中,所述装置包括:
获取模块,用于获取待检测靶点的信息、待检测药物的信息以及所述待检测靶点对应的测试数据集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110011160.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种测压装置及测压方法
- 下一篇:一种快速测温及身份识别系统





