[发明专利]一种基于预测蛋白质亲和力的分子表征及其应用在审
| 申请号: | 202010069615.5 | 申请日: | 2020-01-21 |
| 公开(公告)号: | CN111292800A | 公开(公告)日: | 2020-06-16 |
| 发明(设计)人: | 曹东升;刘璐 | 申请(专利权)人: | 中南大学 |
| 主分类号: | G16B15/30 | 分类号: | G16B15/30;G16C20/50;G16C20/70 |
| 代理公司: | 长沙轩荣专利代理有限公司 43235 | 代理人: | 罗莎 |
| 地址: | 410000 湖南*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 预测 蛋白质 亲和力 分子 表征 及其 应用 | ||
本发明公开了一种基于基于预测蛋白质亲和力的分子表征,采用以下方法构建得到:收集蛋白质靶标及其活性数据;选择计算每个蛋白质靶标的多种不同的描述符,并选择多种不同的机器学习算法;将计算的描述符与机器学习算法两两组合,形成多个不同的单一一模型;将单一一模型,计算平均概率值,作为分子与蛋白质靶标的结合强弱值,形成共识模型;在共识模型中,输入待测分子,输出计算靶标谱,形成分子表征。本发明从生物空间的角度阐述分子表征,将化合物和靶标之间的结合亲和力整合到分子表征中,通过机体的整体性预测得到新的活性或者生物信息;利用计算机快速得出结果,相较于基于试验的生物活性分子表征更加快速高效。
技术领域
本发明涉及计算机辅助药物设计领域,特别是涉及一种基于预测蛋白质亲和力的分子表 征及其应用。
背景技术
在现有药物设计过程中,为缩短药物研究周期,控制药物研发成本,计算机药物辅助分 子设计成为药物研发过程中必不可少的工具。计算机辅助分子设计可分为基于配体和基于受 体两类方法。基于配体的方法多数是基于相似结构化合物具有相似生物活性这个假设,其中 的关键点就是如何表征分子与生物活性之间的联系。
现有解决方案以及缺点:现有的分子表征可分为基于化学结构和基于生物活性两种。传 统的化学结构分子表征针对分子的结构进行解剖,比如子结构碎片,拓扑结构,药效团特征 以及物理化学性质等等。比较常用的有MOE2D、CATS、Atompair、MACCS、ECFP系列、FP系列等。这种分子表征虽然一定程度上涵盖了化合物与生物活性之间的联系,但是这种联系 是不明确的,无法深度解读生物活性。随着技术的发展,基于各种生物试验的数据不断积累。 研究者们尝试着使用生物试验数据表征化合物与生物活性之间的联系。例如,Lamb等人[1] 利用化合物扰动过后的基因信号的变动捕获到了化合物与疾病之间的关系。还有药物的副作 用,分子与蛋白质靶点之间的试验结合亲和力等生物信息都被用来构建生物活性分子表征。 然而,基于试验的分子表征仅仅适用于同样具有试验信息的分子中,这极大限制了生物活性 分子表征的应用。为了扩大应用范围,研究者们通常会将不同小组得到的试验数据汇集形成 一个大的数据集,这不可避免地产生了误差。即使如此,基于试验的生物活性数据分子表征 也并不完全,并不是所有分子都具有广阔的试验谱,药企或研究组织会根据自身的药物研发 进程而进行试验,这就导致了有的分子仅仅有几个试验结果或者具有完整试验谱的分子寥寥 无几。这种不完整的数据矩阵的缺点通过表征传递给了分子,使得分子与生物活性之间的联 系也并不完整。有的研究会默认缺失值为0,也就是分子与该试验的蛋白质没有结合作用力或 者是分子没有该类生物活性,这种处理方式导致假阴性的产生。因此,我们需要开发基于计 算机的生物活性分子表征冲破现有基于试验的生物活性分子表征的禁锢,并且使用尽可能简 单的条件获取高准确度的结果。
发明内容
为解决上述问题,本发明的目的在于,针对现有技术的不足,构建一种能够简单直接表 征化合物和生物活性之间关系的分子表征及其应用。
为了实现上述目的,本发明提供了一种基于预测蛋白质亲和力的分子表征(即计算靶标 谱),所述计算靶标谱采用以下方法构建得到:
(1)数据收集:收集蛋白质靶标及其信息;
(2)分子表征形成:通过计算机方法计算每个蛋白质靶标与化合物的结合亲和力值。
上述计算靶标谱,进一步的,所述S2中,所述计算机方法包括SAR模型和对接。
上述计算靶标谱,进一步的,所述计算靶标谱采用以下方法构建得到:
(1)数据收集:收集蛋白质靶标及其活性数据;
(2)参数确定:计算每个蛋白质靶标的多种不同的描述符,并选择多种不同的机器学习 算法;
(3)构建模型;将所述计算的描述符与所述机器学习算法两两组合,形成多个不同的单 一模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010069615.5/2.html,转载请声明来源钻瓜专利网。





