[发明专利]一种基于预测蛋白质亲和力的分子表征及其应用在审
| 申请号: | 202010069615.5 | 申请日: | 2020-01-21 |
| 公开(公告)号: | CN111292800A | 公开(公告)日: | 2020-06-16 |
| 发明(设计)人: | 曹东升;刘璐 | 申请(专利权)人: | 中南大学 |
| 主分类号: | G16B15/30 | 分类号: | G16B15/30;G16C20/50;G16C20/70 |
| 代理公司: | 长沙轩荣专利代理有限公司 43235 | 代理人: | 罗莎 |
| 地址: | 410000 湖南*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 预测 蛋白质 亲和力 分子 表征 及其 应用 | ||
1.一种基于基于预测蛋白质亲和力的分子表征,其特征在于,所述分子表征采用以下方法构建得到:
(1)收集数据:收集蛋白质靶标及其活性数据;
(2)分子表征形成:通过SAR模型和对接的计算机方法计算每个蛋白质靶标与化合物的结合亲和力值。
2.根据权利要求1所述的基于预测蛋白质亲和力的分子表征,其特征在于,所述分子表征采用以下方法构建得到:
(1)数据收集:收集蛋白质靶标及其活性数据;
(2)参数确定:计算每个蛋白质靶标的多种不同的描述符,并选择多种不同的机器学习算法;
(3)模型构建;将所述计算的描述符与所述机器学习算法两两组合,形成多个不同的单一模型;
(4)共识模型构建:将所述单一模型,计算平均概率值,作为分子与蛋白质靶标的结合强弱值,形成共识模型;
(5)分子表征形成:在所述共识模型中,输入待测分子,输出计算靶标谱,形成分子表征。
3.根据权利要求2所述的基于预测蛋白质亲和力的分子表征,其特征在于,所述S1中,所述蛋白质靶标包括酶、受体、转运体、离子通道;所述活性数据包括IC50、EC50、Ki值;
和/或,所述S2中,所述描述符为MOE2D、CATS、CATS2、GpiDAPH3、TGT、TGD、MACCS、Atompair、Estate、FP系列、ECFP系列、ECFC系列描述符中的一种或多种;所述机器学习算法为RF、XGBoosting、DL、ADA、GBM、KNN、SVM算法中的一种或多种。
4.根据权利要求2所述的基于预测蛋白质亲和力的分子表征,其特征在于,所述分子表征采用以下方法构建得到:
(1)数据收集:收集蛋白质靶标及其活性数据;
(2)参数确定:分别计算每个蛋白质靶标的三种不同的描述符:MOE2D、CATS和MACCS,并选择三种不同的机器学习算法:RF、ADA和GBM;
(3)构建模型;将三个不同的描述符和三个不同的机器学习算法两两组合,形成九个不同的单一模型;
(4)共识模型:整合九个不同的单一模型,计算平均概率值,作为分子与蛋白质靶标的结合强弱值,形成共识模型;
(5)形成分子表征:在所述共识模型中,输入待测分子,输出计算靶标谱,形成分子表征。
5.一种权利要求1至4中任一项所述基于预测蛋白质亲和力的分子表征在骨架跃迁中的应用,其特征在于,所述应用的方法为:
S1-1、分别将活性分子数据库和筛选数据库中的分子输入到共识模型中,输出计算靶标谱,获得活性分子数据库和筛选数据库的分子表征,计算用于比较的基于化学结构的描述符,包括MOE2D、MACCS、CATS、ECFP4、Atompair、FP2、GpiDAPH3、TGT和TGD;
S1-2、依次选取活性分子数据库的不同靶标中的活性分子作为查询分子,其他活性分子和筛选数据库中的分子组合形成查询数据库;
S1-3、使用Tanimoto系数计算查询分子与查询数据库中分子的相似性值;
S1-4、根据相似性值的大小排序,计算前100、200、500、1000、2000、5000化合物中活性分子骨架数量与所有活性分子骨架数量的比值,得到与查询分子不同骨架的活性分子的富集情况。
6.一种权利要求1至4中任一项所述基于预测蛋白质亲和力的分子表征在预测蛋白质靶标中的应用,其特征在于,所述应用的方法为:
S2-1、将待测分子输入到所述共识模型中,输出计算靶标谱,获得分子表征;
S2-1、根据分子表征中的预测结合亲和力值对靶标进行排名预测活性分子的靶标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010069615.5/1.html,转载请声明来源钻瓜专利网。





