[发明专利]基于多元线性回归快速预测黄嘌呤衍生物抑制活性的QSAR方法有效
申请号: | 202010881483.6 | 申请日: | 2020-08-27 |
公开(公告)号: | CN112151111B | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 赵娟娟;刘秀娟;陆文聪 | 申请(专利权)人: | 上海大学 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B40/00 |
代理公司: | 上海上大专利事务所(普通合伙) 31205 | 代理人: | 何文欣 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多元 线性 回归 快速 预测 黄嘌呤 衍生物 抑制 活性 qsar 方法 | ||
本发明涉及一种基于多元线性回归快速预测黄嘌呤衍生物抑制活性的QSAR方法,建立数据集样本;生成描述符;随机划分训练集和测试集;利用最大相关最小冗余方法结合多元线性回归留一法验证筛选变量,选出建模的最优变量子集;对筛选出的最优自变量进行转换,获得新的自变量;用多元线性回归建立黄嘌呤衍生物抑制活性的快速预报模型;根据建立的黄嘌呤衍生物的快速预报模型和待检测的黄嘌呤衍生物,快速预报待检测物的抑制活性。本发明基于可靠的文献真实值和建模方法,所建的黄嘌呤衍生物抑制活性的预报模型具有方便快捷,无化学污染等优点。
技术领域
本发明涉及黄嘌呤衍生物抑制活性的预测,特别是一种基于多元线性回归快速预测黄嘌呤衍生物抑制活性的定量构效关系(quantitative structure activityrelationship,简称QSAR)方法。
技术背景
黄嘌呤衍生物属于二肽基肽酶IV(dipeptidyl peptidase IV,简称DPP-IV)抑制剂的其中一种,有降低糖尿病患者血糖水平的作用。DPP-IV是一种丝氨酸蛋白酶,能够从多肽的N-末端分裂出X-脯氨酸二肽(X为任意氨基酸)。当人们在进餐后,体内血糖升高,葡萄糖依赖性的胰高血糖素样肽1(GLP-1)能刺激胰岛β细胞分泌胰岛素,但其大部分被DPP-IV降解失活。黄嘌呤衍生物作为DPP-IV抑制剂中的一种,能够抑制DPP-IV的活性。因具有降糖作用,黄嘌呤衍生物受到人们的关注。
半抑制活性浓度(IC50)是指被测量的拮抗剂的半抑制浓度,即某一种药物或者物质(抑制剂)在抑制某些生物程序(或者是包括在此程序中的某些物质,如酶,细胞受体或微生物)的半量。IC50值越低,意味着此抑制剂的抑制活性效果越好。
定量构效关系(quantitative structure activity relationship,简称QSAR)作为一种统计模型,是用来分析分子结构与分子的某种活性之间的关系,包含与机器学习方法的结合,已经广泛用于药物发现和先导物优化中。
最大相关最小冗余(mRMR)是一种常见的用于自变量筛选的方法。该方法是基于所选择的特征之间的冗余度应最小,与目标变量之间的相关性最大的理论来筛选自变量。
多元线性回归(multiple linear regression,简称MLR)是多元数据分析的传统标准方法。该算法通过建立因变量和多个自变量之间的回归模型,从而得到线性方程,最终可以用来预测新的数据。如何应用多元线性回归建模,实现快速预报待检测物的抑制活性,成为亟待解决的技术问题。
发明内容
本发明的目的是为了克服现有技术存在的缺陷,提供一种基于多元线性回归快速预测黄嘌呤衍生物的抑制活性QSAR方法,通过计算黄嘌呤衍生物二维结构的描述符,利用最大相关最小冗余筛选变量,并借助多元线性回归算法建模,预测黄嘌呤衍生物的pIC50值,IC50值的负对数。通过这些方法能几分钟就可得到结果,方便快捷,无需实验和繁杂的计算。
本发明的目的可通过如下的技术方案实现:
一种基于多元线性回归快速预测黄嘌呤衍生物抑制活性的QSAR方法,包括如下步骤:
1)利用计算机系统,从文献中查找能够抑制DPP-IV活性的黄嘌呤衍生物结构及其对应的IC50值,作为数据集样本;
2)用Chemdraw画出收集到的黄嘌呤结构,再用Dragon软件生成描述符;
3)以IC50值的负对数(pIC50)为目标变量,Dragon生成的描述符为自变量,以互信息阈值为0.45初步筛选数据集;对初步筛选的数据集,随机划分训练集和测试集,测试集的比例占整个数据集的20%;
4)利用最大相关最小冗余方法结合多元线性回归留一法验证筛选变量,选出建模的最优变量子集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010881483.6/2.html,转载请声明来源钻瓜专利网。