[发明专利]预测细胞色素P4501A2抑制剂抑制浓度的方法有效
申请号: | 201510234047.9 | 申请日: | 2015-05-08 |
公开(公告)号: | CN104866710B | 公开(公告)日: | 2017-11-10 |
发明(设计)人: | 卢小泉;张苗;陈晶;王世霞;关志强;马琴 | 申请(专利权)人: | 西北师范大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 北京中恒高博知识产权代理有限公司11249 | 代理人: | 吕玉博 |
地址: | 730070 甘肃*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 简化 最小 预测 细胞 色素 p450 cyp1a2 抑制剂 抑制 浓度 方法 | ||
1.一种用简化偏最小二乘预测细胞色素P450酶CYP1A2抑制剂的抑制浓度的方法,其特征在于:包括如下步骤,
1)样本集的收集、处理和优化;
收集细胞色素P450抑制剂分子的结构以及相对应的抑制浓度,对收集的每个抑制剂分
子进行结构优化;
2)抑制剂分子描述符的构建
输入优化之后的细胞色素P450抑制剂分子结构,计算出与其对应的分子描述符值,每
个抑制剂分子包括若干个变量;
3)抑制剂分子描述符的初步筛选
删除对矩阵没有意义的描述符,降低冗余度;
采用以下具体步骤:
(ⅰ)删除对矩阵没有意义的描述符,降低冗余度;
(ⅱ)选择某一变量对应不同的样本时具有较大的方差,表征的信息量大,在统计分析中才会显著;
(ⅲ)相关性较高的变量说明该变量包括了另一变量含有的信息,相关性较高的变量同时引入模型,会导致预测结果变差,应剔除二者之一;
(ⅳ)剔除化合物的活性/性质和变量相关性极差的变量;
(ⅴ)使用逐步多元和无用信息变量结合的方法挑选最终的描述符;
4)抑制剂分子描述符数据集的重新标度
将经过初步筛选的抑制剂分子描述符利用matlab工具,采用Standardization这个函数将
抑制剂分子描述符的数据映射到一个范围内,所述范围为-6~6之间;
5)抑制剂分子描述符数据集的划分
将步骤2)至4)处理后的抑制剂分子描述符数据集,利用kennard-stone方法将
数据集分为训练集和测试集;
6)建立模型
用细胞色素P450抑制剂分子结构即就是用步骤2)至4)处理之后的抑制剂描述符与
其对应的抑制浓度建立关系模型,即QSAR模型;
7)预测细胞色素P450酶CYP1A2抑制剂的抑制浓度
根据所述步骤5)所得的测试集与所述步骤6)所建立的QSAR模型来预测细胞色
素P450抑制剂的抑制浓度。
2.根据权利要求1所述的简化偏最小二乘预测细胞色素P450酶CYP1A2抑制剂的抑制浓度的方法,其特征在于:所述步骤1)中收集52种细胞色素P450抑制剂分子及与其相对应的抑制浓度。
3.根据权利要求1所述的简化偏最小二乘预测细胞色素P450酶CYP1A2抑制剂的抑制浓度的方法,其特征在于:所述步骤2)中分子描述符的计算是采用在线药物分子描述符计算E-Dragon完成。
4.根据权利要求1所述的简化偏最小二乘预测细胞色素P450酶CYP1A2抑制剂的抑制浓度的方法,其特征在于:所述步骤5)中数据集的划分,将数据集用kennard-stone方法按照4:1的比例划分为训练集和测试集。
5.根据权利要求1所述的简化偏最小二乘预测细胞色素P450酶CYP1A2抑制剂的抑制浓度的方法,其特征在于:所述步骤7)中所述的预测过程,将步骤5)所得测试集代入步骤6)所述的关系模型中,得到对应细胞色素P450抑制剂分子的抑制浓度的预测值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北师范大学,未经西北师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510234047.9/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用