[发明专利]有机污染物定量结构活性相关模型抽多法交叉验证方法无效
申请号: | 201110112111.8 | 申请日: | 2011-04-29 |
公开(公告)号: | CN102184284A | 公开(公告)日: | 2011-09-14 |
发明(设计)人: | 张爱茜;易忠胜;李富华;蔺远;高常安;穆云松 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F17/50 | 分类号: | G06F17/50 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 蒋海军 |
地址: | 210093 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 有机 污染物 定量 结构 活性 相关 模型 抽多法 交叉 验证 方法 | ||
技术领域
本发明涉及一种有机污染物定量结构活性相关模型抽多法交互验证方法,具体的说是即采用均匀设计优化的抽多法交互验证对模型进行内部验证,并将均匀设计优化的抽多法交互验证的相关系数作为模型变量筛选终止标准和预测能力判断指标的新型定量结构活性相关模型交互验证方法。
背景技术:
有机污染物的定量结构活性相关(Quantitative Structure and Activity Relationship,QSAR)研究方法作为一种计算机建模技术,能够深入挖掘有机污染物化学结构与其对人体及生态环境造成危害之间的量变规律和因果关系,为从分子水平上将污染物结构与其相对宏观的多样性环境行为和毒性效应进行关联提供了一种现实的可能。QSAR模型可以预测并弥补有机污染物环境行为与生态毒理数据的缺失,大幅度降低实验费用,有助于减少和替代实验(尤其动物实验)测试,因此QSAR目前已经成为污染物环境生态风险评价和人体健康风险评价的重要工具(王连生,韩朔睽.有机污染物的定量结构-活性相关.1993,北京:中国环境科学出版社;国家自然科学基金委员会化学科学部组编,叶常明,王春霞,金龙珠主编,21世纪的环境化学,2004,科学出版社:北京。)
QSAR模型的建立大致包括了数据准备、数据分析和模型验证三个步骤。数据准备是为获取表征分子结构的变量和污染物的环境性质或生物活性,数据分析是选择合适的污染物结构描述变量并在污染物结构与其环境性质或生物活性之间建立数理统计模型,而模型验证是指模型建立后,所进行的模型显著性、稳定性(鲁棒性)、预测能力(泛化能力)、偶然相关和模型应用域等的验证,以保证模型对未知化合物的性质或活性预测的准确性。QSAR模型验证的主要目的是为了评价模型的稳定性和对未知样本的预测能力,目前主要有内部样本和外部样本验证两种类型。外部样本验证方法主要是采用训练集样本结合线性或非线性建模方法建立统计数学模型,然后对未参与建模的外部样本集进行预测,以外部样本的预测值与观测值之间的相关系数、均方根差等统计参数描述模型的预测能力。外部样本验证方法通常要求有较多的样本集以保证建模样本集和外部验证样本集的数量(Hawkins D.,Basak S.,Mills D.Assessing Model Fit by Cross-Validation.J.Chem.Inf.Comput.Sci.2003,43(2),579-586.)。
内部验证方法通常有x-randomization、y-randomization、y-scrambling和交叉验证等方法。x-randomization方法主要原理为按照建模样本集的自变量矩阵大小,随机产生大小完全一样的、新的建模自变量数据矩阵,然后与因变量建立模型。如果经过多次验证得到用随机自变量矩阵建立的模型质量比实际自变量建立的模型差,说明建立的模型并非偶然因素所致(Rucker C.,Rucker G.,Meringer M.y-Randomization and Its Variants in Q SPR/Q SAR.J.Chem.Inf.Model.2007,47(6),2345-2357.)。y-randomization方法与x-randomization方法类似,只是按照样本数的大小产生随机的因变量数量,然后与自变量矩阵建立模型。如果多次验证得到的模型质量比真实模型差,则说明建立的模型并非偶然因素所致(Rucker C.,Rucker G.,Meringer M.y-Randomization and Its Variants in Q SPR/Q SAR.J.Chem.Inf.Model.2007,47(6),2345-2357.)。y-scrambling方法则是将原来的因变量随机变换位置,然后与自变量建立模型,如果多次验证的模型质量比真实模型差,则说明模型是真实可靠。以上所述的三种方法本质都是验证模型是否为偶然相关,并不能说明模型的预测能力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110112111.8/2.html,转载请声明来源钻瓜专利网。