[发明专利]通过定量构效关系模型预测大气中有机物与羟基反应速率常数的方法有效
申请号: | 201310307098.0 | 申请日: | 2013-07-20 |
公开(公告)号: | CN103425872A | 公开(公告)日: | 2013-12-04 |
发明(设计)人: | 李雪花;李超;乔显亮;陈景文 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 梅洪玉 |
地址: | 116024*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通过 定量 关系 模型 预测 大气 有机物 羟基 反应 速率 常数 方法 | ||
1.一种通过定量构效关系模型预测大气中有机物与羟基反应速率常数的方法,其特征在于,
首先,收集得到化合物数据集涵盖温度T为206K~1364K的1543个kOH数值,其中在温度为298K的数据872个;
然后,对收集得到的1543个kOH数值进行建模,包括温度依附性的kOH QSAR模型和298K的kOH QSAR模型;将上述收集得到的1543个和872个化合物数据集分别按照4:1的比例拆分为训练集和验证集,其中,温度依附性的kOH QSAR模型训练集化合物个数为n=1234,验证集化合物个数next=309;298K的kOH QSAR模型训练集化合物个数为n=696,验证集化合物个数next=176;
上述两种模型选取2种来源的描述符:
(1)量子化学描述符,选取了6个量子化学描述符;
(2)DRAGON描述符,基于优化后的构型得到了2000多种分子结构描述符;建模过程中,将温度T及1/T作为温度依附性的kOH QSAR模型描述符;分别对训练集中的kOH数据和上述所有描述符进行MLR回归分析;
两个模型的线性关系式如下:
模型1:温度依附性的kOH QSAR模型
logkOH=-8.613-0.02100×X%+14.38×EHOMO-0.6430×Mor29u+0.5870×NdsCH+0.5870×GATS1e+0.5770×X3A-0.2450×SdsCH-167.0×(1/T)+1.103×BIC1+0.1170×RDF015m-1.044×SpMin8_Bh(p)+0.2390×nR=Cp-0.1980×NssssC-0.5080×F02[F-Br]
(1)
模型2:T=298K的kOH QSAR模型
log(kOH)=-6.511+15.85×EHOMO-0.03800×AMW+0.1300×NdsCH+0.1630×Mor14i+0.3170×nR=Cp+0.7790×nP+0.3930×nRCHO-0.01900×X%-0.4550×SpMaxA_AEA(dm)+0.5890×(C-020)-0.05600×nCbH+0.1410×CATS2D_03_DL
(2)
其中,X%表示卤素原子在分子中所占的百分比,EHOMO表示最高占据分子轨道能量,Mor29u表示未加权的3D分子结构描述符,NdsCH表示分子中具有=CH-结构的数目,GATS1e表示Sanderson电负性加权的lag1的Geary自相关指数,X3A表示3阶平均连接指数,SdsCH表示=CH-结构电性拓扑态的总和,1/T表示温度的倒数,BIC1表示1阶临近对称键信息内容指标,RDF015m表示0.15质量加权的径向分布函数,SpMin8_Bh(p)表示极化率加权的burden矩阵的最小特征值,nR=Cp表示末端sp2杂化的主碳数目,NssssC表示分子中含>C<结构的个数,F02[F-Br]表示在拓扑距离为2处F-Br出现的频率AMW表示平均分子质量,Mor14i表示离子化势加权的3D分子结构描述符,nP表示分子中磷原子个数,nRCHO表示分子中脂肪族醛的个数,SpMaxA_AEA(dm)表示偶极矩加权的来自于扩增边缘临界处的标准化的主要特征值,C-020表示分子中=CX2结构信息,nCbH表示非取代苯环上sp2杂化碳的数目,CATS2D_03_DL表示位于lag03处的CATS2D亲脂性供体。
2.根据权利要求1所述的方法,其特征在于,所述的化合物包括烷烃类化合物、烯烃类化合物、炔烃类化合物、芳香烃类化合物、醇类化合物、醛类化合物、酮类化合物、醚类化合物、酸类化合物、脂类化合物、卤代类化合物、含氮化合物、含硫化合物、含磷化合物、有机硅化合物、有机汞化合物、有机铅化合物、有机硒化合物。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310307098.0/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用