[发明专利]一种基于抽象凸下界估计的蛋白质结构预测方法有效
申请号: | 201310329575.3 | 申请日: | 2013-07-30 |
公开(公告)号: | CN103413067A | 公开(公告)日: | 2013-11-27 |
发明(设计)人: | 张贵军;邓勇跃;程正华;周晓根;姚春龙;张贝金;明洁 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F19/16 | 分类号: | G06F19/16 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;黄美娟 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于抽象凸下界估计的蛋白质结构预测方法,包括以下步骤:首先针对蛋白质高维构象空间采样难题,采用一系列变换方法将ECEPP/3力场模型转换为单位单纯性约束条件下的递增射线凸函数;基于抽象凸理论,证明并分析给出了递增射线凸函数的支撑超平面集;然后,在差分进化群体算法框架下,基于群体极小化构象次微分知识构建下界低估支撑面;进而,通过低估支撑面极值点快速枚举方法,逐步减小构象采样空间以提高采样效率;同时,利用下界低估支撑面快速廉价地估计原势能模型能量值,有效减少势能模型目标函数的评价次数;最后,甲硫氨酸—脑啡肽(TYR1-GLY2-GLY3-PHE4-MET5)构象空间优化实例验证了本发明的有效性。本发明提供一种可靠性高、复杂性较低、计算效率高的基于抽象凸下界估计的蛋白质结构预测方法。 | ||
搜索关键词: | 一种 基于 抽象 下界 估计 蛋白质 结构 预测 方法 | ||
【主权项】:
1.一种基于抽象凸下界估计的蛋白质结构预测方法,包括以下步骤:1)选取合适的力场模型,本发明采用ECEPP/3力场模型能量函数的表示形式如下:f 1 ( x ‾ 1 , x ‾ 2 , · · · , x ‾ N ‾ ) = E bond + E angle + E torsion + E electrostatic + E vdw + E hydrogen + E other ]]>= Σ b ∈ BOND k b 2 ( b - b 0 ) 2 + Σ a ∈ ANGLE k a 2 ( a - a 0 ) 2 + Σ τ ∈ TOR Σ m ∈ MUL V m , τ [ 1 + cos ( mτ - γ m , τ ) ] - - - ( I ) ]]>+ Σ i , j ∈ ES q i q j ϵ · r ij + Σ i , j ∈ VDW A ij r ij 12 - B ij r ij 6 - Σ i , j ∈ HB C ij r ij 12 - D ij r ij 10 + E other ]]> 式中
表示肽链中原子个数,
为第i个原子的坐标
Ebond为键长贡献项(1-2相互作用),BOND为键长集合,b为1-2原子之间的距离,b0为1-2原子之间平衡状态下键长,kb为键长强度;Eangle为键角贡献项(1-3相互作用),ANGLE为键角集合,a为两键矢量之间的夹角,a0为平衡状态下键角,ka为键角的强度;Etorsion为正常二面角贡献项(1-4相互作用),采用余弦函数的形式描述,TOR为正常二面角集合,MUL为二面角多样性集合,τ为正常二面角,m为多样性,Vm,τ为二面角τ对应于多样性m的势垒高度,γm,τ为二面角τ对应于多样性m的初始相位;Eelectrostatic为静电力(库仑力)贡献项,ES为静电作用力原子集合,qi为原子i的部分电荷,qj为原子j的部分电荷,ε为介电常数;Evdw为范德华力相互作用贡献项(6-12作用力),采用Lennard-Jones势描述,VDW为范德华作用力集合,rij为原子i与原子j之间的欧氏距离,参数Aij和Bij依赖于特定原子类型和相互作用的特征;Ehydrogen为氢键相互作用贡献项(10-12作用力),HB为氢键作用力集合,Cij和Dij依赖于相互作用特征;Eother为其它额外的能量贡献项;2)将力场模型转换为单位单纯形约束下的目标函数,并通过局部优化的方法获得其简化的势能模型;3)参数初始化:设置群体规模popSize,变异因子F为0.5,交叉因子CR为0.1,低估概率underFactor,常数M,支撑向量规模K=N+1,支撑向量阈值KT,初始群体P = { x 1 , x 2 , . . . , x popSize | x i = ( x 1 i , x 2 i , . . . , x N + 1 i ) ∈ S , i ∈ I } , ]]> 其中S = { x ∈ R N + 1 : x i ≥ 0 , Σ i = 1 N + 1 x i = 1 } ]]> 称为单位单纯形,计算f5(xi),i∈I,其中f5为简化势能模型对应的目标函数
并设
为区域I上的最小值,其中I={1,2,...,popSize};4)对每一个目标个体xi∈S(i=1,2,…,popSize)作如下处理:4.1)任意选取三个个体{xa,xb,xc|a,b,c∈{1,2,...,popSize},a≠b≠c≠i};4.2)对{xa,xb,xc}执行变异操作
生成变异个体
4.3)对目标个体xi和变异个体
执行交叉操作,生成测试个体
4.3.1)设置j=1;4.3.2)trial [ j ] = x ^ j i if ( randb ( j ) ≤ CR or j = rnbr ( i ) x j i if ( randb ( j ) > CR R or j ≠ rnbr ( i ) ]]> j=1,2,...,N+1;其中randb(j)产生0到1之间的随机数;rnbr(i)产生1到N+1之间的任一个整数;4.3.3)j=j+1;4.3.4)如果j<N+1;转至步骤4.3.2);4.4)i=i+1;如果i<popSize,转至步骤4.1);5)对目标个体xi∈S和测试个体
逐个更新操作:5.1)设置i=1;5.2)查询包含
的子区域
计算
其中
为低估支撑面
在
子区域中唯一的最优解,
为唯一对应于子区域
的支撑向量矩阵对角项;5.3)如果
转至5.9);5.4)如果K<KT,转至5.8);5.5)如果random(0,1)<underFactor,转至5.8);5.6)计算d ( x ‾ i ) : = H ~ K ( x ‾ i ) = max { l 1 ‾ k 1 x ‾ 1 i , l ‾ 2 k 2 x ‾ 2 i , . . . , l ‾ N + 1 k N + 1 x ‾ N + 1 i } , ]]> 其中
为给定区域中的唯一最优解;5.7)如果
转至5.9);5.8)计算
如果
则置
K=K+1,更新树结构TK;5.9)i=i+1;如果i≤popSize,转至5.2);6)置f 5 * = min i ∈ I f 5 ( x i ) ; ]]> 7)判断是否满足终止条件,如不满足转至步骤3);8)输出结果,退出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310329575.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种植物纤维粉末分级筛分机
- 下一篇:气动钢珠式振动器
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用