[发明专利]基于可极化力场以及pso优化的蛋白质设计方法无效
| 申请号: | 201210563431.X | 申请日: | 2012-12-21 |
| 公开(公告)号: | CN103886225A | 公开(公告)日: | 2014-06-25 |
| 发明(设计)人: | 李国辉;张鼎林 | 申请(专利权)人: | 中国科学院大连化学物理研究所 |
| 主分类号: | G06F19/10 | 分类号: | G06F19/10 |
| 代理公司: | 沈阳科苑专利商标代理有限公司 21002 | 代理人: | 许宗富 |
| 地址: | 116023 *** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 极化 力场 以及 pso 优化 蛋白质 设计 方法 | ||
技术领域
本发明涉及的是一种计算机预测蛋白功能的方法,属于生物信息技术、计算方法与计算机虚拟现实技术。
背景技术
计算机辅助蛋白质设计是进行蛋白质设计中重要的手段。但是全序列蛋白质设计有两个难题。第一个难题就是组合爆炸。简单举个例子,针对一个有着100个氨基酸的多肽链进行设计,那么序列的组合空间是pow(20,100),这个数字太大了,因此选择发展好的优化算法就是必须面临的问题。第二个问题是能量计算函数的速度和精确度相互矛盾,往往难以兼得。如果没有一个精准的能量函数来识别优化的序列以及构象,再好的优化算法也不能发挥作用。
优化策略:在整个计算过程中,假定主链构象不发生变化,会大大的降低计算的复杂度,同时也使得连续的问题转化成了离散的问题。于是就可以使用各种常用的优化算法来寻找比较好的构象。总的来说在蛋白质设计中,优化算法分成两类,第一类算法是非穷举算法,不能保证找到最优构象,这类算法包括MC算法,模拟退火,遗传算法。这类算法通常适用于在较大的搜索空间搜索比较好的构象,尤其是当构象空间太大以至于使用穷举算法不可行的时候。第二类算法可以得到最佳构象,这类算法包括,穷举法,branch and bound算法,DEE算法,divide and conquer算法。
Mc算法:在一个结构中随机选择一个位点,然后按照轮盘赌选择这个位点上的rotamer。如果变化之后的能量变小了,那么就接受这次变化,否则就按照Metropolis规则,决定是不是接受这次变化。Metropolis规则:通过温度,变化前后的能量,得到一个概率数字,然后将这个数字与一个随机数比较,如果随机数小于概率数字,就接受这次改变,否则就不接受这次改变。这个规则使得构想搜索的时候可以跳出极小值点。可以通过调整温度来越过能垒。或者使用模拟退火的方式逐步降低越过能垒的可能性。
遗传算法:遗传算法来源于遗传进化理论。首先产生随机序列的种群,然后选择低能构象进行杂交,互换序列和rotamer。杂交的结果往往能得到更低能构象。这样的低能构象被选择下来,进行下一代的繁殖。高能构象就放弃了。这个过程中包括重组,突变,选择。重复这个过程,直到收敛。
DEE算法:DEE算法能够找到全局最优解。DEE算法的一个关键因素就是过滤规则。不同的过滤规则在效率上差异显著。使用DEE算法的前提是将总能量进行分解。分解成任意侧链对的相互作用能量和侧链内部的能量,以及侧链和不变部分的能量。总能量计算的时候是通过求和得到的。
能量函数的选择。能量函数是用来描述蛋白质内部相互作用的。这个函数用来评价蛋白质的结构好坏。能量函数的选择是蛋白质设计中另一个重要的因素。当前主流的分子力场amber,charrm,opls.的能量函数通常都有范德华,静电,氢键,键长,键角,二面角等项。
发明内容
为了克服目前现有技术的不足,本发明提供了一种基于粒子群方法的蛋白质设计方法,本发明采用的技术方案是:基于可极化力场以及pso优化的蛋白质设计方法,包括以下步骤:
通过蛋白质设计模板得到若干个蛋白质;对每一个蛋白质进行如下优化:
在4n维空间中连续移动的每一个粒子的子向量在rotamerlib中寻找最近的rotamer;然后用这些找到的rotamer构造一个临时的粒子;
计算每个临时粒子的适应度,并根据这些临时粒子的适应度更新局部最优粒子以及邻居最优粒子;并更新所有非临时粒子位置速度;通过比较所有邻居最优粒子的位置得到全局最优位置;粒子群优化结束;
用粒子群进行侧链构象组合空间搜索得到优化后的蛋白质。
所述每一个粒子的子向量代表一个4维的侧链构象。
计算每个临时粒子的适应度包括以下步骤:
首先将对应的蛋白质写到一个字符串中;然后调用tinker内置的pdbxyz模块进行格式转化得到analyze可以处理的xyz格式的字符串;调用analyze模块得到这个蛋白质对应的总能量,这个总能量即为适应度。
所述根据这些临时粒子的适应度更新局部最优粒子以及邻居最优粒子包括以下步骤:
每一个粒子都记录了一个局部最优位置和邻居最优位置,这个粒子pi移动之后会根据最近原则产生一个临时粒子tpi,如果tpi的适应度比pi记录的局部最优位置的适应度好,那么就更新局部最优的记录;如果tpi的适应度大于pi记录的邻居最优记录的适应度,那么就更新邻居最优的记录。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院大连化学物理研究所,未经中国科学院大连化学物理研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210563431.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:具有挡灰装置的循环流化床脱硫塔
- 下一篇:一种新干法后处理系统
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





