[发明专利]一种在PPI网络中基于遗传算法识别关键蛋白质的方法有效
申请号: | 201710144806.1 | 申请日: | 2017-03-06 |
公开(公告)号: | CN107092812B | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 刘维;吴蔷梅;陈昕 | 申请(专利权)人: | 扬州大学 |
主分类号: | G16B10/00 | 分类号: | G16B10/00;G16B20/00;G06N3/12 |
代理公司: | 南京中新达专利代理有限公司 32226 | 代理人: | 孙鸥;朱杰 |
地址: | 225009 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 ppi 网络 基于 遗传 算法 识别 关键 蛋白质 方法 | ||
本发明涉及一种在PPI网络中基于遗传算法识别关键蛋白质的算法。本发明在蛋白质相互作用网络中产生初始种群,对个体的适应度计算,赌轮的方法选择操作,在随机挑选的个体对之间进行交叉操作,变异操作,对多个个体解进行局部优化。本发明克服了已有的方法各自存在的缺陷。本发明对该指标进行优化,融合了生物信息,可靠性更高,减少了许多不必要的计算,而且能够对预测出来的关键蛋白质进行局部优化,提高在关键蛋白质识别方面的效率,扩展了该技术在生物信息领域的应用范围和实用性。
技术领域
本发明属于生物信息技术领域,主要是在蛋白质相互作用网络中通过遗传算法识别关键蛋白质的技术,特别涉及一种在PPI网络中基于遗传算法识别关键蛋白质的算法。
背景技术
关键蛋白质是指那些生命有机体所必须的蛋白质,敲除关键蛋白质可能会导致生命体无法生存。对关键蛋白质的识别在生物体生存、药物标靶设计、疾病治疗等方面有着重要的应用价值。
在关键蛋白质识别领域,最初是通过生物实验来识别,比如单基因敲除,但是需要花费大量的人力、物力和时间。随着高通量技术的发展,如酵母双杂交、串联亲和纯化等,这些实验产生了大量的蛋白质相互作用关系,所以出现了许多基于蛋白质相互作用网络的识别关键蛋白质的方法。但是这些方法大多都是只考虑了蛋白质相互作用网络拓扑结构,而没有考虑生物信息,或者只考虑了一种生物信息,导致识别出来的关键蛋白质准确率较低。
在本发明作出之前,在已有的方法中,大多都是要计算出所有的关键蛋白质,然后在识别出来的关键蛋白质中取它度较大的P个,这样识别关键蛋白质的缺点是:(1)在实际应用中只关心哪P个的指标较大,关键程度高,而没有必要增加计算量来将蛋白质的某种指标逐一计算,然后对其进行排序,取其中较大的P个。(2)就单个蛋白质而言某种指标较高,但就指标最高的P个而言,其关键性在PPI网络中整体的程度未必最高,也可能只是某一局部顶点的代表,特别是一些采用局部链接指标,或者是采用连接密切度逐步扩大的算法,这样更容易导致最优解的局部性。
发明内容
本发明的目的就是要克服上述缺陷,提供一种在PPI网络中基于遗传算法识别关键蛋白质的算法。
本发明的技术方案是:
一种在PPI网络中基于遗传算法识别关键蛋白质的方法,其主要技术特征在于,包括如下步骤:
(1)在蛋白质相互作用网络中产生初始种群;
(2)对个体的适应度计算:对种群中的个体,通过适应度函数计算其适应度值;
(3)选择操作:对种群中的个体,按其适应度值采用赌轮的方法选择其参加下一代的种群;
(4)交叉操作:交叉操作是按一定概率在随机挑选的个体对之间进行;
(5)变异操作:变异操作是按一定的概率在随机挑选的个体上进行的,在进行变异时,随机挑选新个体中的d个蛋白质,将替换成随机挑选的其他蛋白质;
(6)局部优化:对多个个体解进行局部优化。
本发明的优点和有益效果在于提出了一种衡量Top-P关键蛋白质的整体性指标,并对该指标进行优化,该方法在考虑网络拓扑的基础上也融合了生物信息,使得预测结果更加的准确,可靠性更高。同时本发明提出的方法能够整体度量P个蛋白质的关键性,从而减少了许多不必要的计算,而且能够对预测出来的关键蛋白质进行局部优化。该技术可以提高在关键蛋白质识别方面的效率,扩展了该技术在生物信息领域的应用范围和实用性。
附图说明
图1——本发明流程示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬州大学,未经扬州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710144806.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于掘进机本体耳板更换的工装
- 下一篇:一种工业机器人装配工作站的送料机构