[发明专利]基于人工蜂群繁殖机制的PPI网络聚类方法有效
申请号: | 201210232874.0 | 申请日: | 2012-07-06 |
公开(公告)号: | CN102779241A | 公开(公告)日: | 2012-11-14 |
发明(设计)人: | 雷秀娟;李永明;田建芳;裘国永;吴爽;尤梦丽 | 申请(专利权)人: | 陕西师范大学 |
主分类号: | G06F19/24 | 分类号: | G06F19/24 |
代理公司: | 西安恒泰知识产权代理事务所 61216 | 代理人: | 林兵 |
地址: | 710062 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工 蜂群 繁殖 机制 ppi 网络 方法 | ||
1.一种基于人工蜂群繁殖机制的PPI网络聚类方法,其特征在于,具体包括如下步骤:
1)将PPI网络转化为一个无向加权图:
将PPI网络转化成一个无向加权图G(V,E),其中,V={vi,i=1,2,…,n}为结点vi的集合,E为边e的集合,结点vi表示蛋白质,边e表示蛋白质之间的相互作用,wij表示结点vi和结点vj之间相互作用的大小,也就是结点vi和结点vj之间边eij的权值,若vi和vj之间没有边则wij=0,i=1,2,…,n,j=1,2,…,n;
2)参数设置:
令count,maxcount分别表示控制外循环的当前迭代次数和外循环对应的最大迭代次数,maxcount∈[10,1000],并令count=1;iter,maxiter分别表示控制内循环的当前迭代次数和内循环对应的最大迭代次数,maxiter∈[10,200];N和S分别表示蜂后婚飞时的能量和速度,N∈[50,1000],S∈[10,500];fval,gfval分别表示当前适应度和全局最优适应度,令gfval=∞;cluster,gcluster分别表示当前的聚类结果和全局最优聚类结果;visited是结点被访问标记;n表示蛋白质结点个数,T表示蜂后与雄蜂交配成功的计数器;
3)对PPI网络的每个结点vi和每个边e进行预处理:
所述对结点vi预处理是计算结点vi的加权网络综合特征值com-valuei;所述对边e预处理是计算改进的边聚集系数CCi,j;
4)计算所有结点的加权网络综合特征值com-valuei的代数平均值Av-com-value,将大于Av-com-value*W的结点保存,其中W∈[0.5,2];
5)初始化蜂后:
令iter=1,蜂后代表聚类中心,初始化蜂后就是确定第一个聚类中心,从大于Av-com-value*W的结点中随机选取一个结点作为第一个蜂后,并令该蜂后结点的visited=1;
6)婚飞过程:
给蜂后的能量和速度赋初值,令N=100,S=50,令蜂后与雄蜂交配成功的计数器T=0,将与蜂后结点的改进的边的聚集系数CCi,j大于零的结点作为要与蜂后交配的雄蜂,将所有雄蜂结点按照该雄蜂结点与蜂后结点的改进的边的聚集系数CCi,j降序排列,排序后的雄蜂依次与蜂后交配,每交配成功一次,蜂后的速度S和能量N就以式10和式11衰减一次;通过式9计算每个雄蜂结点与蜂后结点的交配成功概率P(i),同时生成一个[0,1]之间的随机数rand,若P(i)>rand,则交配成功,将该雄蜂的精子加入蜂后的受精囊中,并将该雄蜂结点的访问标记visited修改为1,计数器T=T+1;交配失败则继续与下一个雄蜂交配,直至蜂后的能量N小于能量阈值Thred∈[0.01,0.99]或者蜂后的受精囊中的精子数量大于M∈[20,200],一次婚飞过程结束;进入幼蜂的局部搜索过程;
P(i)=exp[-Δ(f)/S(t)] 式9
其中,P(i)表示雄蜂结点vi和蜂后交配成功的概率;-Δ(f)表示雄蜂结点vi和蜂后结点加权网络综合特征值com-valuei的差值;S(t)是蜂后在时刻t的速度S;
蜂后的速度S和能量E以式10和式11的方式衰减:
S(t+1)=α*S(t) 式10
N(t+1)=N(t)-β*N(t)/M 式11
其中,v*N(t)/M是每次转移后能量的消耗量;β∈[0.5,2]为能量衰减因子;E(t)表示当前蜂后的能量,E(t+1)表示与一个雄蜂交配后的蜂后的能量;S(t+1)表示与一个雄蜂交配后的蜂后的速度;M表示受精囊大小,α∈[0,1]为每次速度的衰减因子;
7)幼蜂的局部搜索过程:
将蜂后受精囊中每个精子结点的邻接点中结点加权网络综合特征值com-valuei最大的结点保存下来,作为发育优良的幼蜂结点;
8)蜂后的选优过程:
从发育优良的幼蜂结点中选取结点加权网络综合特征值com-valuei最大的结点作为新的蜂后结点,从而更新了聚类中心;
9)iter=iter+1,如果iter<=maxiter,并返回步骤6),否则,转向步骤10);
10)计算当前适应度fval;若当前适应度fval<gfval,则令gcluster=cluster,gfval=fval;否则gcluster和gfval不变;
11)count=count+1,如果count<=maxcount,并令所有结点的访问标记visited=0,并返回步骤4),否则,输出全局最优聚类结果gcluster。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210232874.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种无线智能控制开关
- 下一篇:一种具有无线功能的急停开关
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用