[发明专利]一种基于布谷鸟搜索算法识别关键蛋白质的方法有效
| 申请号: | 201810112013.6 | 申请日: | 2018-02-05 |
| 公开(公告)号: | CN108319812B | 公开(公告)日: | 2021-07-23 |
| 发明(设计)人: | 雷秀娟;杨晓琴;陆铖;程适 | 申请(专利权)人: | 陕西师范大学 |
| 主分类号: | G16B5/00 | 分类号: | G16B5/00;G16B20/00;G16B40/00;G06N3/00 |
| 代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
| 地址: | 710062 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 布谷鸟 搜索 算法 识别 关键 蛋白质 方法 | ||
1.一种基于布谷鸟搜索算法识别关键蛋白质的方法,其特征在于,包括以下步骤:
1)将蛋白质相互作用网络转化为无向图
将蛋白质相互作用网络转化成一个无向图G=(V,E),其中,V={vi,i=1,2,…,n}为结点vi的集合,E为边e的集合,结点vi表示蛋白质,边e表示蛋白质之间的相互作用;
2)对蛋白质相互作用网络进行去噪处理
将无向图中在所有时间点下都没有共表达的两个相互作用的蛋白质结点之间的边删去,构建一个纯化的蛋白质相互作用网络;
3)对纯化后的蛋白质相互作用网络的边和结点进行处理
计算边的聚集系数ECC、边的皮尔森相关系数PCC、边的共享亚细胞定位值SSL以及蛋白质结点在蛋白质复合物中的参与度PC;
4)对所有的蛋白质结点按首次得分降序排列并产生鸟巢
将所有的蛋白质结点按照首次分值score1降序排序,选择排在前面的C1个结点为鸟巢的位置Nestl,其中l=1,2…C1;
其中,蛋白质结点的首次得分Score1由式(10)得到:
Score1(vi)=α×NPC(vi)+(1-α)×NSW(vi) (10);
式中,α是系数参数,α∈[0,1],NPC(vi)是结点vi的标准化的蛋白质复合物参与度值,由式(11)得到,NSW(vi)是结点vi的标准化的加权度值,由式(12)得到:
式中,min(PC)是所有蛋白质结点中最小的蛋白质复合物参与度值,max(PC)是所有蛋白质结点中最大的蛋白质复合物参与度值;
式中,min(SW)是所有蛋白质结点中最小的加权度值,max(SW)是所有蛋白质结点中最大的加权度值;
5)产生布谷鸟并向鸟巢聚集
对于每个鸟巢Nestl,l=1,2…C1,找出其所对应的一阶邻居结点和二阶邻居结点作为布谷鸟,将所有的一阶邻居结点添加到集合Neighborl(1)中,对于每个二阶邻居结点,产生一个随机概率rand,rand∈[0,1],如果rand0.5,则把该二阶邻居结点添加到集合Neighborl(2)中,否则,放弃添加该二阶邻居结点;
6)更新鸟巢适应值
将每个鸟巢Nestl,l=1,2…C1,对应的蛋白质结点,与其相应的一阶邻居Neighborl(1)和二阶邻居Neighborl(2),组成一个局部子图Subgraphl,局部子图的加权密度WDensityl为鸟巢Nestl新的适应值,也即为鸟巢Nestl对应的蛋白质结点的二次分值Score2;
7)输出关键蛋白质
将C1个鸟巢对应的蛋白质结点按二次分值Score2降序排序,将前C2个结点作为关键蛋白质输出,其中,C2≤C1。
2.根据权利要求1所述的基于布谷鸟搜索算法识别关键蛋白质的方法,其特征在于,步骤2)中,判断两个相互作用的蛋白质结点是否共表达,具体操作为:在时间点t时,结点vi的基因表达值Epit若大于该结点的基因表达活性阈值Active_Th(i),则认为结点vi在时间点t具有活性,否则认为该结点在时间点t不具有活性;若V中任意两个不同的结点v,u在时间点t同时具有活性,则认为在时间点t下结点v,u共表达。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810112013.6/1.html,转载请声明来源钻瓜专利网。





