[发明专利]基于节点支配能力相似性的功能模块检测方法有效
| 申请号: | 201410267391.3 | 申请日: | 2014-06-16 |
| 公开(公告)号: | CN104021199B | 公开(公告)日: | 2017-04-19 |
| 发明(设计)人: | 高琳;王炳波;郭杏莉;王玙;邓岳 | 申请(专利权)人: | 西安电子科技大学 |
| 主分类号: | G06F19/24 | 分类号: | G06F19/24;G06K9/62 |
| 代理公司: | 陕西电子工业专利中心61205 | 代理人: | 王品华,朱红星 |
| 地址: | 710071*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 节点 支配 能力 相似性 功能模块 检测 方法 | ||
技术领域
本发明属于数据挖掘领域,特别涉及有向复杂网络中基于节点支配能力相似性的功能模块检测方法,可用于基于大数据的知识发现等。
背景技术
通常在真实网络数据中,本质上隶属于同一模块的个体具有高度相似的功能,例如,社会网络中,同一社团的个体通常具有相同兴趣爱好;生物网络中,同一复合体中的蛋白质共同参与完成某个特定生物过程;技术网络中,同一组页面通常表达相近的主题。采用分层聚类的方法来发现网络中的功能模块时,第一步就是要计算网络中各个节点之间的相似性,然后通过凝聚或分裂过程将相似性高的节点划分到相同的模块中。
典型的相似性度量包括如下几类:
1.共享邻居
这类指标认为两个节点x、y的共同邻居个数越多,其相似值sxy越大。基于这种思想的相似性度量指标有十多种不同的变形,这里给出最常见的基于Jaccard系数的方法:
其中Γ(x)表示节点x的邻居节点的集合。
2.聚集系数
聚集系数相似性表示了两个节点x、y参与同一个社团结构的可能性,用网络中实际包含边(x,y)的三角形个数,除以包含该边的三角形的最大可能个数,边(x,y)的聚类系数Cxy定义为:
其中zxy为网络中实际包含该边的三角形个数,dx、dy为节点x、y的度,min(dx-1,dy-1)计算了包含该边的最大可能的三角形个数。边的聚类系数越大,两个节点的相似度越高,反之则越低。
3.可达路径
基于可达路径的相似性指标在共享邻居的基础上又考虑了更高阶的邻居,定义为:
S=A2+αA3 (3)
其中α为可调参数,A为网络的邻接矩阵。这种相似性指标也有一些变形,例如对短路径赋予更大权重的Katz指标,考虑邻居节点对相似性的影响的LHN-II指标等。
4.随机游走
多种基于随机游走策略的节点相似性也被广泛应用到复杂网络分析中。包括平均通勤时间ACT指标、基于随机游走的余弦相似性Cos+、带重新启动的随机游走RWR、SimRank指标、局部随机游走LRW等。
现有的大量相似性指标为复杂网络数据的聚类应用提供了重要依据,但都是基于无向结构定义。它们的计算过程忽略了边的方向性,没能刻画节点间不可逆的功能关系;倾向于给度大的节点以更高的拓扑显著性,致使聚类算法倾向于挖掘出连接稠密的功能子图。然而,很多真实网络数据是非常稀疏的,节点间的相互影响是方向性特异的,系统功能也是通过有向、非稠密子图结构行使的。如术语网络中节点间的定义关系是有向的,生物网络中的生化反应是不可逆的;所需要检测的术语功能模块多为有向路径结构,而生物大分子也是通过非稠密的路径结构来行使功能的。因此上述现有相似性度量方法无法有效应用于有向、稀疏网络的功能模块检测中。
发明内容
本发明的目的在于针对上述已有技术的不足,提出一种有向复杂网络中基于节点支配能力相似性的功能模块检测方法,以对稀疏网络中的知识发现提供可靠的工具支持。
实现本发明目的的技术思路是:分析网络节点间有向的控制关系,刻画与稠密性无关的、节点定向支配网络的能力大小,从支配系统动态控制过程的角度衡量网络节点的功能相似性,给出支配能力相似性的计算方法,并将该指标应用到几类真实有向网络数据的聚类分析中,检测出与动态控制过程相关的、非稠密功能子图结构。其具体步骤如下:
(1)数据处理:
(1a)输入网络数据,用有向图G(V,L)对其建模,其中V为节点的集合,L为连接节点的边的集合;
(1b)设初始时刻t=0,计算有向图G(V,L)的最大匹配Mt;
(2)基于最大匹配Mt,构造网络的控制格局和观测格局:
(2a)用最大匹配Mt将有向图G(V,L)划分成不相交的径、环结构;
(2b)检索有向图G(V,L)中所有从径的非顶节点指向环的边,组成控制附加边集合CL;
(2c)用Mt∪CL中的边连接节点集合V,得到一个能反映出控制所有节点状态方式的子图CF(V,Mt∪CL),作为网络的控制格局;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410267391.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种刺梨来料清洗设备
- 下一篇:平衡角度尺子
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





