[发明专利]基于NSGA2算法的社交网络中种子节点的选择方法在审
申请号: | 201710024608.1 | 申请日: | 2017-01-11 |
公开(公告)号: | CN106780074A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 李磊;楚喻棋;汪萌;吴信东 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00 |
代理公司: | 安徽省合肥新安专利代理有限责任公司34101 | 代理人: | 陆丽莉,何梅生 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 nsga2 算法 社交 网络 种子 节点 选择 方法 | ||
技术领域
本发明属于社交网络多标签分类领域,具体的说是一种基于NSGA2算法的社交网络中种子节点的选择方法。
背景技术
现如今,我们处在一个信息高速流通交互的时代,随着互联网的高速发展,社交网络把人们联系起来,他们之间的联系可能是基于现实中的朋友关系、工作关系,或是同一篇文章的作者关系,或是网络中同一部电影的爱好者等等,运用社交网络的多标签预测方法可以通过对已知网络中节点的标签预测未知节点的标签从而对用户进行分类和划分社区,进而有针对性的进行信息推荐。
现有文献中已经有一些算法来解决网络中的多标签预测问题,比如MLKNN算法,RPC算法,wvRN算法,SCRN算法等。其中前两者属于传统的多标签预测方法,核心思想是将多标签转换为单标签,然后按照单标签问题处理,最后再将单标签的预测结果与相应的节点结合起来,成为多标签;后两者属于利用关系分类模型来解决多标签问题,核心思想是充分利用网络的拓扑结构,包括边和/或节点之间的连接关系及相邻节点等,借助网络的传播来预测节点的未知标签。
可随着社交网络规模的不断扩大,以及数据结构的复杂性不断增强,为了得到节点信息所引起的系统开销,特别是花费的时间和消耗的系统内存,不断增长。这无形中增加了预测网络中未知节点标签的成本。同时,这些额外增加的成本无疑给社交网络中多标签预测又增添了难度。上述方法只考虑了提高预测节点标签精度这一问题而忽略了随之产生的系统开销,产生了其他额外的成本,增加了运行算法的开销。
发明内容
本发明是为了解决上述现有技术存在的不足之处,提出一种基于NSGA2算法的社交网络中种子节点的选择方法,以期能在降低得到节点信息所花费系统开销,包括时间和内存消耗的前提下,较好的保证预测未知节点标签的精度和真实性,从而能低成本、高效、高精度的获得未知节点的标签,更好地对用户进行有针对性的信息推荐。
本发明为解决技术问题采用如下技术方案:
本发明一种基于NSGA2算法的社交网络中种子节点的选择方法,所述社交网络是由n个节点及它们之间连接关系组成的网络,定义任意第i个节点为ui,ui∈U={u1,u2,...,ui,...,un},1≤i≤n;定义存在nd个种子节点;并构成种子节点集合为其特点是:所述种子节点的选择方法是按如下步骤进行:
步骤一、建立所述种子集合I的目标函数及决策变量:
定义M个目标函数所组成的目标集合为f(x)={f1(x),f2(x),...,fm(x),...,fM(x)},fm(x)表示第m个目标函数;1≤m≤M;x表示n个决策变量所组成的决策变量集合,且x={x1,x2,...,xi,...,xn};xi表示第i个决策变量;
步骤二、建立目标空间集:
步骤2.1、确定所述社交网络中第i个节点ui的系统开销为表示第i个节点ui的第m种系统开销;从而得到n个节点的系统开销所组成的集合T={T1,T2,...,Ti,...,Tn};
步骤2.2、对所述n个节点的系统开销所组成的集合T进行归一化处理,得到归一化后的系统开销集合T′={T1′,T2′,...,Ti′,...,Tn′};
步骤2.3、采用scalable K-means edge clustering方法计算所述社交网络中第i个节点ui的社会维度向量SFi;从而得到n个节点的社会维度向量所组成的集合SF={SF1,SF2,...,SFi,...,SFn};
步骤2.4、定义阈值V∈(0,1);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710024608.1/2.html,转载请声明来源钻瓜专利网。