[发明专利]一种社交网络中影响力最大化节点的探测方法及系统有效
| 申请号: | 202011415910.8 | 申请日: | 2020-12-03 |
| 公开(公告)号: | CN112446634B | 公开(公告)日: | 2021-08-06 |
| 发明(设计)人: | 李泽鹏;杨膳宇;黄日葵 | 申请(专利权)人: | 兰州大学 |
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/00;G06K9/62 |
| 代理公司: | 温州名创知识产权代理有限公司 33258 | 代理人: | 陈加利 |
| 地址: | 730000 甘肃*** | 国省代码: | 甘肃;62 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 社交 网络 影响力 最大化 节点 探测 方法 系统 | ||
本发明提供一种社交网络中影响力最大化节点的探测方法,包括获取网络模型;遍历网络模型中所有节点,计算出各节点在二阶邻居范围内的影响力传播期望值;以节点的影响力传播期望值为指标,依次将所有节点对应的放入初始为空的大顶堆中;从堆顶弹出影响力期望值最大的节点加入种子节点集合,更新该节点的所有邻居节点的影响力期望值;计算该节点和所有邻居节点的相似性,在大顶堆中将相似性不大于预设阈值的邻居节点进行重新插入操作,直至堆中弹出k个节点,这些节点作为影响力最大化种子节点集合输出。实施本发明,不仅计算复杂性低且效率高,还能解决影响力覆盖范围重叠的问题。
技术领域
本发明涉及社交网络技术领域,尤其涉及一种社交网络中影响力最大化节点的探测方法及系统。
背景技术
随着科学技术的飞速发展,人类进入了Web2.0时代。随着微博,微信,抖音等网络应用的用户越来越多,网络的使用越来越普及,人们日常生活中的沟通和交流通过网络应用进行连接,构成庞大的社交网络。社交网络结构中蕴含着巨大的信息,对社交网络的研究和分析具有巨大的经济价值和社会价值。
影响力最大化问题是社交网络分析中一个实际问题,由于其应用场景非常丰富,已经成为社交网络研究领域中的热点问题。例如,当商家需要推广产品时,选择那些人群作为初始传播者,才能使得产品推广的效果达到最好呢?这就是影响力最大化问题对应的原始问题。
影响力最大化问题就是在一个真实社交网络中通过某种方法找到k个最有影响力的种子节点作为信息传播源,使得整个种子节点集合产生的影响力传播范围最大,适用于包括但不限于病毒营销、生物细胞结构分析、舆情控制和病毒传染等等场景。
目前,社交网络中解决影响力最大化问题的近似算法主要有多种算法。例如,Kemp和Kleinberg等人在独立级联模型和线性阈值模型上证明了影响力最大化问题是一个NP难的问题,提出贪心算法来计算种子节点集的影响结果能够达到最优解。但是上述贪心算法存在不足之处,其不足之处在于:(1)该算法使用蒙特卡洛模拟去近似估计网络中每个节点的影响力增益,为保证准确性而导致蒙特卡洛模拟的次数很高(一般设置为10000次);(2)当选择一个节点之后,后续仍需要对每一个节点重新计算影响力增益,使得计算量非常大,从而造成在庞大的社交网络数据集中,难以快速高效找出具有最大影响力的种子节点集。又如,Leskovec和Krause等人提出了对原始的贪心算法进行改进的CELF算法,通过计算节点影响力增益的上界,然后利用目标函数的子模性,在计算过程中使用节点的影响力上界代替节点的真实影响力,尽管能够避免贪心算法中大量不必要计算,大幅度提高计算效率,但是在大型网络中选择少量种子节点仍然需要很长的时间。
因此,许多启发式算法被相继提出,启发式算法通过分析网络的拓扑结构,从而提取出一个能够近似度量节点影响力的指标,基于此指标对节点的影响力进行排序,从而快速有效的选择出有较大影响力的种子节点集。
在社交网络中,常用的启发式指标有度、接近中心性、介数中心性、距离中心性、特征向量中心性、核数等。介数中心性、接近中心性等个别指标具有较大的计算复杂度,在大型网络中仍然不适用于评估节点重要程度,从而用于求解影响力最大化问题,所以选择计算复杂性较小的指标精确的度量节点在社交网络中的影响力是我们接下来努力的方向。例如,Chen等人基于度指标提出DegreeDiscount算法。节点的度是一个重要指标,基于节点度选取的种子节点传播范围通常优于其他指标。度大的节点可能大概率集中在同一区域,这样虽然单个节点的影响力较大,但是造成了影响力范围覆盖较大的问题,造成整体上影响力传播范围较小。考虑到这一点,度折减算法首先按照节点的度选择第一个种子节点,在后续的选择过程中,考虑到节点和邻居节点之间的相互影响,为了减少邻居节点在下一轮被选中的几率,因此对节点的度进行折减,使选择的种子节点具有较大的度同时,也让节点尽量分散,该算法运行时间短并且能到达到与贪心算法近似的传播范围,但是该方法只是基于一阶邻居范围,经过详细分析,二阶范围邻居也是一个非常重要的参考因素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于兰州大学,未经兰州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011415910.8/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





