[发明专利]一种具有线性时间复杂度的影响力最大化算法在审
申请号: | 201710327552.7 | 申请日: | 2017-05-09 |
公开(公告)号: | CN107423842A | 公开(公告)日: | 2017-12-01 |
发明(设计)人: | 武红春;尚家兴;周尚波;冯永;万里;许冶金 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04 |
代理公司: | 北京同恒源知识产权代理有限公司11275 | 代理人: | 赵荣之 |
地址: | 400044 重*** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 具有 线性 时间 复杂度 影响力 最大化 算法 | ||
技术领域
本发明属于计算机数据挖掘领域,具体涉及一种具有线性时间复杂度的影响力最大化问题求解方法,尤其涉及如何通过迭代的方式高效求解影响最大化问题。
背景技术
已有研究表明,口碑效应在现代营销中具有重要作用,由此催生了大量的相关研究工作,其中的研究热点之一就是影响力最大化问题。影响力最大化问题研究如何从网络中选择k个传播源,使得通过口碑效应达到的传播效果最好,相关研究成果在市场推广、疾病控制、信息扩散等领域具有广泛应用。影响力最大化问题由Kempe等最先给出其形式化描述,对于网络G(V,E),影响力最大化问题要求找到一个种子节点集合S*,使得从S*开始,在某种传播模型下(如IC、LT),最终的传播影响范围最广,即:
S*=argSmaxσ(S)
其中,σ(S)是一个评价影响范围的函数,被定义为最终被影响的节点数的期望。
Kempe等证明,在经典的线性阈值(LT,Linear Threshold)和独立级联(IC,Independent Cascade)传播模型下,该问题是一个NP难题,且目标函数满足子模特性。基于子模函数的性质和相关理论,Kempe等进一步给出了求解该问题的一个“爬山式”贪心算法,该算法得到的解是最优解的(1-1/e-ε)近似(约等于63%)。在实际中,该算法的解与最优解已相当接近。但由于需要重复上万次蒙特卡洛仿真来计算目标函数值,导致该算法效率极低,只能适用于规模很小的网络。很多研究者针对该问题提出了新的算法,其中大多数算法都以优化效率为目的。
其中一类算法基于传统的贪心算法并利用传播模型的子模特性,如Leskovec等人提出的CELF(Cost-Effiective Lazy Forward)算法和Goyal等人提出的CELF++算法等。这些算法与传统的贪心算法相比,运行时间大大降低。但考虑到这些算法在每次迭代中仍然需要进行多次蒙特卡罗仿真去评估目标函数值,从根本上限制了它们的时间效率,不能高效地处理大规模网络。
为此,也有研究者提出了基于节点度量指标的启发式算法。这些算法的基本思想是直接选择具有最高度量指标值的k个节点。其中研究都使用节点的度作为选择种子节点的度量指标,但是它们之间也存在着一定的差异。具体来说,若节点v的某个邻居节点已被选择,则算法将不会再选择v,而Single-Discount算法则只是将节点v的度量指标(即v的度值)降低,节点v在后续的步骤中仍有可能被选中为种子节点。Suri等还提出了基于Shapley值的启发式算法,Shapley值是博弈论中常用于评价个体竞争力的一种度量指标。Kundu等提出了基于扩散度(Diffusion Degree)的算法,扩散度是一个用于评估节点扩散信息能力的中心性度量指标。这些算法的优点是时间效率很高,但其普遍缺点是仅使用了网络的拓扑结构信息,没有充分考虑具体的传播模型,导致其在实际应用中的准确性不足。
此外,还有研究者提出基于路径的算法。这类算法的普遍思想是假设影响力在网络中只能沿着某些特定的路径来传播,从而可以近似求解影响力最大化问题。基于该思想,Kimura等人提出了SP1M(最短路径模型)方法,该方法假定只有最短和次短路径可以传播影响力。陈卫等提出PMIA算法,与SP1M相比,PMIA使用节点u的局部传播子树来近似其影响。Kim等人还提出了IPA(Independent Path Algorithm)算法,其考虑了所有路径,只要这些路径的传播概率大于给定阈值,并假定不同的路径彼此独立。这些算法的优点是结合了网络的传播模型,因而比单纯基于节点度量指标的算法更准确,但其缺点是需要大量的存储空间来维护图中的路径信息,从而限制了其在大规模网络上的应用。
除了上述方法外,还有许多其他影响力最大化方法,如基于社区的算法、GPU加速算法、图剪枝算法、基于时间限制模型的算法等。
发明内容
有鉴于此,本发明的目的在于提供一种具有线性时间复杂度的影响力最大化算法,该算法能够根据给定的传播模型设计递归公式,然后以迭代的方式快速计算网络中节点的影响力,从而极大地提高算法效率。
本发明的目的是通过以下技术方案来实现的,一种具有线性时间复杂度的影响力最大化算法,其特征在于:包括以下步骤:
S1影响力计算;以迭代的方式计算任意给定节点u的γ邻域影响力,并以此作为该节点的全局影响力的近似表示;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710327552.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理