[发明专利]标签传播方法和装置有效
| 申请号: | 201611263101.3 | 申请日: | 2016-12-30 |
| 公开(公告)号: | CN106789588B | 公开(公告)日: | 2019-10-22 |
| 发明(设计)人: | 王阳 | 申请(专利权)人: | 东软集团股份有限公司 |
| 主分类号: | H04L12/58 | 分类号: | H04L12/58;G06Q50/00 |
| 代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 魏嘉熹;南毅宁 |
| 地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 标签 传播 方法 装置 | ||
本公开实施例涉及数据分析和复杂网络领域,提供一种标签传播方法和装置,能够提高标签传播迭代结果的稳定性和准确性,该方法包括:计算社交网络中每个节点的权值;将每个节点的标签和所述权值传播给与该节点有边相连的接收节点;迭代执行根据所述接收节点接收到的各个标签的数量以及标签来源节点的权值为所述接收节点赋予新的标签的步骤,直至预设标签传播结束条件满足为止。
技术领域
本公开实施例涉及数据分析和复杂网络领域,具体地,涉及一种标签传播方法和装置。
背景技术
标签传播算法是在社交网络分析领域中被广泛采用的算法,经常被用来自动挖掘社交关系中的“团结构”(即圈子)。
现有的标签传播算法主要包括以下步骤:(1)在初始阶段,为社交网络中的每个节点赋予一个独一无二的标签L,该标签L即为节点的初始标签值,其通常为例如字符串类型的值;(2)然后,通过多轮迭代计算,通过社交关系(即社交网络中的边)将标签向其他邻居节点传播。其中,在一轮迭代运算过程中,某个节点将根据与其有边联系的其他节点的标签来决定自己此轮应该赋予哪个标签,基本原则是:将其邻居节点的标签中出现次数最多的那个标签赋予自己,如果邻居节点的标签数目一样多,无法找出最多个数的标签,则随机赋予一个标签。每个节点都根据这个原则重新确定本轮迭代中本节点应该获得的新标签,这样就完成了一轮标签赋值运算。(3)当进行了多轮迭代运算后,绝大多数节点的标签不再发生变化时,这就是最终计算结果。
现有标签传播算法的主要缺点是,每次迭代结果不稳定,准确率不高。
发明内容
本公开的发明人发现,现有标签传播算法造成迭代结果不稳定的主要因素是更新标签的原则太简单,这样会导致大部分节点都是随机选取标签来更新自身的标签,导致迭代结果准确率不高。
本公开实施例的目的是提供一种标签传播方法和装置,能够使迭代结果稳定且准确。
为了实现上述目的,本公开实施例提供一种标签传播方法,该方法包括:
计算社交网络中每个节点的权值;
将每个节点的标签和所述权值传播给与该节点有边相连的接收节点;
迭代执行根据所述接收节点接收到的各个标签的数量以及标签来源节点的权值为所述接收节点赋予新的标签的步骤,直至预设标签传播结束条件满足为止。
可选地,所述根据所述接收节点接收到的各个标签的数量以及标签来源节点的权值为所述接收节点赋予新的标签,包括:
在所述接收节点接收到的数量最多的标签只有一个时,为该接收节点赋予该数量最多的标签作为新的标签。
可选地,所述根据所述接收节点接收到的各个标签的数量以及标签来源节点的权值为所述接收节点赋予新的标签,包括:
在所述接收节点接收到的数量最多的标签有至少两个时,计算各个所述数量最多的标签的来源节点的权值之和;
依据所述权值之和为所述接收节点赋予新的标签。
可选地,所述依据所述权值之和为所述接收节点赋予新的标签,包括:
在所述权值之和的最大值只有一个时,将该最大权值之和对应的标签赋予所述接收节点作为新的标签;
在所述权值之和的最大值有至少两个时,将该最大权值之和对应的标签中的其中一个标签赋予所述接收节点作为新的标签。
可选地,所述预设标签传播结束条件包括以下至少一者:
(1)迭代次数达到预设值;
(2)在单次迭代过程中,预设百分比的节点的标签没有发生变化。
本公开实施例还提供一种标签传播装置,该装置包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611263101.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多功能电热水壶
- 下一篇:一种食物料理机的防溢结构





