[发明专利]一种基于知识图谱中实体相似度的社区发现方法及装置有效

专利信息
申请号: 201810498426.2 申请日: 2018-05-23
公开(公告)号: CN108959370B 公开(公告)日: 2021-04-06
发明(设计)人: 王宏志;邹开发;万晓珑;杨东华 申请(专利权)人: 哈尔滨工业大学
主分类号: G06F16/36 分类号: G06F16/36;G06Q50/00
代理公司: 北京格允知识产权代理有限公司 11609 代理人: 周娇娇;李亚东
地址: 150001 黑龙*** 国省代码: 黑龙江;23
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 知识 图谱 实体 相似 社区 发现 方法 装置
【说明书】:

发明涉及数据处理技术领域,提供了一种基于知识图谱中实体相似度的社区发现方法及装置,该方法包括:使用知识图谱存储社交网络数据,并计算杰卡德距离得到相似度矩阵;根据所述相似度矩阵计算所述知识图谱中的相似节点集合;根据所述相似节点集合进行迭代的标签传播,并根据迭代后的每个节点的标签列表来确定该节点最终的社区标签,以进行社区发现。我们利用知识图谱存储社区网络,避免了对缺失数据的结构的存储,同时以此为基础将杰卡德距离作为相似度的计算基准,使其准确度更高。

技术领域

本发明涉及数据处理技术领域,尤其涉及一种基于知识图谱中实体相似度的社区发现方法及装置。

背景技术

在庞大的社交网络中,通常存在着大量的用户实体以及与其相关的事件、地点等,而不同的用户实体之间往往在行为、信息等方面具有一定的相似性,而用户通常并没有办法准确而高效的搜索到这些与自己相似的用户。因此,对社交网络中的用户实体的相似性进行挖掘,并分析相似用户的信息和行为,可以达到对用户进行好友和个性化行为推荐等功能的目的。

另一方面社交网络中相似的用户群体往往是具有相似爱好、性格的小团体,从而可以组成社交网络中的社区,对用户进行社区推荐,也可以帮助用户更快速地认识新的好友。

目前,对社交网络中的实体相似性的挖掘通常是基于用户之间的相似性度量(余弦相似性、皮尔逊相关系数等)在网络中进行搜索,通过对属性进行计算得到用户的相似度矩阵,然后进行相似度的分析。

目前的社区发现方法则主要分为标签传播现方法与模块度方法,代表算法为LPA算法与GN算法。标签传播现方法通过对节点的标签进行迭代传播达到划分社区的目的。但是该方法对用户的联系均是通过图中节点的连通性进行判断,但在社区网络中,相似的用户并不一定是直接连通的,反之,即使是连通的用户之间,也未必存在着较高的相似性。这使得算法在迭代期间,搜索空间变大,从而消耗了更多的时间复杂度。模块度方法是通过计算边介数这一概念对社区进行划分,而边介数同样依靠节点的联通性,正如上所言,由于联通的用户未必相似,这使得模块度算法也同样会存在一定的偏差。

发明内容

本发明要解决的技术问题在于,针对现有社区发现方法以上一个或多个缺陷,提供了一种基于知识图谱中实体相似度的社区发现方法及装置。

为了解决上述技术问题,本发明提供了基于知识图谱中实体相似度的社区发现方法,包括:

使用知识图谱存储社交网络数据,并计算杰卡德距离得到相似度矩阵;

根据所述相似度矩阵计算所述知识图谱中的相似节点集合;

根据所述相似节点集合进行迭代的标签传播,并根据迭代后的每个节点的标签列表来确定该节点最终的社区标签,以进行社区发现。

可选地,所述根据所述相似度矩阵计算知识图谱中的相似节点集合,包括:

接收预设半径和相似度阈值;

对于知识图谱中的每个节点,搜索当前节点的预设半径范围内与所述当前节点相似度大于相似度阈值的节点,加入当前节点的相似节点集合。

可选地,所述根据所述相似节点集合进行迭代的标签传播,包括:

为知识图谱中的每个节点初始化标签列表,每个节点的标签列表中初始化具有唯一的标签,且权重为1;

设当前迭代次数的初始值为0,判断当前迭代次数是否小于预设迭代次数,是则依次对所述知识图谱中的每个节点进行标签传播操作,其中对于当前节点而言,以当前节点作为监听者,并将当前节点的相似节点集合中的所有节点作为传播者,将每个传播者的标签列表中权重最大的标签以及与权重发送给作为监听者的当前节点;在知识图谱中的每个节点均执行完该轮标签传播操作后,当前迭代次数加1,开始下一轮迭代,在当前迭代次数达到预设迭代次数时结束迭代。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810498426.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top