[发明专利]基于社交网络知识图谱的跨网络人物关联方法有效

专利信息
申请号: 201910323380.5 申请日: 2019-04-22
公开(公告)号: CN110110094B 公开(公告)日: 2022-07-01
发明(设计)人: 李弼程;王瑞;杜文倩;郁友琴;马海江 申请(专利权)人: 华侨大学
主分类号: G06F16/36 分类号: G06F16/36;G06F16/9535;G06Q50/00
代理公司: 厦门市首创君合专利事务所有限公司 35204 代理人: 张松亭;林燕玲
地址: 362000 福建省*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 社交 网络 知识 图谱 人物 关联 方法
【说明书】:

发明公开了基于社交网络知识图谱的跨网络人物关联方法,属于知识图谱与社交网络分析领域,包括以下步骤:步骤1.训练词向量;步骤2.发现候选实体;步骤3.根据社交网络知识图谱的结构特征,计算网络度量指标;步骤4.用户向量生成;步骤5.定义社交网络结构相似度和用户画像语义相似度;步骤6.融合相似度计算,根据融合相似度确定待关联的人物实体的跨网络人物关联的最终节点。该发明可用于社交网络中挖掘用户信息,发现重要节点,也可以用作对重要节点信息的补全,为精准推荐提供数据支撑。

技术领域

本发明涉及知识图谱与社交网络分析领域,特别是指基于社交网络知识图谱的跨网络人物关联方法。

背景技术

随着社交网络的日益普及,数亿人花费大量的时间在社会媒体上以史无前例的速度分享、交流、联系和互动,并产生了海量的用户生成数据。利用社交媒体数据做社交媒体挖掘已经成为了一个快速发展的新领域。研究表明:至少50%的用户拥有两个或者多个社交网络账号,90%的新浪微博用户使用微信,至少80%的Facebook用户使用Twitter。所以分析不同社交网络的相同用户对于发现用户兴趣爱好,情感倾向等方面都有重要的意义。尽管社交网络数据呈现指数级的增长,用户在社交网络上的用户信息往往是不全面的。在具体的场景下,用户在一个社交网络平台上的邮箱是存在的,然而在另一个社交网络中可能是不存在的,因此通过关联不同社交网络中的相同用户,可以获取用户在其他社交网络中的属性信息和关系信息,用做社交网络知识图谱的补全和质量评估工作。

目前主流的跨网络用户关联方法,一般是对社交网络用户的注册用户信息进行分析,通过分析社交网络中的用户名、昵称、地理位置等属性,设计用户的相似度矩阵,基于此矩阵关联不同社交网络中的相同用户。然而,这些方法存在数据依赖严重的问题,如果采集的数据项基本为空,跨网络人物的关联就会丢失,而且这些方法均没有关注社交网络的图结构对于人物关联的重要性,均无法处理社交网络中的图关系,无法描述图模型的结构信息。

知识图谱是Google在2012年提出的一种知识表示形式,是一个大规模的语义网络,包含实体、概念以及实体和概念之间的语义关系。通过构建知识图谱,可以解决传统标签模式下不能解决的深层次推理问题和可视化展示问题。

所以,利用社交网络数据构建知识图谱,使用知识图谱的相关特性对社交网络的结果和内容进行分析。一方面,知识图谱使得社交网络分析效率更快,可以有效解决社交网络数据噪声大和完全无结构化的问题;另一方面,利用社交网络知识图谱可以充分挖掘社交网络的隐藏信息,为之后的用户精准画像与推荐提供数据支持。

发明内容

本发明的主要目的在于解决以上现有技术由于忽略社交网络的结构信息而导致的不能准确描述跨网络的人物关联的技术缺陷,提供了一种基于社交网络知识图谱的跨网络人物关联方法。

本发明采用如下技术方案:

基于社交网络知识图谱的跨网络人物关联方法,其特征在于,包括如下步骤:

步骤1.建立Structural Skip-Gram词向量训练模型,训练语义表征能力更强的词向量;

步骤2.利用社交网络知识图谱中存储的人物实体的属性,寻找与待关联人物实体相关的候选人物实体;

步骤3.根据社交网络知识图谱的结构特征,计算每一个候选人物实体与待关联人物实体的网络度量指标,其包括属性系数、PageRank值、中间中心性、特征向量中心性和聚类系数;

步骤4.基于社交网络知识图谱对候选人物实体与待关联人物实体构造用户画像,并使用训练好的Structural Skip-Gram词向量模型将用户画像表征为用户向量;

步骤5.基于网络度量指标定义社交网络结构相似度,基于用户向量定义人物实体的用户向量语义相似度;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华侨大学,未经华侨大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910323380.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top