[发明专利]基于社交网络知识图谱的跨网络人物关联方法有效
| 申请号: | 201910323380.5 | 申请日: | 2019-04-22 |
| 公开(公告)号: | CN110110094B | 公开(公告)日: | 2022-07-01 |
| 发明(设计)人: | 李弼程;王瑞;杜文倩;郁友琴;马海江 | 申请(专利权)人: | 华侨大学 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/9535;G06Q50/00 |
| 代理公司: | 厦门市首创君合专利事务所有限公司 35204 | 代理人: | 张松亭;林燕玲 |
| 地址: | 362000 福建省*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 社交 网络 知识 图谱 人物 关联 方法 | ||
1.基于社交网络知识图谱的跨网络人物关联方法,其特征在于,包括如下步骤:
步骤1.建立Structural Skip-Gram词向量训练模型,训练语义表征能力更强的词向量,包括:
步骤1.1获取的社交网络语料并进行数据预处理,包括中文分词和去停用词;
步骤1.2基于Skip-Gram模型,加入多个投影层,用于表征上下文词序信息;
步骤1.3定义Structural Skip-Gram词向量模型的目标函数,完成Structural Skip-Gram词向量模型的训练;
步骤2.利用社交网络知识图谱中存储的人物实体的属性,寻找与待关联人物实体相关的候选人物实体;
步骤3.根据社交网络知识图谱的结构特征,计算每一个候选人物实体与待关联人物实体的网络度量指标,其包括属性系数、PageRank值、中间中心性、特征向量中心性和聚类系数,所述网络度量指标的计算方法如下:
步骤3.1基于社交网络知识图谱人物实体的用户名属性,经过词向量表征后,求每一维向量的平均值,作为人物实体的属性系数;
步骤3.2基于PageRank计算网页重要性的思想,对每一个人物实体进行PageRank值的计算;
步骤3.3基于社交网络媒体挖掘的中心性方法,计算每一个人物实体的中间中心性;
步骤3.4基于社交网络媒体挖掘的中心性方法,计算每一个人物实体的特征向量中心性;
步骤3.5基于社交网络媒体挖掘的传递性原理,对每一个人物实体进行聚类系数的计算;
步骤3.6将计算的五个网络度量指标做归一化处理,将归一化后的网络度量指标向量化;
步骤4.基于社交网络知识图谱对候选人物实体与待关联人物实体构造用户画像,并使用训练好的Structural Skip-Gram词向量模型将用户画像表征为用户向量;
步骤5.基于网络度量指标定义社交网络结构相似度,基于用户向量定义人物实体的用户向量语义相似度;
步骤6.根据社交网络结构相似度和用户向量语义相似度计算人物实体的融合相似度,根据融合相似度确定待关联的人物实体的跨网络人物关联的最终节点。
2.如权利要求1所述的基于社交网络知识图谱的跨网络人物关联方法,其特征在于,所述步骤2具体包括如下:
首先,确定社交网络知识图谱中待关联人物实体的指称项v;
然后,对社交网络知识图谱的设有人物实体指称项v的属性进行查询,查询与该待关联人物实体的指称项v属性相同的人物实体;
最后,将匹配到的所有人物实体作为跨网络人物关联的候选人物实体集合。
3.如权利要求1所述的基于社交网络知识图谱的跨网络人物关联方法,其特征在于,所述步骤4中用户画像以及用户向量构建的方法为:
步骤4.1根据社交网络知识图谱中存储的人物实体的用户属性,查询社交网络知识图谱中人物实体对应的全部属性信息;
步骤4.2基于查询的结果,对重要特征进行提取,构建人物的基于属性的用户画像;
步骤4.3利用步骤1训练的词向量,对构建的用户画像向量化表示,构建基于属性的用户向量。
4.如权利要求1所述的基于社交网络知识图谱的跨网络人物关联方法,其特征在于,所述步骤5中,相似度定义方法为:
步骤5.1计算社交网络结构的相似度,采用修正的余弦相似度的计算方法,去中心化之后再进行相似度计算;
步骤5.2采用交叉余弦相似度的方法计算用户向量的语义相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华侨大学,未经华侨大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910323380.5/1.html,转载请声明来源钻瓜专利网。





