[发明专利]一种基于社交网络拓扑图的关联用户身份识别方法在审

专利信息
申请号: 202210429087.9 申请日: 2022-04-22
公开(公告)号: CN114782209A 公开(公告)日: 2022-07-22
发明(设计)人: 胡瑞敏;甄宇;任灵飞;吴俊杭;胡文怡;李登实 申请(专利权)人: 武汉大学
主分类号: G06Q50/00 分类号: G06Q50/00;G06F16/2458;G06F16/901
代理公司: 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人: 罗飞
地址: 430072 湖北省武*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 社交 网络 拓扑 关联 用户 身份 识别 方法
【说明书】:

目前的大多数方法都将社交网络嵌入到低维向量空间中,然后将用户对齐到低维空间中。然而,由于社会网络极其复杂和庞大,在网络嵌入过程中很容易受到不同邻居的误差传播和噪声的影响。基于此,本发明提供了一种基于社交网络拓扑图的关联用户身份识别方法,首先形成用户的ego网络(即提取用户的一节邻居形成的局部网络),然后使用随机游走提取用户节点序列,接着使用自然语言模型框架学习用户的低维向量表示,最后训练矩阵将两个社交网络映射到相同的特征空间中进行对齐。本发明通过利用ego网络可以避免高阶邻居带来的干扰,因此可以提高节点嵌入结果,提升关联准确度。

技术领域

本发明涉及多交网络数据分析及挖掘技术领域,尤其涉及一种基于社交网络拓扑图的关联用户身份识别方法。

背景技术

关联用户身份识别,旨在发现同一个用户在多个社交网络平台中的不同身份之间的对应关系,是多个社交网络数据分析及挖掘领域的关键技术,具有广泛的商业应用需求,在网络安全和个性推荐方面有着重要的应用。

目前大多数方法都是基于DeepWalk(Perozzi B.,AI-Rfou R.,SkienaS.DeepWalk:Online learning of social representations[C]//Proceedings of the20th ACM SIGKDD International Conference on Knowledge discovery and datamining.New York:ACM Press,2014:701-710.)的方法,该方法借鉴了Word2vec(MikolovT.,Sutskever I.,Chen Kai,et al.Distributed representations of words andphrases and their compositionality[C]//Proceedings of the 26th InternationalConference on Neural Information Processing Systems.Red Hook:CurranAssociates Inc.,2013:3111-3119.)方法。Word2vec方法是在自然语言处理中获取词向量的方法,可以将稀疏的,高维离散向量转化为相对稠密、低维连续的向量。虽然这种方法是用于词向量,通过中心词向量来重构它周围的词向量,但节点表示亦可借用这种思想。由于社交网络中节点和自然语言中的单词都具有幂律分布,所以DeepWalk方法便是由此来将词向量中的方法应用到社交网络中来。这种方法将随机游走和Skip-gram方法结合,采用随机游走的方式将社交网络中的节点提取出一条条的节点序列,然后利用Skip-gram方法得到节点的嵌入向量。但这种方法只是得到两个特征空间,并没有将特征空间统一起来。

之后,在2020年,Fan等人提出了ACCM的方法(Zhou F,Zhang K,Xie S,etal.Learning to Correlate Accounts Across Online Social Networks:An Embedding-Based Approach[J].INFORMS Journal on Computing,2020,32.),他们同样是利用随机游走提取出节点序列,然后通过Skip-gram方法将节点序列的集合映射为一个特征向量空间。这样就能得到两个社交网络各自的特征空间。为了将特征空间做统一,他们还利用部分已知的匹配用户做约束,来训练一个映射矩阵,这样便可以将两个社交网络的特征空间投影到同一个特征空间中。由此在这个统一的特征空间中做相似性度量,然后根据相似度结果做相似性用户身份关联。虽然这种方法减少了两个社交网络的特征向量空间的不同,难以更好的匹配所带来的误差,但由于其方法在进行网络嵌入时是使用的是整张社交网络,这样会导致节点的高阶邻居影响过大,而高阶邻居往往对节点并不会起到什么关键性的作用,相反可能还会引入更多的噪声干扰,使得节点嵌入结果并不是很准确,引入了更多的误差。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210429087.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top