[发明专利]基于向量压缩与重构的社交网络特征动态提取方法在审

专利信息
申请号: 202010873148.1 申请日: 2020-08-26
公开(公告)号: CN112052940A 公开(公告)日: 2020-12-08
发明(设计)人: 张琛;李春奕;鱼滨;谢宇;樊一鸣;徐鑫航 申请(专利权)人: 西安电子科技大学
主分类号: G06N3/04 分类号: G06N3/04;G06N3/08;G06K9/46;G06K9/62;G06Q50/00
代理公司: 陕西电子工业专利中心 61205 代理人: 田文英;王品华
地址: 710071*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 向量 压缩 社交 网络 特征 动态 提取 方法
【说明书】:

本发明公开了一种基于向量压缩与重构的社交网络特征动态提取方法。其步骤为:(1)生成训练集;(2)构建深度半监督自编码器网络;(3)构造生成对抗网络;(4)训练网络;(5)在生成对抗网络中完成对社交网络的动态特征提取。本发明搭建并训练了深度半监督自编码器网络,能更好地捕获高阶的社交网络结构信息,基于生成对抗网络的动态特征提取方法,使得本发明在处理大型社交网络时有着较短的处理时间和较大的空间利用率。

技术领域

本发明属于物理技术领域,更进一步涉及向量表示技术领域中的一种基于向量压缩与重构的社交网络特征动态提取方法。本发明社交网络特征动态提取方法,用特征向量形式维护了社交网络的网络拓扑和时序演变特性,并将提取的特征用于社交关系发现,社团关系划分等网络结构数据挖掘任务。

背景技术

社交网络特征动态提取方法基于网络拓扑结构特征,通过对网络的动态建模,实现网络的低维向量化表达,来发掘网络的演变规律并动态提取社交网络特征。通常采用矩阵分解、随机游走、自编码器等神经网络技术进行动态网络特征提取,后续将捕捉到的网络特征输入到各类社交网络背景下的实际问题中进行求解,包括且并不限于社交关系预测、社团划分和推荐系统等网络结构数据挖掘任务。然而这些算法模型应用于动态特征提取具有各自的局限性,基于矩阵分解算法特征向量计算效率复杂且难以捕捉潜在的高阶链路属性。基于随机游走的算法受随机游走步长和方向限制,特征向量只能提取到二阶的网络结构特性。基于自编码的网络为半监督模型,只能产生固定长度序列的向量化表示。

中国科学院声学研究所在其申请的专利文献“一种基于深度动态网络嵌入表示模型的链路预测方法”(专利申请号201911279182.X,申请公开号110020379A)中公开了一种社交网络嵌入表示方法。该方法的实施步骤是:第一步,构建深度动态网络嵌入表示模型;第二步,从互联网抓取大量的网络数据,对网络数据进行预处理;第三步,按一定时间长度将网络数据划分为时间片,每个时间片下构造网络图和一阶时序邻接矩阵;第四步,多次迭代并用随机梯度下降法训练深度动态网络嵌入表示模型;第五步,对历史连接邻接矩阵进行迭代编码,所述解码器利用多层感知机网络对向量进行解码,得到每个向量的固定长度的嵌入表示,然后乘以权值矩阵得到下一个时刻的连接状态预测。该方法存在的不足之处是,该方法提出的网络嵌入表示模型只能预先设置好隐藏层结构,提取社交网络固定长度的特征向量,最大化保留低阶网络拓扑结构信息,提取的社交网络特征缺乏高阶性信息,社交网络特征提取准确率较低,在社交网络发现与社团关系划分中效果较差。

华中科技大学在其申请的专利文献“基于非负矩阵分解的社交网络特征提取方法”(专利申请号201911279182.X,申请公开号111091475A)中公开了一种社交网络特征提取方法。该方法的实施步骤是:第一步,计算不同视角社交网络图一阶邻接矩阵转化的拉普拉斯矩阵;第二步,对所有视角的拉普拉斯矩阵进行联合非负矩阵分解,得到基矩阵向量、每个视角的残差矩阵和系数矩阵;第三步,根据基矩阵和系数矩阵对每个视角的残差矩阵进行独立非负矩阵分解,得到各视角的基矩阵向量;第四步,将两种基矩阵向量级联,得到社交网络图的特征向量。该方法存在的不足之处是,该方法在社交网络中只能提取一阶网络拓扑结构,其特征向量无法对高阶网络拓扑结构进行表达,且此算法存在计算量庞大,矩阵分解产生的特征信息失真会导致社交网络特征提取准确率较低。

发明内容

本发明的目的在于针对上述现有技术存在的不足,提出一种基于向量压缩与重构的社交网络特征动态提取方法,用于解决现有特征提取方法忽略了社交网络特征的高阶性信息导致提取社交网络特征方法准确度较差的问题,以及计算规模大导致较低空间利用率和信息失真的问题。

实现本发明目的的思路是,构建社交网络数据集,利用深度半监督自编码器网络构造社交网络的压缩向量,构建并训练生成对抗网络,在生成对抗网络中输出当前社交网络的特征向量,实现社交网络特征的动态提取。

实现本发明目的的步骤如下:

(1)生成训练集:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010873148.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top