[发明专利]一种基于差分隐私的局部高阶图聚类方法在审
申请号: | 201910490628.7 | 申请日: | 2019-06-06 |
公开(公告)号: | CN110263831A | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 李蜀瑜;边锦;曹菡 | 申请(专利权)人: | 陕西师范大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 西安睿通知识产权代理事务所(特殊普通合伙) 61218 | 代理人: | 惠文轩 |
地址: | 710119 陕西省西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 高阶 邻接矩阵 社交网络 网络子图 扰动 聚类 隐私 矩阵 随机游走算法 聚类集合 权重设置 随机游走 向量计算 隐私保护 种子算法 权重 页面 噪声 近似 切割 集合 多样性 输出 转化 | ||
本发明公开了一种基于差分隐私的局部高阶图聚类方法,该方法的具体步骤为:利用局部高阶网络子图Motif的结构,将原始社交网络转化成基于Motif的邻接矩阵,基于Motif网络子图结构的多样性,对生成的Motif邻接矩阵中的权重设置一定的阈值,并对在阈值范围内的权重进行拉普拉斯噪声扰动,实现对社交网络子图的隐私保护;为了提升随机游走算法运行的效率,采用近似热核页面排名种子算法,对扰动后的Motif矩阵进行随机游走,根据游走后的热核向量计算划分集合的切割比,并输出聚类集合。
技术领域
本发明属于数据安全技术领域,特别涉及一种基于差分隐私的局部高阶图聚类方法。
背景技术
随着博客、微博等社交媒体的兴起,以用户为节点、以用户关系为边的社交网络迅猛增长。用户的兴趣、行为、功能等关系使社交网络中存在多个社区或簇。其高效的聚类方法,使用户更高效的了解自己所在社区的亲密程度,但在聚类的过程中,存在侵犯用户隐私的风险。一方面,用户担心在聚类过程中包含太多内容,会泄露自己的隐私信息;另一方面,对社交用户进行社区划分时依据网络子图特点存在很多不确定因素,限制其技术改进的能力;因此,处理隐私数据通常需要考虑数据可用性与隐私保护之间的平衡。
在整个图聚类过程中,社交网络作为图数据的重要组成部分,被广泛应用于各种聚类方法中,聚类通过网络的有向性、高阶子图的结构特性等低级特征,节点链接稠密关系、节点功能特性等高级特征,然后对网络节点进行聚划分,计算同一子集向量的切割比(Cheeger ratio),最终通过划分子集的Cheeger ratio进行最优切割;但是,当前基于高阶子图的聚类划分并没有对数据进行隐私保护,进而可能会导致网络数据的泄露,无法保证用户数据的安全性。
发明内容
针对上述现有技术存在的隐私保护问题,本发明的目的在于提出一种基于差分隐私的局部高阶图聚类方法,本发明采用社交网络子图的结构特性及差分隐私设计了一种隐私保护模型,基于热核页面排名随机游走原理,通过限制随机游走的步数,解决了复杂社交网络局部高阶图的聚类问题;在具体改进中,基于社交网络子图的结构,首先将原始社会网络转化为基于网络子图的Motif权重矩阵,然后通过构建的Motif权重矩阵,来确定对Motif权重矩阵的隐私保护力度;最后采用近似热核页面排名种子算法对扰动后的Motif权重矩阵进行随机游走,使得社交网络在隐私保护的前提下,依然能够有良好的聚类结果。
本发明的技术原理:利用局部高阶网络子图Motif的结构,将原始社交网络转化成基于Motif的邻接矩阵,基于Motif网络子图结构的多样性,对生成的Motif邻接矩阵中的权重(节点之间生成Motif的个数)设置一定的阈值,并对在阈值范围内的权重运用拉普拉斯机制进行噪声扰动,实现对社交网络子图的隐私保护;为了提升随机游走算法运行的效率,采用近似热核页面排名种子算法,对扰动后的Motif矩阵进行随机游走,根据游走后的热核向量计算划分集合的切割比,并输出聚类集合。
为了达到上述目的,本发明采用以下技术方案予以解决。
一种基于差分隐私的局部高阶图聚类方法,包括以下步骤:
步骤1,获取社交网络数据集,即有向图G(V,E),选取三角Motif模型中的M7连接结构,作为有向图G(V,E)的高阶网络子图Motif结构;构建Motif邻接矩阵,权重矩阵WM;采用差分隐私算法,对有向图的Motif权重矩阵中Motif结构个数进行干扰,得到具有隐私保护的有向图Gλ′。
其中,V为节点集,E为边集。
子步骤1.1,构建Motif权重矩阵WM,其具体为:计算有向图G(V,E)中从节点vi到节点vj之间的所有路径中生成的Motif结构的数量,并将其作为邻接矩阵中对应节点之间的权重w,生成Motif权重矩阵WM。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910490628.7/2.html,转载请声明来源钻瓜专利网。