[发明专利]基于离群点检测的差分隐私直方图发布方法及装置在审
| 申请号: | 202210865150.3 | 申请日: | 2022-07-22 |
| 公开(公告)号: | CN115082720A | 公开(公告)日: | 2022-09-20 |
| 发明(设计)人: | 褚红亮;余腾龙;彭谦;黄康;胡兵;胡潇;王璠 | 申请(专利权)人: | 国网江西省电力有限公司信息通信分公司 |
| 主分类号: | G06V10/762 | 分类号: | G06V10/762;G06V10/28;G06F21/62 |
| 代理公司: | 北京众合诚成知识产权代理有限公司 11246 | 代理人: | 王焕巧 |
| 地址: | 330000 江西省南昌市青*** | 国省代码: | 江西;36 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 离群 检测 隐私 直方图 发布 方法 装置 | ||
本发明涉及一种基于离群点检测的差分隐私直方图发布方法及装置,属于直方图数据发布领域,与现有技术相比解决了直方图数据发布中离群点过多导致分组划分不准确,进而导致发布数据误差较大的问题。本发明包括以下步骤:噪声扰动;离群点分组集合生成;K‑means聚类分组集合生成;对离群点分组集合和K‑means聚类分组集合进行分组合并;对合并后的分组集合求取均值;阈值处理;最后,恢复直方图顺序并得到待发布的差分隐私直方图。本发明能够有效地对直方图进行合理划分,降低了发布数据的误差,在满足差分隐私的前提下,提升了数据的可用性。
技术领域
本发明涉及直方图数据发布领域,具体来说是一种基于离群点检测的差分隐私直方图发布方法及装置。
背景技术
随着大数据时代的到来,社会每时每刻都在产生着大量的信息。在此基础上,产生了越来越多新兴的工作,例如大数据分析、数据挖掘、人工智能等。研究者通过对数据进行分析、挖掘从中获取有价值的信息。因此,为了更便捷的获取数据,最常用的方法是将数据在网络上进行公布,但这一行为会造成巨大的风险。例如,黑客窃取数据中用户的隐私信息,进行非法活动。因此,如何保护发布数据的隐私成为了数据隐私保护领域的研究重点。
现有的隐私保护方法有k-匿名、t-closeness等。但这些方法存在着一个很大的问题。无法抵御攻击者发动的最大背景知识攻击。并且其攻击假设并不合理,缺乏严格的逻辑证明。因此,差分隐私成为了当前隐私保护领域的主流技术,差分隐私通过对数据进行去隐私化处理,能够有效的防御最大背景知识攻击。
现有直方图数据发布通常采用分组优化的方式对直方图进行降噪处理,以达到降低发布数据误差的目的。但现有方法在分组聚类过程中并没有考虑离群点的问题,若离群点被划分到分组中,则会产生较大分组误差。因此需要一种针对离群点的差分隐私直方图发布算法,提升聚类分组的准确性,在满足差分隐私的前提下,提升发布数据的可用性。
发明内容
本发明的目的是为了解决直方图数据发布中离群点划分以及数据可用性的问题。提供了一种基于离群点检测的差分隐私直方图发布方法及装置。可以在保证差分隐私的前提下,提升发布数据的可用性。
本发明的技术方案如下:
本发明提供一种基于离群点检测的差分隐私直方图发布方法,包括以下步骤:
S1,对原始直方图数据进行噪声扰动后得到初始差分隐私直方图;
S2,对初始差分隐私直方图离群点检测后得到离群点分组集合,并将离群点从初始差分隐私直方图中剔除;
S3,对剔除离群点的差分隐私直方图进行K-means聚类得到K-means聚类分组集合;
S4,将离群点分组集合和K-means聚类分组集合合并后进行阈值处理后得到最终发布的差分隐私直方图。
在S1中,对原始直方图添加大小为的Laplace噪声,形成初始差分隐私直方图,其中:表示原始直方图中的桶;表示含噪声的桶;为直方图中桶的总数,并且原始直方图与初始差分隐私直方图桶总数相同。
在S2中,利用LOF离群点检测算法对初始差分隐私直方图进行离群点检测,计算出每个数据的局部离群因子,将局部离群因子大于1的数据标记为一个单独的分组,并入到离群点分组集合中,通过对初始差分隐私直方图进行离群点检测,得到离群点分组集合,同时将检测出的离群点从初始差分隐私直方图中剔除,其中:表示离群点分组集合中的分组,并且这些分组由单个离群点桶组成;表示离群点分组数。
离群点分组集合生成包括:
S2.1计算初始差分隐私直方图中单个桶的第距离邻域内的第可达距离:
其中,为邻域点到第可达距离,为邻域点到的真实距离;
S2.2计算的局部可达密度:
其中,为点的第距离邻域;
S2.3计算的第局部离群因子:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江西省电力有限公司信息通信分公司,未经国网江西省电力有限公司信息通信分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210865150.3/2.html,转载请声明来源钻瓜专利网。





