[发明专利]基于离群点检测的差分隐私直方图发布方法及装置在审
| 申请号: | 202210865150.3 | 申请日: | 2022-07-22 |
| 公开(公告)号: | CN115082720A | 公开(公告)日: | 2022-09-20 |
| 发明(设计)人: | 褚红亮;余腾龙;彭谦;黄康;胡兵;胡潇;王璠 | 申请(专利权)人: | 国网江西省电力有限公司信息通信分公司 |
| 主分类号: | G06V10/762 | 分类号: | G06V10/762;G06V10/28;G06F21/62 |
| 代理公司: | 北京众合诚成知识产权代理有限公司 11246 | 代理人: | 王焕巧 |
| 地址: | 330000 江西省南昌市青*** | 国省代码: | 江西;36 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 离群 检测 隐私 直方图 发布 方法 装置 | ||
1.一种基于离群点检测的差分隐私直方图发布方法,其特征在于,包括以下步骤:
S1,对原始直方图数据进行噪声扰动后得到初始差分隐私直方图;
S2,对初始差分隐私直方图离群点检测后得到离群点分组集合,并将离群点从初始差分隐私直方图中剔除;
S3,对剔除离群点的差分隐私直方图进行K-means聚类得到K-means聚类分组集合;
S4,将离群点分组集合和K-means聚类分组集合合并后进行阈值处理后得到最终发布的差分隐私直方图。
2.根据权利要求1所述的一种基于离群点检测的差分隐私直方图发布方法,其特征在于,S1中,对原始直方图添加大小为的Laplace噪声,形成初始差分隐私直方图,其中:表示原始直方图中的桶;表示含噪声的桶;为直方图中桶的总数,并且原始直方图与初始差分隐私直方图桶总数相同。
3.根据权利要求2所述的一种基于离群点检测的差分隐私直方图发布方法,其特征在于,S2中,利用LOF离群点检测算法对初始差分隐私直方图进行离群点检测,计算出每个数据的局部离群因子,将局部离群因子大于1的数据标记为一个单独的分组,并入到离群点分组集合中,通过对初始差分隐私直方图进行离群点检测,得到离群点分组集合,同时将检测出的离群点从初始差分隐私直方图中剔除,其中:表示离群点分组集合中的分组,并且这些分组由单个离群点桶组成;表示离群点分组数。
4.根据权利要求3所述的一种基于离群点检测的差分隐私直方图发布方法,其特征在于,离群点分组集合生成包括:
S2.1计算初始差分隐私直方图中单个桶的第距离邻域内的第可达距离:
其中,为邻域点到第可达距离,为邻域点到的真实距离;
S2.2计算的局部可达密度:
其中,为点的第距离邻域;
S2.3计算的第局部离群因子:
其中,为邻域点的局部可达密度;
S2.4将局部离群因子大于1的每个桶视为一个单独的分组,划分到离群点分组中得到离群点分组集合;
S2.5 将检测到的离群点从初始差分隐私直方图中剔除。
5.根据权利要求4所述的一种基于离群点检测的差分隐私直方图发布方法,其特征在于,S3中,对剔除离群点的差分隐私直方图利用K-means进行最优聚类划分,得到K-means聚类分组集合,具体包括
S3.1 设置个聚类中心数,;
S3.2在剔除离群点的差分隐私直方图数据中随机选取个点得到中心点集合,其中:表示集合中的所有中心点,表示第个中心点;
S3.3 利用得到的中心点集合对剔除离群点的差分隐私直方图数据进行K-means聚类分组,得到K-means聚类分组集合。
6.根据权利要求5所述的一种基于离群点检测的差分隐私直方图发布方法,其特征在于,S4中,将离群点分组集合与K-means聚类分组集合进行合并,得到最终分组集合;其中,最终分组数为。
7.根据权利要求6所述的一种基于离群点检测的差分隐私直方图发布方法,其特征在于,将最终分组集合求取均值得到均值分组集合;
设置阈值,将中小于的数据作0处理。
8.根据权利要求7所述的一种基于离群点检测的差分隐私直方图发布方法,其特征在于,阈值处理中,,,是一个调节参数,为直方图中桶的总数。
9.根据权利要求1所述的一种基于离群点检测的差分隐私直方图发布方法,其特征在于,阈值处理后恢复原始直方图顺序得到降噪后的差分隐私直方图,即为最终发布的差分隐私直方图;
其中:表示降噪直方图的桶;为直方图中桶的总数。
10.一种基于离群点检测的差分隐私直方图发布装置, 其特征在于,包括:
第一模块:被配置为对原始直方图数据进行噪声扰动后得到初始差分隐私直方图;
第二模块:被配置为对初始差分隐私直方图离群点检测后得到离群点分组集合,并将离群点从初始差分隐私直方图中剔除;
第三模块:被配置为对剔除离群点的差分隐私直方图进行K-means聚类得到K-means聚类分组集合;
第四模块:被配置为将离群点分组集合和K-means聚类分组集合合并后进行阈值处理后得到最终发布的差分隐私直方图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江西省电力有限公司信息通信分公司,未经国网江西省电力有限公司信息通信分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210865150.3/1.html,转载请声明来源钻瓜专利网。





