[发明专利]一种基于分类变换扰动机制的均值估计方法及装置有效
申请号: | 202011428994.9 | 申请日: | 2020-12-09 |
公开(公告)号: | CN112580701B | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 朱素霞;王蕾;孙广路 | 申请(专利权)人: | 哈尔滨理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/11 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150080 黑龙江省哈*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分类 变换 扰动 机制 均值 估计 方法 装置 | ||
1.一种基于分类变换扰动机制的均值估计方法,其特征在于,所述方法包括步骤:
步骤S1:对数据进行预处理,通过公式(1)将数据映射到-1到1的范围,
其中,v表示用户的原始数据,U表示属性的最大值,L表示属性的最小值,v'表示该值经过映射之后得到的值;
步骤S2:通过公式2到7将数值型数据以数据点为中心划分为四段,
m=d/2 (3)
l1=v'-d (4)
l2=v'-m (5)
R1=v'+m (6)
R2=v'+d (7)
其中,v'表示数据映射之后得到的数据,d表示数据变换的范围,即左右两端距离原始数据的距离,m为取d的一半,α为引入的距离参数,ε为扰动过程中使用的隐私预算;在计算变换范围d时引入了隐私预算ε,可以有效的根据隐私强度的需求对数据变换范围进行动态调整,使得扰动操作能够更加贴切用户的隐私需求;
步骤S3:将数据根据划分的数据段进行随机抽取,通过公式(8)将数据转换为一维二元分类数据,
其中,上一步骤数据划分时将数据分成了四段,l1代表数据进行分段之后的最左边的端点,l2代表数据划分后第二段的左端点,R1代表数据划分后第三段的右端点,R2代表数据划分之后最右边的端点;使用了变换数据类型的方法,使得扰动在满足差分隐私条件给用户提供良好的隐私性的同时,可以提供较高的数据效用性;
步骤S4:采用公式(9)所示的随机响应机制对转换后的分类数据继续扰动,
其中,ε表示扰动时使用的隐私预算的值,vi代表的是用户i原始数据,代表的是扰动结束之后获得的数据,f代表扰动时数据改变的概率,1-f则表示扰动时数据不变的概率,f的求解过程如下:
扰动机制应满足本地差分隐私,其定义为:
其中v和v'代表两种不同的原始数据,代表扰动后得到的数据,Pr[·]代表求解的概率,设两种分类数据分别为0和1,则:
根据定义可得:
解得
使用随机响应机制对转换后的分类型数据进行扰动,在给用户数据提供隐私保障的同时,可以确保服务器获得较为准确的统计信息;
步骤S5:计算出扰动后的值后,根据扰动后数据对应的数据段,使用公式(10)将其逆转换为数值型数据,
其中retra(·)代表的是进行逆变换的操作,代表的是一维二元分类数据扰动后得到的值;将数值型数据通过数据变换变成一维二元分类数据,再进行扰动操作,而不是直接对原始数据进行扰动,并且在将扰动后的分类数据转换回数值型数据时,采用了随机均匀抽取的方式,在分类数据代表的数据段中随机均匀抽取一个数来代表扰动后的数值型数据,通过实验可知采用转换数据类型进行扰动的方式要比传统的直接对原数据类型进行扰动的方法更有效,可以更好的平衡数据的隐私性和效用性,解决了传统的本地差分隐私机制应用到数据分析任务准确性较低的问题。
步骤S6:对于均值估计任务,将所有的数据使用该扰动机制进行扰动。
步骤S7:使用扰动后数据计算属性均值。
步骤S8:计算数据扰动后得出的均值与未扰动的均值的绝对误差。
2.根据权利要求1所述的分类变换扰动机制,其特征在于,所述计算均值估计包括步骤:
计算扰动前属性均值;
计算扰动后属性均值;
计算扰动前后均值的绝对误差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011428994.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种焊带传送机构改良型焊接机及使用方法
- 下一篇:一种远距屈伸式玻璃擦拭装置