[发明专利]一种基于分类变换扰动机制的均值估计方法及装置有效

专利信息
申请号: 202011428994.9 申请日: 2020-12-09
公开(公告)号: CN112580701B 公开(公告)日: 2022-07-12
发明(设计)人: 朱素霞;王蕾;孙广路 申请(专利权)人: 哈尔滨理工大学
主分类号: G06K9/62 分类号: G06K9/62;G06F17/11
代理公司: 暂无信息 代理人: 暂无信息
地址: 150080 黑龙江省哈*** 国省代码: 黑龙江;23
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 分类 变换 扰动 机制 均值 估计 方法 装置
【说明书】:

一种基于分类变换扰动机制的均值估计方法及装置,属于信息安全技术领域,该机制采用了数据变换扰动的方式,将数值型数据划分变换范围并进行分段,根据分段将其变换为一维二元分类数据;对转换后的数据使用随机响应机制进行扰动,再根据扰动后的数据标识的数值段从中随机均匀抽取数值作为扰动值;与其他方法相比,该方法在满足本地差分隐私机制的同时,在数据分析任务如均值估计中能获得较高的数据效用性,得到的模型的分类准确性要更高,性能要更好。

技术领域

发明属于信息安全技术领域,具体涉及一种基于分类变换扰动机制的均值估计方法及装置。

背景技术

本地差分隐私机制作为差分隐私的分支,提供了比差分隐私还要强大的隐私保障,其最典型的扰动机制是随机响应机制。在本地差分隐私中,假设服务器是不可信的,用户不直接将原始数据发给服务器,而是在本地对数据进行扰动使其满足本地差分隐私,然后再将扰动后的数据发送给服务器。服务器对收集的噪声数据进行相应的数据分析任务,得到所需的统计信息。使用本地差分隐私进行隐私保护不需要进行大量复杂的运算,并且可以在获得较为准确的统计信息的同时有效的保障用户数据的隐私性,从而避免了用户隐私泄露的问题。

由于有上述优势,本地差分隐私机制广泛地应用于各个领域,例如:统计数据库、图像处理、隐私保护数据发布以及隐私保护数据挖掘等。而近年来,针对不同类型数据,也提出了很多本地差分隐私方法,而且在实际的应用中也取得了很多的成果。但是,现有的本地差分隐私机制的准确性较差,仍具有较大的提升空间。并且这些方法大多直接对数据进行扰动,忽略了转换数据类型进行扰动的可能性,忽略了可以通过变换数据类型进行扰动以平衡数据的效用性和隐私性的可能性。

发明内容

为解决上述问题,本发明提供了一种基于分类变换扰动机制的均值估计方法,所述方法包括步骤:

对数据进行预处理,将数据映射到-1到1的范围;

将数值型数据以数据点为中心划分成四段;

将数据根据划分的数据段进行随机抽取,转换为一维二元分类数据;

采用随机响应机制对转换后得到的分类数据进行扰动;

根据扰动后数据对应的数据段,在该数据段随机均匀抽取一个值作为其扰动后的数值型数据;

将所有的数据使用该扰动机制进行扰动;

使用扰动后数据计算属性均值;

计算数据扰动后得出的均值与未扰动的均值的绝对误差。

优选地,所述数据映射的表达公式为:

其中,v表示用户的原始数据,U表示该属性的最大值,L表示该属性的最小值,v′表示该值经过映射之后得到的值。

优选地,所述数据转换的计算公式为:

其中,数据划分时将数据分成了四段,l1代表数据进行分段之后的最左边的端点,l2代表数据划分后第二段的左端点,R1代表数据划分后第三段的右端点,R2代表数据划分之后最右边的端点。

优选地,所述的数据划分的计算公式为:

m=d/2

l1=v′-d

l2=v′-m

R1=v′+m

R2=v′+d

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011428994.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top