[发明专利]一种离散数据频率估计方法、用户端、数据中心及系统有效
| 申请号: | 201911298496.4 | 申请日: | 2019-12-17 |
| 公开(公告)号: | CN112995076B | 公开(公告)日: | 2022-09-27 |
| 发明(设计)人: | 刘莹;朱洪斌;刘圣龙;赵涛;王衡;周鑫;王迪;毛一凡;崔硕 | 申请(专利权)人: | 国家电网有限公司大数据中心 |
| 主分类号: | H04L25/08 | 分类号: | H04L25/08;H04L9/40 |
| 代理公司: | 北京安博达知识产权代理有限公司 11271 | 代理人: | 徐国文 |
| 地址: | 100031 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 离散 数据 频率 估计 方法 用户端 数据中心 系统 | ||
本发明涉及一种离散数据频率估计方法、用户端、数据中心及系统,包括:用户端根据向数据中心发送的离散数据的种类生成离散数据编码;用户端获取离散数据编码对应的扰乱编码,并将该离散数据编码对应的扰乱编码发送至数据中心;数据中心接收各用户端的离散数据编码对应的扰乱编码;数据中心根据所述各用户端的离散数据编码对应的扰乱编码确定各类离散数据的发生频率。该方案中用户终端根据松散本地差分隐私的定义,在原始数据上减少噪声的注入,在满足本地差分隐私的基础上,尽可能的降低数据的失真度,提高扰乱后数据的可用性,进而提高统计结果的准确率。
技术领域
本发明涉及电网信息控制领域,具体涉及一种离散数据频率估计方法、用户端、数据中心及系统。
背景技术
在生产控制领域,包括但不限于电网信息控制领域,经常需要不同区域、不同部门的业务数据汇集至数据中心,并通过联合分析,得出某种业务事件的发生频率,开展业务分析。其中涉及到数据所有权和数据使用权分离的情况,即数据的所有全分别数据不同区域、不同部门,而分析结果可以共享,因此需要在保障各方数据秘密的情况下进行联合数据分析。
当前同区域、不同部门的业务数据直接汇集至数据中心,存在敏感数据泄露风险,而且数据中心作为各方联合工作的关键节点,数据安全防护责任巨大。此外,各方为了维护自身数据安全以及规避数据安全责任,共享数据的积极性也会大打折扣,不利于数据业务的开展。因此迫切需要一种由独立各方根据自由数据情况完成本地差分隐私处理,在保护自身数据隐私的条件下进行联合分析的技术。
发明内容
针对现有技术的不足,本发明的目的是用户终端根据松散本地差分隐私的定义,在原始数据上减少噪声的注入,在满足本地差分隐私的基础上,尽可能的降低数据的失真度,提高扰乱后数据的可用性,进而提高统计结果的准确率。
本发明的目的是采用下述技术方案实现的:
本发明提供一种离散数据频率估计方法,该方法应用于用户端,其改进之处在于,所述方法包括:
根据向数据中心发送的离散数据的种类生成离散数据编码;
获取离散数据编码对应的扰乱编码,并将该离散数据编码对应的扰乱编码发送至数据中心。
优选的,所述离散数据编码的长度与离散数据种类总数相等。
进一步的,所述离散数据编码为(v1...vi...vn),其中,n为离散数据种类总数,vi为第i类离散数据对应的编码值,若用户端向数据中心发送的离散数据的种类为第i类离散数据,则vi=1,否则,vi=0。
优选的,所述获取离散数据编码对应的扰乱编码,包括:
获取离散数据编码中各类离散数据对应的编码值的转换概率;
基于所述离散数据编码中各类离散数据对应的编码值的转换概率确定所述离散数据编码对应的扰乱编码。
进一步的,所述获取离散数据编码中各类离散数据对应的编码值的转换概率,包括:
按下式确定离散数据编码中第i类离散数据对应的编码值转换为0的概率:
按下式确定离散数据编码中第i类离散数据对应的编码值转换为1的概率:
上式中,ε为隐私保护预算,δ为松散本地差分隐私下的参数,取值为0到1之间,为离散数据编码对应的扰乱编码中第i类离散数据对应的扰乱编码值,为离散数据编码中第i类离散数据对应的编码值转换为0的概率,为离散数据编码中第i类离散数据对应的编码值转换为1的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网有限公司大数据中心,未经国家电网有限公司大数据中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911298496.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种方便使用的婴儿床
- 下一篇:车用三角警告牌
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





