[发明专利]一种基于生成对抗网络的隐私保护数据生成方法在审
申请号: | 202211562636.6 | 申请日: | 2022-12-05 |
公开(公告)号: | CN115936107A | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 张越;何兴国;赖春媚 | 申请(专利权)人: | 广州图灵科技有限公司 |
主分类号: | G06N3/094 | 分类号: | G06N3/094;G06N3/0455;G06N3/0475;G06N3/047;G06N3/048;G06F21/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510000 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 生成 对抗 网络 隐私 保护 数据 方法 | ||
本发明公开了一种基于生成对抗网络的隐私保护数据生成方法,涉及数据生成领域,包括如下步骤:构建前置自编码器;构建生成对抗网络模型;将自编码器应用于生成对抗网络模型的数据生成。该方法使用预训练的自编码器将给定数据集映射到低维连续空间,通过低维空间中的生成器和原始数据空间中的鉴别器进行对抗学习从而获得具有模拟真实数据的生成模型。该方法可以有效解决在隐私保护政策下,在获取训练数据时经常收到限制而导致训练数据集匮乏问题。
技术领域
本发明涉及数据生成领域,具体是一种基于生成对抗网络的隐私保护数据生成方法。
背景技术
随着大数据技术的发展和进步,大数据对经济发展、社会治理和人民生活产生了巨大影响,给人们带来精确、便捷服务端同时,也潜在着泄露用户隐私信息的风险。为了降低隐私泄露造成的负面影响,有关部门不断通过完善隐私保护法律法规对企业及个人进行监管,以此减少或限制数据的共享和开放。
在这样的背景下,大数据分析时常常会遇到数据匮乏、训练样本过少等问题。为了解决该问题,基于深度学习的数据生成方法应运而生。深度生成模型是一种高度灵活和可表达的无监督学习方法,能够捕捉复杂高维数据的潜在结构。训练好的深度生成模型可以有效模拟高维数据复杂分布,生成与原始数据相似的合成数据。
传统的隐私保护数据生成方法采用对用户隐私信息进行移除或匿名化的方式以达到隐私保护的效果,该方法存在着明显的弊端:可通过匿名数据集与其他公开的数据集结合起来,重新识别到用户的隐私保护数据,且该方法随着更多信息被匿名化,会导致数据集的效用降低。
为此,如何在安全、高效用性的前提下,设计一种用于隐私保护数据生成的方法是目前数据生成领域亟需解决的问题。
发明内容
本发明的目的在于提供一种基于生成对抗网络的隐私保护数据生成方法,以解决数据生成领域隐私保护数据样本少、数据效用性低的问题。
本发明的创新之处在于:提出了一种隐私保护数据生成方法,适用于数据生成领域对隐私保护类型数据的生成需求,本方法将成功改进的自编码器应用于生成对抗网络模型中,提升了模型的离散特征学习能力。
本发明的优势在于:与现有的隐私保护数据生成方法相比,本方法能捕捉到复杂的高维数据的基本结构并有效模仿大型高维数据集的分布,保持数据集的完整性和相关性,生成更接近原始数据集的合成数据。
为实现上述目的,本发明采用以下技术方案:
一种基于生成对抗网络的隐私保护数据生成方法,用于模拟隐私数据的生成,所述基于生成对抗网络的隐私保护数据生成方法,包括:
步骤1、构建前置自编码器;
步骤2、构建生成对抗网络模型;
步骤3、将自编码器应用于生成对抗网络模型的数据生成。
其中,所述构建前置自编码器的具体过程为:对自编码器的解码输出层进行修改,将混合层的数据进行切割输出,在其后放置N+1个并行的属性输出层。
进一步地,所述构建前置自编码器过程中,自编码器的编码器网络由两层全连接网络NN构成,解码器网络从编码空间获得输入,通过两层全连接网络NN后进入N+1个并行的数据类型分离网络;自编码器通过解码器网络将编码空间数据投影回原始数据空间,完成数据重建。
其中,构建生成对抗网络模型的具体过程为:生成器学习训练数据的分布,并将输入的随机先验分布转化为和训练数据相似分布的生成样本;鉴别器判断所输入数据集是真实样本还是生成的假样本;训练过程中使生成器与鉴别器互相博弈对抗,直到生成器生成的数据可以骗过鉴别器。
其中,所述将自编码器应用于生成对抗网络模型的数据生成具体过程为:利用自编码器的解码器将低维连续的编码空间数据投影回原始空间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州图灵科技有限公司,未经广州图灵科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211562636.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种齿轮清洗装置及齿轮清洗方法
- 下一篇:特泊替尼固体分散体及其制备方法