[发明专利]一种基于后门攻击的数据集保护和验证方法在审
| 申请号: | 202011279636.6 | 申请日: | 2020-11-16 |
| 公开(公告)号: | CN112364310A | 公开(公告)日: | 2021-02-12 |
| 发明(设计)人: | 潘晓光;王小华;焦璐璐;樊思佳;马彩霞 | 申请(专利权)人: | 山西三友和智慧信息技术股份有限公司 |
| 主分类号: | G06F21/16 | 分类号: | G06F21/16;G06T1/00;G06N3/08 |
| 代理公司: | 太原荣信德知识产权代理事务所(特殊普通合伙) 14119 | 代理人: | 杨凯;连慧敏 |
| 地址: | 030000 山西省*** | 国省代码: | 山西;14 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 后门 攻击 数据 保护 验证 方法 | ||
本发明属于互联网技术领域,具体涉及一种基于后门攻击的数据集保护和验证方法,包括下列步骤:根据实际需求设置水印γ的比例;根据γ划分原始数据集为良性样本数据集Dbenign和攻击样本数据集Dattack;划分后所得的攻击样本数据集Dattack添加水印,得到处理后的攻击样本数据集Dmodified;将处理后的攻击样本数据集Dmodified与良性样本数据集Dbenign混合,得到水印数据集Dwatermarked。本发明使用在部分样本上添加触发器的方式设置攻击样本,这使得在水印数据集上用标准的训练过程训练模型时,能在保持对良性样本的预测精度的同时指定隐藏的后门。本发明用于数据集的保护。
技术领域
本发明属于互联网技术领域,具体涉及一种基于后门攻击的数据集保护和验证方法。
背景技术
近年来,深度神经网络在各个领域都取得了较为广泛的应用。其中数据集,特别是高质量的开源数据集是深度神经网络繁荣的关键因素。这些开源数据集让研究人员可以很容易地验证他们的算法或模型的有效性,而这一过程反过来又加速了深度学习的发展。数据集的收集耗费了大量资源,其价值不言而喻,所以现有的开源数据集基本都要求它们只能用于学术或教育目的,而不能用于商业目的。基于此背景,已经有人提出了一些数据集保护技术,如匿名化、加密和水印方法进行数据集保护,它们的目的是防止未经授权的用户访问数据集。
然而,以上所提到的数据集保护方法却并不适合保护开源数据集。因为许多开源数据集对每个人都是开放访问的,唯一的要求是它们只能用于学术或教育目的。因此,保护开源数据集的主要问题是验证它是否被用于训练第三方模型。
发明内容
针对上述数据集保护方法不适合保护开源数据集的技术问题,本发明提供了一种效率高、可靠性强、实用性广的基于后门攻击的数据集保护方法。
为了解决上述技术问题,本发明采用的技术方案为:
一种基于后门攻击的数据集保护和验证方法,包括下列步骤:
S1、根据实际需求设置水印γ的比例;
所述γ越小,则代表包含水印的数据所占比重越小,水印设置的越隐蔽,所述Dattack为攻击样本数据集,所述Dtrain为原始数据集;
S2、根据S1所得的γ划分原始数据集为良性样本数据集Dbenign和攻击样本数据集Dattack;
所述xi为输入数据,yi为输出标签,且xi∈{0,…,255}C×W×H,yi={1,…,K};
S3、为S2中划分后所得的攻击样本数据集Dattack添加水印,得到处理后的攻击样本数据集Dmodified;
S4、将处理后的攻击样本数据集Dmodified与良性样本数据集Dbenign混合,得到水印数据集Dwatermarked
所述Dwatermarked=Dbenign∪Dmodified。
所述S3中攻击样本数据集Dattack添加水印的方法为:
S3.1、设置yt={1,…,K}和t∈{0,…,255}C×W×H分别为目标标签和指定的触发器;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西三友和智慧信息技术股份有限公司,未经山西三友和智慧信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011279636.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种摆动剪切装置
- 下一篇:一种低损耗分裂电抗型限流断路器
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





