[发明专利]基于敏感神经元的深度学习模型蒸馏中毒防御方法与装置在审

申请号：	202111561886.3	申请日：	2021-12-16
公开（公告）号：	CN114266341A	公开（公告）日：	2022-04-01
发明（设计）人：	陈晋音;李潇;张任杰;金海波;赵云波	申请（专利权）人：	浙江工业大学
主分类号：	G06N3/04	分类号：	G06N3/04;G06N3/08
代理公司：	杭州求是专利事务所有限公司 33200	代理人：	邱启旺
地址：	310014 浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于敏感神经元深度学习模型蒸馏中毒防御方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于敏感神经元的深度学习模型蒸馏中毒防御方法与装置，本发明利用中毒模型中的敏感神经元的梯度反向传播去更新输入样本从而生成中毒样本，再利用中毒样本与原始样本在模型中前向传播时激活神经元的差异，找到top‑K的异常神经元并调整再进行蒸馏操作，从而达到模型蒸馏中毒防御的效果。本发明方法具有良好的适用性，能够有效的防御中毒攻击，并且不影响模型蒸馏后正常样本的正确率。

技术领域

本发明属于面向深度学习模型的安全问题领域，具体涉及一种基于敏感神经元的深度学习模型蒸馏中毒防御方法与装置。

背景技术

深度学习(DL,Deep Learning)是机器学习(ML,Machine Learning)领域中一个新的研究方向，它被引入机器学习使其更接近于最初的目标——人工智能。随着深度学习的发展，使得深度学习在搜索技术，数据挖掘，机器学习，机器翻译，自然语言处理，多媒体学习，语音，推荐和个性化技术，以及其他相关领域都取得了很多成果。深度学习使机器模仿视听和思考等人类的活动，解决了很多复杂的模式识别难题，使得人工智能相关技术取得了很大进步。

但于此同时，性能的提升也导致了深度学习模型的复杂度越来越高，带来了高额的存储空间、计算资源消耗，使其很难落实到各个硬件平台。为了解决问题，人们使用了模型压缩技术来最大限度地减小模型对于计算空间和时间的消耗。

深度学习模型的压缩主要分为剪枝(在预训练好的大型模型的基础上,将权重矩阵中相对不重要的权值剔除，然后再重新精修(finetune)网络进行微调)，量化(较低位宽表示典型的32位浮点网络参数,网络参数包括权重、激活值、梯度和误差等)，低秩分解(通过合并维数和施加低秩约束的方式稀疏化卷积核矩阵)和知识蒸馏(教师模型指导学生模型训练,采用预训练好的复杂模型的输出作为监督信号去训练另外一个简单的网络。将知识迁移到学生模型中,使学生模型达到与教师模型相当的性能)。其中由于知识蒸馏的可迁移性好，所以神经网络的知识蒸馏被广泛运用于降低模型的计算和存储成本上，从而促进模型在边缘端的高效部署。

随着模型的日益发展，针对模型的中毒攻击也在发展。中毒攻击发生在模型训练阶段，攻击者将中毒样本注入训练数据集，从而在训练完成的深度学习模型中嵌入后门触发器，在测试阶段输入毒药样本，则触发攻击爆发。

然而现有的神经网络知识蒸馏的方法专注于模型的识别精度以及可迁移性，忽略了模型在应用于边缘端时存在中毒的风险。一个被植入后门的模型在蒸馏之后仍然会保留中毒效果。当知识蒸馏被应用于现实场景的边缘设备中，例如自动驾驶，模型的错误识别导致行车大脑的决策失误会带来重大的安全隐患，所以这种潜在的风险不容忽视。

因此，我们在拿到一个模型做知识蒸馏之前，首先要对此模型进行祛毒操作。具体来说，我们拿一张干净样本以及对应的中毒样本输入到模型中，寻找全连接层输出的差异的Top-K的神经元摘除，这样可以达到在保证主任务分类准确率的基础上去除中毒的效果。我们发现中毒攻击都是攻击睡眠神经元(主任务分类上不激活的神经元)，那么被下毒的这些神经元就会变成相对于中毒样本的敏感神经元，利用这些神经元对中毒样本的敏感性去反向生成中毒样本。我们利用干净的测试样本X输入到模型中，将输出中激活值最大的Top-k神经元进行累加，构成损失函数，通过对损失函数梯度上升作为导向对原始图像的像素值进行改变去更新这张样本X，再进行下一轮迭代，直到激活值最大的Top-k神经元稳定下来，迭代结束。此时，测试样本被更新成了中毒样本。利用生成的中毒样本以及原始样本去寻找全连接层的差异Top-K神经元并摘除即可。

发明内容

为了保证在常用的模型压缩方法蒸馏之后模型具有无毒性，本发明提供了一种基于敏感神经元的深度学习模型蒸馏中毒防御方法与装置。利用敏感神经元梯度反向传播去还原中毒样本，在利用干净/中毒样本对在模型中正向传播寻找全连接层的差异神经元top-K并摘除，即可达到模型祛毒的效果。

本发明的技术方案如下：一种基于敏感神经元的深度学习模型蒸馏中毒防御方法，包括以下步骤：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江工业大学，未经浙江工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202111561886.3/2.html，转载请声明来源钻瓜专利网。

上一篇：数据处理方法、系统及虚拟交换机
下一篇：基于导电聚合物的半透明有机无机杂化钙钛矿太阳能电池

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于敏感神经元的深度学习模型蒸馏中毒防御方法与装置在审

专利文献下载