[发明专利]一种基于GAN的医学诊断模型对抗攻击方法有效
| 申请号: | 202110550784.5 | 申请日: | 2021-05-18 |
| 公开(公告)号: | CN113178255B | 公开(公告)日: | 2023-05-26 |
| 发明(设计)人: | 王小银;吕硕;王曙燕;孙家泽;舒新峰;候东海;王春梅 | 申请(专利权)人: | 西安邮电大学 |
| 主分类号: | G06N3/094 | 分类号: | G06N3/094;G16H50/20;G16H30/20;G06T7/00;G06V10/774;G06V10/764;G06V10/82;G06N3/0464;G06N3/048;G06N3/0455;G06N3/0475;G06N3/084 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 710061 陕西*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 gan 医学 诊断 模型 对抗 攻击 方法 | ||
1.一种基于GAN的医学诊断模型对抗攻击方法,其特征包括:
A.使用GAN对抗网络动态蒸馏模型,实现高黑盒攻击成功率和有针对性的黑盒攻击,具体步骤如下:
a1:选择基于Resnet-101模型搭建迁移学习神经网络目标模型,构建残差单元,调节模型训练参数;
a2:构造GAN对抗攻击网络结构,主要由三部分组成:生成器G、判别器D和目标网络f;
a3:在黑盒模型的输出基础上构建一个蒸馏网络f,蒸馏网络模型的目标为:
其中Ex为蒸馏网络和目标网络输出的期望值,f(x)和b(x)分别表示蒸馏模型和黑盒模型对给定训练医学图像的输出,H表示常用的交叉熵损失;
a4:通过对所有训练图像的目标进行优化,得到一个非常接近黑盒的模型,然后对蒸馏网络进行攻击,并联合训练蒸馏模型f和生成器G;
a5:训练一个条件对抗性网络CGAN,直接生成对抗扰动样本;
a6:向生成器G输入真实医学图像x,叠加高维噪声后生成扰动x+G(x),将x+G(x)送入判别器D,判别为原始数据或对抗样本;
a7:攻击目标模型f,向f输入x+G(x),并输出损失,该损失在定向攻击时表示预测结果与目标结果间的距离,在非定向攻击时表示与真实类的距离,其中GAN的损失为:
LGAN=Qx log D(x)+Px log(1-D(x+G(x)))
其中Qx表示判别器输出的期望值,Px表示生成器输出的期望值,判别器D的目的是将被扰动的数据x+G(x)与原始数据x区分开来,可以确保生成的对抗样本与真实图像的数据接近;
a8:固定生成器G,训练蒸馏网络f,向黑盒模型输入用生成器G生成的扰动图像x+G(x),根据黑盒模型的输出,训练出蒸馏模型;
B.在为医学对抗网络创建的整体端到端训练网络中,使用ResNet架构作为生成器模型,设计一个三层的特征提取块,主要是通过使用残差块、扩张卷积和通道注意力机制来对生成器的编码解码结构进行重组和优化,主要特征是:
b1:编码器将输入图像编码之后进入特征提取块,通过不同尺度的感受野将特征图的信息给提取出来,得到输入图像最有效的扰动区域;
b2:网络主体由残差块组成,每个残差块包含两个3*3卷积层,通过使用残差块结构来简化深度学习过程,增强梯度传播的同时也解决了深度神经网络的退化问题,残差块公式如下:
xl+1=xl+F(xl,Wl)
其中xl+1是这一层残差块的输入,xl为上层特征图输入值,Wl为权重参数,F(x)是经过第一层线性变化并激活后的残差输出;
b3:使用SE通道注意力机制来对通道特征进行调整,提高网络对扰动的识别能力;
C.使用PatchGAN判别器给出预测的N*N矩阵,修改对抗网络为可判断输出图像二维矩阵的GAN验证器,其特征包括:
c1:在判别器网络前几层设计一个参数权重共享架构,设计PatchGAN判别器网络结构以捕捉图像的局部连续性视觉特征和整体视觉特征;
c2:在判别器网络参数权重共享架构之后,传统的GAN判别器被PatchGAN判别器取代,完全连接的PatchGAN层被添加在判别器网络的末端;
c3:进而判别器会产生对抗损失,并反馈给生成网络;
c4:使用PatchGAN保留局部连续性;
D.在对抗攻击训练阶段,使用Adam优化器对生成器和判别器中的三个损失函数进行反向传播联合优化整体网络,其中的损失函数的特征如下:
d1:图像重建损失函数Lrec描述真实图像与GAN合成的图像之间的距离:
其中M是样本数,y是预测的像素,x是真实图片的像素,WHC是图像的长宽比通道;
d2:对抗攻击损失函数:
其中Ex~p(x)为判别器对于x真实样本输出的期望值,Ey~pG(x)为生成器对于生成样本y输出的期望值,LGAN主要由训练阶段引入的PatchGAN中的判别器网络D的损失函数计算,并且生成器和判别器在训练时要使arg minGmaxDLGAN(G,D)最小,属于损失图像;
d3:联合损失函数:
L=λ1Lrec+λ2Lg-adv+λ3Lp-adv
其中Lg-adv是LGAN中生成器的期望分布,Lp-adv是LGAN中判别器的期望分布,L是对抗网络总的对抗损失,三个损失函数的每个分量由λ1、λ2、λ3系数控制。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安邮电大学,未经西安邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110550784.5/1.html,转载请声明来源钻瓜专利网。





