[发明专利]一种针对语音关键词分类网络的对抗样本攻击方法在审
| 申请号: | 202011196711.2 | 申请日: | 2020-10-30 |
| 公开(公告)号: | CN112216273A | 公开(公告)日: | 2021-01-12 |
| 发明(设计)人: | 董理;黄其娟;杭小树;余水;王让定 | 申请(专利权)人: | 东南数字经济发展研究院 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G06N3/04 |
| 代理公司: | 深圳紫晴专利代理事务所(普通合伙) 44646 | 代理人: | 陈映辉 |
| 地址: | 324000 浙江省衢州*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 针对 语音 关键词 分类 网络 对抗 样本 攻击 方法 | ||
1.一种针对语音关键词分类网络的对抗样本攻击方法,其特征在于,包括以下步骤:
(1)按照训练策略选择训练数据以及训练的批大小的目标标签;
(2)将数据以及标签输入到生成器G中,生成对抗扰动,并且构建相应的对抗样本;
(3)将生成的对抗样本分别输入到判别器D和目标受害模型,得到相应的损失,并且计算相应的损失,更新网络的参数;
(4)重复步骤(1)至步骤(4),直到满足训练的停止条件,最终得到训练好的模型;
(5)模型使用,加载模型参数,输入语音样本以及目标标签,即可快速的生成对抗样本。
2.根据权利要求1所述的一种针对语音关键词分类网络的对抗样本攻击方法,其特征在于:所述步骤(1)中的目标标签由标签标量转化为标签向量的公式如下:
其中,ta是预设的目标标签,是预设目标标签的独热编码,W为目标高维矩阵,t是经过映射完的目标标签向量。
3.根据权利要求1所述的一种针对语音关键词分类网络的对抗样本攻击方法,其特征在于:所述步骤(2)中的生成器采用1维卷积层的堆叠,并在最后一个卷积层后使用tanh激活函数,将生成器的输出约束在[-1,1]的范围内,所述生成器包括下采样和上采样的两个过程,下采样过程使用了8个一维卷积层,上采样过程使用了8个转置卷积成,并且在最后一个卷积层后使用了tanh激活函数,并且使用跳跃连接的方法连接下采样和上采样两个过程,所述对抗样本由如下的公式构建:
x′=x+G(x,t)#(2)
其中G(x,t)是生成的对抗扰动。
4.根据权利要求1所述的一种针对语音关键词分类网络的对抗样本攻击方法,其特征在于:所述步骤(3)中的判别器由11个卷积块组成,除最后1个卷积块外每个卷积块都由1个一维卷积层,批归一化层,Leaky-ReLU激活函数构成。最后1个卷积块由1个一维卷积层和Leaky-ReLU激活函数构成。在卷积块后连接一个全连接层,最后通过softmax得到分类概率。
5.根据权利要求1所述的一种针对语音关键词分类网络的对抗样本攻击方法,其特征在于:所述步骤(3)中计算损失的公式为:
LG=Lgan+αLadv+βL2#(3)
其中,LG是生成器总的损失;Lgan是判别器将对抗样本识别成正常样本的损失;Ladv是受害模型对生成的对抗样本的分类结果,即对抗样本被分类成目标标签的损失;L2是对抗样本与正常样本之间的二范数损失,α和β是损失的权重,控制对抗样本的攻击成功率和语音质量的参数。
6.根据权利要求4所述的一种针对语音关键词分类网络的对抗样本攻击方法,其特征在于:所述Lgan的具体计算方法如下:
其中D(x′)是判别器对生成对抗样本的分类情况,表示求期望运算。
所述Ladv的具体计算方法如下:
其中lce是指目标受害网络的分类损失函数,ta表示预设的目标标签,fi表示第i个受害模型。
所述L2的具体计算方法如下:
L2=||x′-x||2#(6)
所述判别器的损失具体计算方法如下:
7.根据权利要求1所述的一种针对语音关键词分类网络的对抗样本攻击方法,其特征在于:所述步骤(4)中得到的模型计算公式为:
其中G*为训练好的生成器,D*为训练好的判别器。
8.根据权利要求1所述的一种针对语音关键词分类网络的对抗样本攻击方法,其特征在于:所述目标标签的选择方法为:在网络训练时,随机选择不同的目标标签作为批训练的目标标签,批大小设为64,使用交替更新的方式训练生成器和判别器,首先固定判别器的参数,更新生成器的参数,然后固定生成器的参数,更新判别器的参数,网络训练的终止条件有两个,第一个是达到预设的训练次数,第二是5个训练次数内攻击成功了没有提升。具体的过程如下:
输入:目标标签ta,目标受害网络fi,训练数据集,超参数α,β,批大小m;
输出:训练好的生成器G*;
用Xavier初始化生成器和判别器的参数;加载目标受害网络的参数,并且固定其参数;D0
在训练集中随机获取m个原始样本和随机选择不同的m个目标标签。
通过公式(1)得到经过映射的目标标签。
通过公式(2)得到构建的对抗样本。
使用随机梯度更新生成器的参数:
使用随机梯度更新判别器的参数:
WHILE满足结束条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南数字经济发展研究院,未经东南数字经济发展研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011196711.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种支撑架及婴儿床
- 下一篇:基于麦克风阵列的自动定向监控云台





