[发明专利]面向语音识别系统黑盒攻击模型的防御方法及防御装置有效
| 申请号: | 201911031043.5 | 申请日: | 2019-10-28 |
| 公开(公告)号: | CN110992934B | 公开(公告)日: | 2022-04-26 |
| 发明(设计)人: | 陈晋音;叶林辉;杨奕涛 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/26;G06N3/08;H04L9/00 |
| 代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 曹兆霞 |
| 地址: | 310014 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 面向 语音 识别 系统 黑盒 攻击 模型 防御 方法 装置 | ||
1.一种面向语音识别系统黑盒攻击模型的防御方法,包括以下步骤:
(1)获取原始音频文件,利用基于深度学习的语音识别模型对原始音频文件进行筛选,获得能够被正确识别的音频文件,作为原始样本,在原始样本中添加模拟环境噪声后,复制原始样本到设定种群数量;
(2)在步骤(1)的基础上,对原始样本添加随机噪声以进行变异形成初代对抗样本;
(3)以对抗样本的解码短语与目标短语的相似度作为评价函数的选择依据,当相似度小于0.5时,以CTC损失函数作为评价函数,当相似度大于0.5时,以CTC损失函数和对抗样本的解码短语和目标短语的Levenshtein距离作为评价函数,利用遗传算法对对抗样本进行优化迭代,直至Levenshtein距离小于2为止获得接近目标短语的对抗样本;
(4)当Levenshtein距离小于2时,利用梯度估计的方法替换遗传算法对对抗样本进行优化,获得精确对抗样本;
(5)利用原始样本和精确对抗样本对所述语音识别模型重训练进行优化,获得能够防御对抗攻击的语音识别模型;
(6)利用能够防御对抗攻击的语音识别模型对待识别音频文件进行识别,以防御对待识别音频文件的对抗攻击。
2.如权利要求1所述的面向语音识别系统黑盒攻击模型的防御方法,其特征在于,以DeepSpeech作为基于深度学习的语音识别模型。
3.如权利要求1所述的面向语音识别系统黑盒攻击模型的防御方法,其特征在于,在干净音频文件中添加模拟环境噪声为高斯白噪声。
4.如权利要求1所述的面向语音识别系统黑盒攻击模型的防御方法,其特征在于,步骤(3)中,对抗样本的解码短语与目标短语的相似度R(x')为:
其中,Levenshtein(C(x'),t)为对抗样本的解码短语C(x')和目标短语的Levenshtein距离,len(t)为目标短语t的长度。
5.如权利要求4所述的面向语音识别系统黑盒攻击模型的防御方法,其特征在于,步骤(4)的具体过程为:
相似度R(x')小于0.5,将CTC loss函数lctc(x')作为评价函数F1(·),当相似度R(x')大于0.5后,将Levenshtein距离引入评价函数,此时评价函数F2(·)表示为:
F2(x')=(1-a)·lctc(x')+a·Levenshtein(C(x'),t)
其中,a为权重系数;
按照评价函数获得对抗样本的评价函数评分,根据得分情况从种群中选择评分最高的m条样本作为精英群体;然后,根据评价函数评分,从精英群体中挑选k次,组成父辈1,再挑选k次组成父辈2;通过从父辈1和父辈2中各取一半的数据来生成子代,m和k为自然数;
在获得子代后,根据动量更新来更新突变的概率,突变的概率在每次迭代中都会根据以下指数加权的移动平均值的更新公式而调整大小:
其中,pold表示种群原来的突变率,pnew表示种群新的突变率,currScore表示当前种群的得分,preScore表示上一代种群的得分;β和γ是相关系数,β值越大,新的突变率pnew越接近pold;γ越大,pnew变化的范围越大;
再根据动量更新的突变概率,给子代添加随机噪声,然后进入下一轮迭代,直至Levenshtein距离小于2为止获得接近目标短语的对抗样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911031043.5/1.html,转载请声明来源钻瓜专利网。





