[发明专利]基于遗传算法的对抗训练方法、装置和计算机存储介质在审
申请号: | 202011462377.0 | 申请日: | 2020-12-10 |
公开(公告)号: | CN112529179A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 周颖;张宾;张伟哲;束建钢;杨孙傲 | 申请(专利权)人: | 鹏城实验室 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 晏波 |
地址: | 518000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 遗传 算法 对抗 训练 方法 装置 计算机 存储 介质 | ||
本发明公开了一种基于遗传算法的对抗训练方法、装置和计算机存储介质,该方法包括以下步骤:利用训练样本的输出置信度确定模型对应的边界样本;采用遗传算法对边界样本进行扩充搜索,生成对抗样本;通过对抗样本所处的模型边界光滑度对对抗样本进行筛选,确定对抗样本集合;根据对抗样本集合对模型进行再训练。解决了现有人工智能模型对抗训练方法中训练模型还存在缺陷以及耗费训练资源的问题。
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于遗传算法的对抗训练方法、装置和计算机存储介质。
背景技术
人工智能的快速发展,给生活带来了很大便利。但是人工智能模型的可理解性较差,边界模糊,受攻击面广泛,不同攻击算法产生的对抗样本都有不错的攻击效果,导致人工智能系统安全性低。
目前对抗攻击的防御算法很多,对抗训练采用对抗样本增强算法的训练数据集,使用广泛。但是目前的对抗训练只是采用单一或多种对抗攻击算法增强训练数据集,并未对人工智能模型和对抗攻击算法的特性进行分析和匹配,因此采用对抗训练后的人工智能模型并不能保证其局部边界的稳定性,仍然会受到其他形式的对抗攻击。
现有的方法主要有以下缺点:
一、对抗训练采用对抗样本生成算法进行数据增强以重新训练人工智能模型,但对抗样本不能很好地匹配人工智能模型特点及充分表征模型边界,降低对抗训练的精确度。
二、对抗训练并未有效区分对抗样本与模型边界的相对位置,不同的对抗样本无法互相补充,导致对抗样本重叠,引入噪声,耗费训练资源。
因此,现有人工智能模型对抗训练方法中训练模型还存在缺陷以及耗费训练资源的问题。
发明内容
本发明主要目的在于提供一种基于遗传算法的对抗训练方法、装置和计算机存储介质,旨在解决现有人工智能模型对抗训练方法中训练模型还存在缺陷以及耗费训练资源的问题。
为实现上述目的,本发明提供一种基于遗传算法的对抗训练方法,所述基于遗传算法的对抗训练方法包括以下步骤:
利用训练样本的输出置信度确定模型对应的边界样本;
采用遗传算法对所述边界样本进行扩充搜索,生成对抗样本;
通过所述对抗样本所处的模型边界光滑度对所述对抗样本进行筛选,确定对抗样本集合;
根据所述对抗样本集合对所述模型进行再训练。
在一实施例中,所述利用训练样本的输出置信度确定模型对应的边界样本,包括:
使用训练数据训练模型;
计算训练样本通过所述模型后的输出结果的置信度;
当所述置信度小于预设置信度阈值时,将所述置信度对应的训练样本作为边界样本。
在一实施例中,所述采用遗传算法对所述边界样本进行扩充搜索,生成对抗样本,包括:
将所述边界样本作为种子样本,采用预设编码规则对样本空间进行编码;
随机选择所述种子样本附近的点初始化种群;
通过适应度函数计算公式计算种群中个体适应度;
根据所述个体适应度选择样本进行交叉、变异操作产生新解,将所述新解加入所述种群形成新种群;
计算所述新种群中个体适应度,根据所述个体适应度进行迭代优化,并设置最大迭代次数;
当所述个体适应度大于预设适应度函数阈值或达到所述最大迭代次数时,终止迭代,将所述新种群作为对抗样本。
在一实施例中,所述适应度函数计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鹏城实验室,未经鹏城实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011462377.0/2.html,转载请声明来源钻瓜专利网。