[发明专利]一种训练样本生成方法及装置、设备、介质有效
| 申请号: | 201811030419.6 | 申请日: | 2018-09-05 |
| 公开(公告)号: | CN109272031B | 公开(公告)日: | 2021-03-30 |
| 发明(设计)人: | 高三元;徐晓刚 | 申请(专利权)人: | 宽凳(北京)科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 北京市中伦律师事务所 11410 | 代理人: | 杨黎峰;钟锦舜 |
| 地址: | 100012 北京市朝阳区容*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 训练 样本 生成 方法 装置 设备 介质 | ||
1.一种训练样本生成方法,其特征在于,包括:
从同一图像数据集中,获取深度模型的多个第一训练样本;
根据所述第一训练样本的第i-1轮扰动,以及第i-1轮迭代训练时损失函数对应的梯度,计算所述第一训练样本的第i轮扰动,所述第i轮扰动用于在第i轮迭代训练时叠加于所述第一训练样本上,训练时每个所述第一训练样本中的一部分像素采用错误分类标签,另一部分像素采用正确分类标签;
根据分别为所述多个第一训练样本计算出的第i轮扰动,确定该同一图像数据集的通用扰动;
根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动;
根据所述多个不同图像数据集中的样本,以及所述统一的通用扰动,生成所述深度模型的第二训练样本。
2.如权利要求1所述的方法,其特征在于,在所述生成所述深度模型的第二训练样本后,所述方法还包括:
利用所述第二训练样本,以及所述多个不同图像数据集中的样本,训练所述深度模型。
3.如权利要求1所述的方法,其特征在于,所述根据分别为多个不同图像数据集确定的通用扰动,确定统一的通用扰动,具体包括:
获取分别为多个不同图像数据集确定的通用扰动;
对获取的各所述通用扰动进行归一化处理;
根据归一化处理的结果、指定的随机扰动和扰动幅度限制因子,确定统一的通用扰动。
4.如权利要求1所述的方法,其特征在于,所述计算所述第一训练样本的第i轮扰动,具体包括:
利用快速梯度算法,计算所述第一训练样本的第i轮扰动;
其中,所述计算过程中使用了以下至少一种因子:输入幅度控制因子、扰动幅度控制因子、针对所述一部分像素和所述另一部分像素的损失函数权重。
5.如权利要求4所述的方法,其特征在于,所述计算过程中还使用了指定的随机扰动及其相关控制因子。
6.如权利要求1所述的方法,其特征在于,所述确定该同一图像数据集的通用扰动,具体包括:
采用以下公式,确定该同一图像数据集的通用扰动:
其中,rD表示该同一图像数据集的通用扰动,wn表示所述多个第一训练样本中的至少部分样本中第n个样本的扰动权重,rin表示该第n个样本的第i轮扰动。
7.如权利要求3所述的方法,其特征在于,所述确定统一的通用扰动,具体包括:
采用以下公式,确定统一的通用扰动:
其中,R表示所述统一的通用扰动,M表示所述多个不同图像数据集的数量,表示所述多个不同图像数据集中第j个图像数据集的通用扰动,γ表示所述扰动幅度限制因子,rrandom表示指定的随机扰动,该随机扰动服从均值为0且标准差为1的正态分布。
8.如权利要求4所述的方法,其特征在于,所述利用快速梯度算法,计算所述第一训练样本的第i轮扰动,具体包括:
采用以下公式,计算所述第一训练样本的第i轮扰动:
Ladv=w×L;
其中,ri表示所述第i轮扰动,Clip表示作为所述输入幅度控制因子的处理函数,ri-1表示所述第i-1轮扰动,α表示所述扰动幅度控制因子,sign表示正负符号判断函数,x表示所述深度模型的输入,表示上一轮Ladv相对于x的梯度,L表示所述损失函数,w表示所述损失函数权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宽凳(北京)科技有限公司,未经宽凳(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811030419.6/1.html,转载请声明来源钻瓜专利网。





