[发明专利]训练神经网络的方法、装置、系统和存储介质在审
申请号: | 201910615433.0 | 申请日: | 2019-07-09 |
公开(公告)号: | CN110490224A | 公开(公告)日: | 2019-11-22 |
发明(设计)人: | 王丽;王远江;袁野;俞刚 | 申请(专利权)人: | 北京迈格威科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 11336 北京市磐华律师事务所 | 代理人: | 高伟;卜璐璐<国际申请>=<国际公布>= |
地址: | 100190 北京市海淀区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 训练数据 权重 训练神经网络 存储介质 加速神经 损失函数 训练收敛 迭代 轮数 前轮 预设 收敛 网络 | ||
本发明提供一种训练神经网络的方法、装置、系统和存储介质。该方法包括:基于训练数据对待训练的第一神经网络进行一轮训练;基于所述训练数据中的每个训练数据在当前轮训练后各自的状态,采用第二神经网络生成用于对第一神经网络进行下一轮训练的、所述每个训练数据各自的权重;基于各自带有权重的所述每个训练数据对第一神经网络进行下一轮训练,并回到生成所述权重的步骤以生成用于对第一神经网络进行再下一轮训练的、所述每个训练数据各自的权重,如此迭代,直到达到预设训练轮数或第一神经网络的损失函数收敛。根据本发明实施例的训练神经网络的方法、装置和系统不仅能够加速神经网络的训练收敛过程,还能够提高训练出的神经网络的网络精度。
技术领域
本发明涉及深度学习技术领域,更具体地涉及一种训练神经网络的方法、装置、系统和存储介质。
背景技术
深度学习(Deep Learning,DL)是机器学习的技术和研究领域之一,通过建立具有阶层结构的人工神经网络(Artifitial Neural Networks,ANNs),在计算系统中实现人工智能。随着深度学习的广泛应用,训练神经网络时采用的训练数据的好坏在网络模型的训练过程中也占着举足轻重的地位。因此,如何挑选对当前训练状态下的模型友好的训练数据,也至为重要。
目前在进行神经网络的训练时主要通过以下方法挑选样本:(1)在线难样本挖掘(online hard example mining,简称为ohem)方法,即在每次训练中挑选损失函数值最高的部分比例样本参与网络模型的参数更新;(2)课程学习方法,即制定课程让网络模型先学习简单样本,再学习难样本;(3)手动制定规则方法,即只有符合规则的样本才能参与网络的更新。然而,这些方法都避免不了人工制定的规则,忽略了某些潜在的影响因素。
发明内容
为了解决上述问题中的至少一个而提出了本发明。本发明提出了一种训练神经网络的方案,其在训练神经网络时采用另一神经网络基于训练数据在上一轮(或当前轮)训练后的状态生成训练数据在当前轮(或下一轮)训练时的权重,使得能够针对训练的不同状态挑选出对当前网络友好的训练数据,不仅能够加速神经网络的训练收敛过程,还能够提高训练出的神经网络的网络精度。下面简要描述本发明提出的训练神经网络的方案,更多细节将在后续结合附图在具体实施方式中加以描述。
根据本发明一方面,提供了一种训练神经网络的方法,所述方法包括:基于训练数据对待训练的第一神经网络进行一轮训练;基于所述训练数据中的每个训练数据在当前轮训练后各自的状态,采用用于辅助所述第一神经网络的训练的第二神经网络生成用于对所述第一神经网络进行下一轮训练的、所述每个训练数据各自的权重;以及基于各自带有权重的所述每个训练数据对所述第一神经网络进行所述下一轮训练,并回到生成所述权重的步骤以生成用于对所述第一神经网络进行再下一轮训练的、所述每个训练数据各自的权重,如此迭代,直到达到预设训练轮数或所述第一神经网络的损失函数收敛。
在本发明的一个实施例中,所述每个训练数据在当前轮训练后各自的状态包括以下中的至少一项:所述第一神经网络在当前轮训练后输出的对所述每个训练数据各自的输出结果;所述第一神经网络在当前轮训练后输出的对所述每个训练数据各自的输出结果与所述每个训练数据各自的真实结果之间的度量差;以及当前已经对所述第一神经网络训练的轮数。
在本发明的一个实施例中,所述方法还包括:在每次基于各自带有权重的所述训练数据中的一批训练数据对所述第一神经网络进行训练后,更新所述第一神经网络的参数,并基于验证数据对所述第一神经网络进行验证;以及基于所述验证的结果更新所述第二神经网络的参数,以优化所述第二神经网络所生成的用于对所述第一神经网络进行下一轮训练的、所述一批训练数据中的每个训练数据各自的权重。
在本发明的一个实施例中,所述第二神经网络所生成的用于对所述第一神经网络进行下一轮训练的、所述每个训练数据各自的权重是用于加速所述第一神经网络的训练收敛过程,并能够用于在不同的训练时刻挑选对所述第一神经网络的当前模型友好的训练数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910615433.0/2.html,转载请声明来源钻瓜专利网。