[发明专利]一种集成模型的自适应多样性增强训练方法及装置在审
申请号: | 201910247718.3 | 申请日: | 2019-03-29 |
公开(公告)号: | CN110046694A | 公开(公告)日: | 2019-07-23 |
发明(设计)人: | 朱军;庞天宇;许堃;杜超;陈宁 | 申请(专利权)人: | 清华大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王庆龙;周永君 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标集成 子模型 集成模型 迭代训练 自适应 多样性 模型训练 收敛状态 鲁棒性 输出 引入 | ||
本发明实施例提供一种集成模型的自适应多样性增强训练方法及装置,将待训练的集成模型作为目标集成模型,根据目标集成模型中各个子模型的输出获得目标正则项,并将目标正则项加入到目标集成模型的每个子模型的迭代训练过程中,当且仅当目标集成模型中的所有子模型均训练至收敛状态时,则确定目标集成模型训练完成。该方法及装置所引入的目标正则项中充分考虑了目标集成模型中的各个子模型之间的相互作用,将目标正则项加入到目标集成模型的每个子模型的迭代训练中,有利于提高目标集成模型的鲁棒性和可靠性。
技术领域
本发明实施例涉及机器学习技术领域,更具体地,涉及一种集成模型的自适应多样性增强训练方法及装置。
背景技术
目前,神经网络在各个领域上都取得了巨大的成功,包括图像识别、语音识别以及自然语言处理等领域。然而,神经网络模型在对抗环境中往往很容易受到攻击,在对抗环境中,神经网络模型会被输入一些基于正常样本精心计算得到的对抗样本,例如图片或者语音信息,这些对抗样本很容易被神经网络模型错误分类。有鉴于此,提高神经网络模型的鲁棒性和可靠性已成为现今研究的热点。
目前已有一些学者提出了提高神经网络模型的鲁棒性和可靠性的训练策略。例如,Szegedy C以及Matry等人提出的对抗训练策略是随着训练过程动态地利用对抗样本扩充训练集。然而,现有的训练策略均是聚焦于提高单个神经网络模型的鲁棒性和可靠性,在实际应用中,各领域中所使用的神经网络模型往往是由多个子模型组成的集成模型,由于集成模型中各个子模型之间存在相互作用,因此现有的训练策略难以有效提高集成模型的鲁棒性和可靠性。
有鉴于此,亟需提供一种集成模型的训练方法及装置,以能够有效提高集成模型的鲁棒性和可靠性。
发明内容
本发明实施例为了克服现有的训练策略难以有效提高集成模型的鲁棒性和可靠性的问题,提供一种集成模型的自适应多样性增强训练方法及装置。
第一方面,本发明实施例提供一种集成模型的自适应多样性增强训练方法,包括:
将待训练的集成模型作为目标集成模型,根据所述目标集成模型中各个子模型的输出获得目标正则项,根据所述目标集成模型中所有子模型各自对应的交叉熵损失函数和所述目标正则项构造所述目标集成模型对应的目标函数;
对于所述目标集成模型中的任意一个子模型,根据预设训练集对所述子模型进行迭代训练,对于任意一个当前迭代过程,基于梯度下降算法根据所述子模型在上一次迭代过程中的网络参数和所述目标集成模型对应的目标函数更新获得所述子模型在当前迭代过程中的网络参数;
若所述子模型在当前迭代过程中的网络参数与所述子模型在上一次迭代过程中的网络参数的差值不大于预设阈值,则所述子模型为收敛状态,当且仅当所述目标集成模型中的所有子模型均为收敛状态时,确定所述目标集成模型训练完成。
第二方面,本发明实施例提供一种集成模型的自适应多样性增强训练装置,包括:
目标函数构造模块,用于将待训练的集成模型作为目标集成模型,根据所述目标集成模型中各个子模型的输出之间的相互作用获得目标正则项,根据所述目标集成模型中所有子模型各自对应的交叉熵损失函数和所述目标正则项构造所述目标集成模型对应的目标函数;
子模型训练模块,用于对于所述目标集成模型中的任意一个子模型,根据预设训练集对所述子模型进行迭代训练,对于任意一个当前迭代过程,基于梯度下降算法根据所述子模型在上一次迭代过程中的网络参数和所述目标集成模型对应的目标函数更新获得所述子模型在当前迭代过程中的网络参数;
集成模型训练模块,用于若所述子模型在当前迭代过程中的网络参数与所述子模型在上一次迭代过程中的网络参数的差值不大于预设阈值,则所述子模型为收敛状态,当且仅当所述目标集成模型中的所有子模型均为收敛状态时,确定所述目标集成模型训练完成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910247718.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:选择编码选项
- 下一篇:一种可配置的高并行度脉冲神经元阵列