[发明专利]神经网络模型训练方法、图像识别方法和装置有效

申请号：	201910767331.0	申请日：	2019-08-20
公开（公告）号：	CN110555526B	公开（公告）日：	2022-07-29
发明（设计）人：	郭梓超	申请（专利权）人：	北京迈格威科技有限公司
主分类号：	G06N3/08	分类号：	G06N3/08;G06N3/04;G06V10/70;G06V10/82;G06V10/774;G06K9/62
代理公司：	北京华进京联知识产权代理有限公司 11606	代理人：	朱五云
地址：	100190 北京市海淀区科***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	神经网络模型训练方法图像识别装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请涉及一种神经网络模型训练方法、图像识别方法、装置、计算机设备和可读存储介质。该方法包括：获取训练样本数据和初始阶段的采样概率向量；采样概率向量中的每个元素值表征每种数据变换方式被选中为目标数据变换方式的概率；根据训练样本数据、初始阶段的采样概率向量和预设的数据变换预测模型，采用不同阶段的采样概率向量得到的增广样本数据对初始的神经网络模型进行多个阶段的训练，得到训练好的神经网络模型；数据变换预测模型用于根据每个阶段的采样概率向量预测每个阶段的下一阶段的采样概率向量。采用本方法能够提高训练出的神经网络模型的性能。

技术领域

本申请涉及神经网络技术领域，特别是涉及一种神经网络模型训练方法、图像识别方法、装置、计算机设备和可读存储介质。

背景技术

神经网络模型往往需要大量的样本数据用于训练；因为如果采用少量样本数据进行训练，则训练出的神经网络模型往往会出现效果不好或过拟合(over fitting)的问题。然而在大量场景下，往往很难获得超大数据集的样本数据。

目前，大多数的神经网络模型采用数据增广(data augmentation)的方式来增加样本数据的数量和多样性；数据增广是指在样本数据输入神经网络模型以对神经网络模型进行训练之前，对输入的样本数据进行各种各样的变换，使得一个样本数据可以扩展为多个不同的样本数据；具体地，传统方式是从多个数据变换方式中人为地选择一种或多种数据变换方式对输入的样本数据进行变换。

然而，不同的神经网络模型往往需要采用不同的数据变换方式才能达到好的性能提升效果，粗略地人为固定数据变换方式无法使训练得到的模型性能达到最优。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提升训练出的模型性能的神经网络模型训练方法、图像识别方法、装置、计算机设备和可读存储介质。

第一方面，一种神经网络模型训练方法，包括：

获取训练样本数据和初始阶段的采样概率向量；所述采样概率向量中的每个元素值表征每种数据变换方式被选中为目标数据变换方式的概率；

根据所述训练样本数据、初始阶段的采样概率向量和预设的数据变换预测模型，采用不同阶段的采样概率向量得到的增广样本数据对初始的神经网络模型进行多个阶段的训练，得到训练好的神经网络模型；所述数据变换预测模型用于根据每个阶段的采样概率向量预测每个阶段的下一阶段的采样概率向量。

在其中一个实施例中，所述预设的数据变换预测模型是根据统计得到的关联关系所预先训练好的，所述关联关系为不同数据变换方式的切换过程与相同类型的神经网络模型的性能参数的变化量之间的关联关系。

在其中一个实施例中，所述预设的数据变换预测模型是待训练的，所述根据所述训练样本数据、初始阶段的采样概率向量和预设的数据变换预测模型，采用不同阶段的采样概率向量得到的增广样本数据对初始的神经网络模型进行多个阶段的训练，得到训练好的神经网络模型，包括：

根据所述训练样本数据和初始阶段的采样概率向量，从初始阶段开始对所述神经网络模型和所述数据变换预测模型交替进行每个阶段的训练，得到训练好的神经网络模型；其中，在每个阶段，基于所述阶段训练后的神经网络模型的性能参数的变化量对所述数据变换预测模型进行所述阶段的训练。

在其中一个实施例中，所述根据所述训练样本数据和初始阶段的采样概率向量，从初始阶段开始对所述神经网络模型和所述数据变换预测模型交替进行每个阶段的训练，得到训练好的神经网络模型，包括：

针对每个阶段，根据所述阶段的采样概率向量对应的目标数据变换方式，对所述训练样本数据进行数据变换，得到所述阶段的增广样本数据；

基于所述阶段的增广样本数据对所述阶段的神经网络模型进行所述阶段的训练，得到所述阶段的下一阶段的神经网络模型；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司，未经北京迈格威科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910767331.0/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]神经网络模型训练方法、图像识别方法和装置有效

专利文献下载