[发明专利]神经网络模型训练方法、图像识别方法和装置有效
申请号: | 201910767331.0 | 申请日: | 2019-08-20 |
公开(公告)号: | CN110555526B | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 郭梓超 | 申请(专利权)人: | 北京迈格威科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04;G06V10/70;G06V10/82;G06V10/774;G06K9/62 |
代理公司: | 北京华进京联知识产权代理有限公司 11606 | 代理人: | 朱五云 |
地址: | 100190 北京市海淀区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 模型 训练 方法 图像 识别 装置 | ||
1.一种图像识别方法,其特征在于,包括:
将待处理图像输入神经网络模型进行特征提取处理,输出所述待处理图像的图像特征;所述神经网络模型是根据训练样本数据、初始阶段的采样概率向量和预设的数据变换预测模型,采用不同阶段的采样概率向量得到的增广样本数据对初始的神经网络模型进行多个阶段的训练得到的;所述数据变换预测模型用于根据每个阶段的采样概率向量预测每个阶段的下一阶段的采样概率向量;所述采样概率向量中的每个元素值表征每种数据变换方式被选中为目标数据变换方式的概率;所述预设的数据变换预测模型是根据统计得到的关联关系所预先训练好的,所述关联关系为不同数据变换方式的切换过程与相同类型的神经网络模型的性能参数的变化量之间的关联关系;所述神经网络模型的性能参数包括基于测试样本数据对所述神经网络模型进行测试得到的准确率、基于测试样本数据对所述神经网络模型进行测试得到的召回率、所述神经网络模型对所述训练样本数据的预测结果与标注结果之间的损失;针对每个阶段,获取所述阶段的神经网络模型的性能参数,以及所述阶段的下一阶段的神经网络模型的性能参数,并计算所述阶段的性能参数的变化量;其中,所述阶段的性能参数的变化量为所述阶段的性能参数和所述阶段的上一阶段的性能参数的差值;或者是以所述阶段为最后阶段的连续P个阶段的性能参数的均值,和以所述阶段的上一个阶段为最后阶段的连续P个阶段的性能参数的均值,之间的差值,P为大于1的整数;
根据所述待处理图像的图像特征,对所述待处理图像进行图像识别处理,得到所述待处理图像的图像识别结果。
2.根据权利要求1所述的方法,其特征在于,所述神经网络模型的训练过程包括:
根据所述训练样本数据和初始阶段的采样概率向量,从初始阶段开始对所述神经网络模型和所述数据变换预测模型交替进行每个阶段的训练,得到训练好的神经网络模型;其中,在每个阶段,基于所述阶段训练后的神经网络模型的性能参数的变化量对所述数据变换预测模型进行所述阶段的训练。
3.根据权利要求2所述的方法,其特征在于,所述根据所述训练样本数据和初始阶段的采样概率向量,从初始阶段开始对所述神经网络模型和所述数据变换预测模型交替进行每个阶段的训练,得到训练好的神经网络模型,包括:
针对每个阶段,根据所述阶段的采样概率向量对应的目标数据变换方式,对所述训练样本数据进行数据变换,得到所述阶段的增广样本数据;
基于所述阶段的增广样本数据对所述阶段的神经网络模型进行所述阶段的训练,得到所述阶段的下一阶段的神经网络模型;
基于所述阶段的性能参数的变化量对所述阶段的数据变换预测模型进行训练,得到所述阶段的下一阶段的数据变换预测模型;
将所述阶段的采样概率向量输入所述阶段的下一阶段的数据变换预测模型,得到所述阶段的下一阶段的采样概率向量。
4.根据权利要求3所述的方法,其特征在于,所述基于所述阶段的性能参数的变化量对所述阶段的数据变换预测模型进行训练,得到所述阶段的下一阶段的数据变换预测模型,包括:
根据所述阶段的性能参数的变化量,计算所述数据变换预测模型的奖励函数的值;所述奖励函数已预先基于策略梯度构建;
根据所述奖励函数的值,对所述阶段的数据变换预测模型进行训练,得到所述阶段的下一阶段的数据变换预测模型。
5.根据权利要求4所述的方法,其特征在于,所述奖励函数F(d)采用以下关系式计算得到:
F(d)=-e-dlgp,
其中,d为所述阶段的性能参数的变化量,p为所述阶段的采样概率向量中的最大元素值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910767331.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:模型参数确定方法、装置和电子设备
- 下一篇:延时摄影视频的生成方法及设备