[发明专利]神经网络模型处理方法、装置、设备及可读存储介质有效
申请号: | 201810903730.0 | 申请日: | 2018-08-09 |
公开(公告)号: | CN109102017B | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 杨少雄;赵晨 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张子青;刘芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 模型 处理 方法 装置 设备 可读 存储 介质 | ||
本发明提供一种神经网络模型处理方法、装置、设备及可读存储介质,方法包括:获取神经网络模型至少一轮历史学习过程中的历史学习数据,所述历史学习数据包括至少一组权重值以及与所述权重值对应的收敛损失值;根据所述历史学习数据中的最优权重为所述神经网络模型的下一轮学习过程设置初始权重;通过训练集中的待训练图像数据对已设置初始权重的所述神经网络模型进行训练,获得训练完毕的神经网络模型。通过至少一轮历史学习过程中的历史学习数据中的最优权重为下一轮学习过程设置权重,从而能够提高神经网络模型的学习效率。
技术领域
本发明涉及计算机领域,尤其涉及一种神经网络模型处理方法、装置、设备及可读存储介质。
背景技术
在图像识别领域,利用机器学习算法模型对图像进行识别成为主流方法。在各类的机器学习算法模型中,其内的权重值能够在很大程度上决定整个机器学习算法模型的训练质量。
由于神经网络在对待历史学习数据进行学习时,为了使后续模型性能更稳定,往往需要对一批待历史学习数据进行多轮学习。现有的权重值设置方法一般都是直接获取上一轮学习过程结束时的权重值,并将该权重值直接设置为下一轮学习过程的初始权重值。
但是,由于神经网络中的权重值往往与收敛损失值相对应,上一轮结束时的权重值可能使收敛损失值较高,因此对学习结果会产生负面影响。此外,由于在数据学习过程中,需要根据当前的学习情况实时对权重值进行调节,而导致的学习效率低。
发明内容
本发明提供一种神经网络模型处理方法、装置、设备及可读存储介质,用于解决现有技术中直接获取上一轮学习结束时的权重值,并将该权重值直接设置为下一轮学习过程的初始权重值而导致的神经网络学习效率低的技术问题。
本发明的第一个方面是提供一种神经网络模型处理方法,包括:
获取神经网络模型至少一轮历史学习过程中的历史学习数据,所述历史学习数据包括至少一组权重值以及与所述权重值对应的收敛损失值;
根据所述历史学习数据中的最优权重为所述神经网络模型的下一轮学习过程设置初始权重;
通过训练集中的待训练图像数据对已设置初始权重的所述神经网络模型进行训练,获得训练完毕的神经网络模型;
根据所述训练完毕的神经网络模型对待识别图像进行识别,获得图像识别结果。
在其中一种可选的实施方式中,所述获取神经网络模型至少一轮历史学习过程中的历史学习数据,包括:
针对每一所述历史学习过程,接收权重调整请求,根据所述权重调整请求对当前学习过程的权重值进行调整;
记录所述权重值以及所述权重值对应的收敛损失值的数值和/或变化趋势。
在其中一种可选的实施方式中,所述根据所述历史学习数据中的最优权重为所述神经网络模型的下一轮学习过程设置初始权重,包括:
确定所述至少一轮历史学习过程中的历史学习数据中数值最小的收敛损失值;
将所述数值最小的收敛损失值对应的权重值作为所述最优权重,根据所述最优权重为所述神经网络模型的下一轮学习过程设置初始权重。
在其中一种可选的实施方式中,所述根据所述历史学习数据中的最优权重为所述神经网络模型的下一轮学习过程设置初始权重,包括:
确定所述收敛损失值的变化趋势为下降且降幅超过预设降幅阈值时对应的权重值;
将所述收敛损失值的变化趋势为下降且降幅超过预设降幅阈值时对应的权重值作为所述最优权重,根据所述最优权重为所述神经网络模型的下一轮学习过程设置初始权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810903730.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于桥梁技术状况的测试方法
- 下一篇:妇科分泌物图像的多标签分类方法