[发明专利]训练深度学习模型的方法和装置、电子设备及存储介质在审
申请号: | 202111683696.9 | 申请日: | 2021-12-31 |
公开(公告)号: | CN114492788A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 陆能 | 申请(专利权)人: | 深存科技(无锡)有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N5/04;G06K9/62;G06V10/70;G06V10/82;G06V10/764 |
代理公司: | 北京市中伦律师事务所 11410 | 代理人: | 钟锦舜 |
地址: | 214115 江苏省无锡市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 深度 学习 模型 方法 装置 电子设备 存储 介质 | ||
本公开提供用于训练深度学习模型的方法和装置、电子设备及存储介质,该方法包括:使用第一训练数据集开始对待训练模型进行迭代训练;筛选推理错误的样本数据和推理正确的样本数据;对所筛选的推理错误的样本数据进行数据增强;基于经所述数据增强的推理错误的样本数据和所筛选的推理正确的样本数据生成第二训练数据集;以及在使用所述第二训练数据集进行进一步训练后,使用所述第一训练数据集继续进行迭代训练。本公开能够在深度学习模型的训练过程中基于推理错误的样本数据进行动态调整生成新的训练数据集,从而优化深度学习模型的训练过程,进而改善深度学习模型的训练效率和训练后的预测性能。
技术领域
本公开涉及计算机技术领域,具体涉及人工智能和深度学习技术,尤其涉及训练深度学习模型的方法和装置、电子设备及存储介质。
背景技术
随着人工智能技术的发展和人工智能应用领域的不断拓展,对深度学习模型提出了更高的要求。深度学习模型需要通过基于现有数据的训练过程收敛到所需的预测性能(例如分类、检测),因此用于训练过程的数据集(即训练数据集)直接影响深度学习模型的训练效率和任务预测性能。通常,可获得的用于训练数据集的样本数据分布不均,并且在训练过程中训练数据集固定不变,导致深度学习模型在诸如训练效率和预测性能等方面不够理想。
发明内容
本公开旨在提供一种用于训练深度学习模型的方法和装置、电子设备及存储介质,以至少解决上述技术问题。
根据本公开的一方面,提供了一种训练深度学习模型的方法,包括:
使用第一训练数据集开始对待训练模型进行迭代训练;筛选推理错误的样本数据和推理正确的样本数据;对所筛选的推理错误的样本数据进行数据增强;基于经所述数据增强的推理错误的样本数据和所筛选的推理正确的样本数据生成第二训练数据集;以及在使用所述第二训练数据集进行进一步训练后,使用所述第一训练数据集继续进行迭代训练。
根据本公开的另一方面,提供了一种用于训练深度学习模型的装置,包括训练单元、数据筛选单元、数据增强单元以及生成单元,其中:
所述训练单元用于使用第一训练数据集开始对待训练模型进行迭代训练;所述数据筛选单元用于筛选推理错误的样本数据和推理正确的样本数据;所述数据增强单元用于对所筛选的推理错误的样本数据进行数据增强;所述生成单元用于基于经所述数据增强的推理错误的样本数据和所筛选的推理正确的样本数据生成第二训练数据集;所述训练单元还用于使用所述第二训练数据集进行进一步训练,并且还用于在所述进一步训练后使用所述第一训练数据集继续进行迭代训练。
根据本公开的又一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器,其中所述存储器存储有可被至少一个处理器执行的指令,所述指令在被所述至少一个处理器执行时使得所述电子设备执行前述的训练深度学习模型的方法。
根据本公开的又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中所述计算机指令用于使计算机执行前述的训练深度学习模型的方法。
根据本公开的技术方案能够在深度学习模型的训练过程中基于推理错误的样本数据进行动态调整生成新的训练数据集,从而优化深度学习模型的训练过程,进而改善深度学习模型的训练效率和训练后的预测性能。
应当理解,本部分所描述的内容并非旨在表示本公开的实施方式的关键或重要的目的、特征以及技术效果,也不用于限制本公开的范围。本公开的其它目的、特征以及技术效果将通过以下的说明书而变得容易理解。
附图说明
附图仅用于更好地理解本公开的实施方式和实施例,并不旨在构成对本公开的限定。其中:
图1是根据本公开的一些实施方式的训练深度学习模型的方法的示意性流程图;
图2是根据本公开的一些实施例的训练深度学习模型的方法的示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深存科技(无锡)有限公司,未经深存科技(无锡)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111683696.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种低温环境下燃油喷雾着火滞燃期的计算方法
- 下一篇:冷却风扇模块及底盘结构