[发明专利]一种深度学习模型训练方法有效
申请号: | 202111635664.1 | 申请日: | 2021-12-29 |
公开(公告)号: | CN114004358B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 张家兴;李鹏飞;郑海波;王昊;王瑞;吴晓均 | 申请(专利权)人: | 粤港澳大湾区数字经济研究院(福田) |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/10;G06N3/04 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 谢松 |
地址: | 518045 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 学习 模型 训练 方法 | ||
本发明公开了一种深度学习模型训练方法,包括步骤:获取第一数据集;设置所述深度学习模型的初始模型参数和训练中止条件,基于所述第一数据集对所述深度学习模型进行多次迭代训练,以初始模型参数计算每一次迭代生成的模型参数值;当满足所述训练中止条件时生成一个模型节点;保存最后一次迭代训练生成的模型参数值为所述模型节点的节点信息。本发明提供的深度学习模型训练方法,可在训练过程中形成至少两个模型节点,并保存节点信息。进一步地,可形成节点信息的展示界面,且在展示界面上提供深度学习模型训练的交互操作,使得用户在训练过程中可根据各模型节点的节点信息进行适时调整,以更快地得到最优的深度学习模型。
技术领域
本发明涉及深度学习技术领域,尤其涉及的是一种深度学习模型训练方法。
背景技术
随着AI(Artificial Intelligence)技术和理论的日益成熟,AI算法的应用领域也越来越广,业务量更是呈飞速发展的态势。为了让算法工程师脱离繁琐的工程开发任务,集中精力于算法研发上,各种机器学习算法平台应运而生。现有技术中,大部分AI算法平台只提供按照时间排序的训练记录列表,训练过程未能进行管理,在模型训练过程中与用户的交互性较差。
因此,现有技术还有待于改进和发展。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种深度学习模型训练方法,旨在解决现有技术中模型训练过程中与用户的交互性差的问题。
本发明解决技术问题所采用的技术方案如下:
一种深度学习模型训练方法,其中,包括步骤:
获取第一数据集;
设置所述深度学习模型的初始模型参数和训练中止条件,基于所述第一数据集对所述深度学习模型进行多次迭代训练,以初始模型参数计算每一次迭代生成的模型参数值;
当满足所述训练中止条件时生成一个模型节点;
保存最后一次迭代训练生成的模型参数值为所述模型节点的节点信息。
所述第一数据集包括训练样本和测试样本;
基于所述训练样本对所述深度学习模型进行多次迭代训练;
所述训练中止条件,具体为所述迭代训练的次数达到预设的训练次数,且结束最后一次迭代训练。
基于所述测试样本对所述最后一次迭代训练后的深度学习模型进行测试,得到测试数据后再生成一个模型节点;
所述测试数据包括模型的准确率、样本分类准确率、置信度、测试分类结果的至少一种。
所述模型节点的节点信息,还至少包括:所述第一数据集、所述测试数据、所述模型节点生成时间、所述深度学习模型训练的消耗算力。
根据所述模型节点的节点信息生成展示界面;
所述展示界面的信息为:按照所述模型节点生成时间的关系生成的关系图、所述节点信息中的至少一个信息。
所述展示界面还至少包括一种交互操作:所述获取第一数据集的交互操作,所述设置所述深度学习模型的初始模型参数和训练中止条件的交互操作。
所述当满足所述训练中止条件后生成一个模型节点的步骤之后,还包括接收用户的重新训练指令并获取第二数据集,所述第二数据集包括所述第一数据集和样例数据集,所述样例数据集中训练样本具有对应的权重;
所述重新训练指令还包括选择一个模型节点为父模型节点,基于所述第二数据集对所述深度学习模型进行多次迭代训练,以父模型节点保存的模型参数值为初始模型参数计算每一次迭代生成的模型参数值;
当满足所述训练中止条件后生成一个子模型节点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于粤港澳大湾区数字经济研究院(福田),未经粤港澳大湾区数字经济研究院(福田)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111635664.1/2.html,转载请声明来源钻瓜专利网。