[发明专利]一种深度学习模型训练方法有效
申请号: | 202111635664.1 | 申请日: | 2021-12-29 |
公开(公告)号: | CN114004358B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 张家兴;李鹏飞;郑海波;王昊;王瑞;吴晓均 | 申请(专利权)人: | 粤港澳大湾区数字经济研究院(福田) |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/10;G06N3/04 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 谢松 |
地址: | 518045 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 学习 模型 训练 方法 | ||
1.一种深度学习模型训练方法,其特征在于,包括:
获取第一数据集;
设置所述深度学习模型的初始模型参数和训练中止条件,基于所述第一数据集对所述深度学习模型进行多次迭代训练,以初始模型参数计算每一次迭代生成的模型参数值;
当满足所述训练中止条件时生成一个模型节点;
保存最后一次迭代训练生成的模型参数值为所述模型节点的节点信息,并在该模型节点的基础上继续迭代训练,直至下一次满足所述训练中止条件时,生成下一个模型节点;
接收用户的重新训练指令并获取第二数据集,所述第二数据集包括所述第一数据集和样例数据集,所述样例数据集包括第二训练样本、第二训练样本对应的标签、第二训练样本对应的权重、第二测试样本、第二测试样本对应的标签以及第二测试样本对应的权重;
所述重新训练指令还包括选择一个模型节点为父模型节点,基于所述第二数据集对所述深度学习模型进行多次迭代训练,以父模型节点保存的模型参数值为初始模型参数计算每一次迭代生成的模型参数值;
当满足所述训练中止条件后生成一个子模型节点;
保存最后一次迭代训练生成的模型参数值为所述子模型节点的节点信息;
生成展示界面;其中,所述展示界面的信息包括:按照所述模型节点生成时间的关系生成的关系图,以及所述父模型节点与所述子模型节点的关系图;所述展示界面还设有用户交互界面,所述用户交互界面包括所述选择一个模型节点为父模型节点的交互操作。
2.根据权利要求1所述的深度学习模型训练方法,其特征在于:所述第一数据集包括训练样本和测试样本;
基于所述训练样本对所述深度学习模型进行多次迭代训练;
所述训练中止条件,具体为所述迭代训练的次数达到预设的训练次数,且结束最后一次迭代训练。
3.根据权利要求2所述的深度学习模型训练方法,其特征在于:
基于所述测试样本对所述最后一次迭代训练后的深度学习模型进行测试,得到测试数据后再生成一个模型节点;
所述测试数据包括模型的准确率、样本分类准确率、置信度、测试分类结果的至少一种。
4.根据权利要求3所述的深度学习模型训练方法,其特征在于:所述模型节点的节点信息,还至少包括:所述第一数据集、所述测试数据、所述模型节点生成时间、所述深度学习模型训练的消耗算力。
5.根据权利要求1-4任意一项所述的深度学习模型训练方法,其特征在于,所述展示界面的信息还包括:所述节点信息中的至少一个信息。
6.根据权利要求5所述的深度学习模型训练方法,其特征在于,所述展示界面还至少包括一种交互操作:所述获取第一数据集的交互操作,所述设置所述深度学习模型的初始模型参数和训练中止条件的交互操作。
7.根据权利要求1所述的深度学习模型训练方法,其特征在于,所述选择一个模型节点为父模型节点的步骤包括:
以具有最大准确率的模型节点为父模型节点。
8.根据权利要求1所述的深度学习模型训练方法,其特征在于,所述选择一个模型节点为父模型节点的步骤包括:
以对所述样例数据集具有最大准确率的模型节点为父模型节点。
9.根据权利要求1所述的深度学习模型训练方法,其特征在于,所述选择一个模型节点为父模型节点的步骤包括:
以对所述样例数据集中部分训练样本具有最大准确率的模型节点为父模型节点。
10.根据权利要求1所述的深度学习模型训练方法,其特征在于,所述选择一个模型节点为父模型节点的步骤包括:
以模型生成时间排列在前的模型节点为父模型节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于粤港澳大湾区数字经济研究院(福田),未经粤港澳大湾区数字经济研究院(福田)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111635664.1/1.html,转载请声明来源钻瓜专利网。