[发明专利]一种神经网络模型训练方法、装置、电子设备及存储介质有效
申请号: | 202110304132.3 | 申请日: | 2021-03-22 |
公开(公告)号: | CN113065641B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 高志鹏;苗东;芮兰兰;莫梓嘉;赵晨;林怡静;谭清;付伟 | 申请(专利权)人: | 北京邮电大学;北京驱云科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06V10/26;G06V10/764;G06V10/774;G06V10/82 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 丁芸;赵元 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 神经网络 模型 训练 方法 装置 电子设备 存储 介质 | ||
1.一种神经网络模型训练方法,其特征在于,所述方法包括:
根据预设的多组分割点将待训练的图像分类网络模型分割为多组子网络模型,其中,每一组子网络模型均包括第一子网络模型、第二子网络模型和第三子网络模型;所述分割点是根据图像分类网络模型的结构特点和分割后的子网络模型所应用的设备所设置的分割点;分割后的第一子网络模型应用于客户端,分割后的第二子网络模型应用于边缘端,分割后的第三子网络模型应用于云端;
针对各组子网络模型,将样本图像输入所述第一子网络模型,并以所述第一子网络模型的输出作为所述第二子网络模型的输入,以所述第二子网络模型的输出作为所述第一子网络模型的输入,生成所述第三子网络模型输出的图像分类结果;
针对各组子网络模型,通过预设损失函数分别计算所述第一子网络模型的输出对应的第一损失、所述第二子网络模型的输出对应的第二损失和所述第三子网络模型输出的图像分类结果对应的第三损失;
针对各组子网络模型,分别通过对应的所述第一损失、所述第二损失和所述第三损失,对对应的所述第一子网络模型、所述第二子网络模型和所述第三子网络模型进行联合训练,得到第一待输出子网络模型、第二待输出子网络模型和第三待输出子网络模型;
针对各组子网络模型,分别计算所述第一待输出子网络模型、所述第二待输出子网络模型和所述第三待输出子网络模型对应的多项性能参数;
根据各组子网络模型对应的多项性能参数,通过预设熵权模型,分别计算各组子网络模型对应的综合性能得分;
选取所述各组子网络模型中综合性能得分最高的一组作为目标子网络模型。
2.根据权利要求1所述的方法,其特征在于,所述针对各组子网络模型,分别计算所述第一待输出子网络模型、所述第二待输出子网络模型和所述第三待输出子网络模型对应的多项性能参数,包括:
针对各组子网络模型,分别计算所述第一待输出子网络模型、所述第二待输出子网络模型和所述第三待输出子网络模型对应的模型准确率、端到端时延和数据退出率。
3.根据权利要求2所述的方法,其特征在于,所述针对各组子网络模型,将样本图像输入所述第一子网络模型,并以所述第一子网络模型的输出作为所述第二子网络模型的输入,以所述第二子网络模型的输出作为所述第一子网络模型的输入,生成所述第三子网络模型输出的图像分类结果,包括:
针对各组子网络模型,将样本图像输入所述第一子网络模型,得到所述第一子网络模型的输出;
根据所述第一子网络模型的输出,通过预设熵值法计算对应的第一可信度;
当所述第一可信度大于预设阈值时,将所述第一子网络模型的输出输入到所述第二子网络模型,得到所述第二子网络模型的输出;
根据所述第二子网络模型的输出,通过预设熵值法计算对应的第二可信度;
当所述第二可信度大于所述预设阈值时,将所述第二子网络模型的输出输入到所述第三子网络模型,得到所述第三子网络模型输出的图像分类结果。
4.根据权利要求3所述的方法,其特征在于,所述预设阈值为通过预设公式:
entropy(y)=∑c∈cyclogyc,计算得到的数值,
其中,entropy()表示熵值法,y是各子模型模型的输出对应的各个标签的预测概率向量,C是分类任务中的所有标签集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学;北京驱云科技有限公司,未经北京邮电大学;北京驱云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110304132.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:屏幕角度校准方法及设备
- 下一篇:一种双金属结片机转鼓的激光制造工艺