[发明专利]一种神经网络模型优化方法、装置、设备和存储介质在审
| 申请号: | 202010590567.4 | 申请日: | 2020-06-24 |
| 公开(公告)号: | CN111753959A | 公开(公告)日: | 2020-10-09 |
| 发明(设计)人: | 刘江;章晓庆 | 申请(专利权)人: | 南方科技大学 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 潘登 |
| 地址: | 518055 广东省*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 神经网络 模型 优化 方法 装置 设备 存储 介质 | ||
1.一种神经网络模型优化方法,其特征在于,包括:
基于预设标记类别对训练数据的输出真实值进行分类;
将所述训练数据输入至目标神经网络模型进行计算和特征提取以得到输出预测值和所述输出预测值的标记类别;
根据同一标记类别的所述输出真实值和输出预测值得到所述目标神经网络模型的训练误差;
根据所述训练误差对所述目标神经网络模型进行优化。
2.根据权利要求1所述的方法,其特征在于,所述根据同一标记类别的所述输出真实值和输出预测值得到所述目标神经网络模型的训练误差包括:
分别获取不同标记类别的输出预测值的平均值作为第一输出预测值;
获取所述第一输出预测值的对数值作为第二输出预测值;
获取同一标记类别的所述第二输出预测值和输出真实值的乘积作为第三输出预测值;
获取所述第三输出预测值的平均值作为所述目标神经网络模型的训练误差。
3.根据权利要求1所述的方法,其特征在于,所述根据所述训练误差对所述目标神经网络模型进行优化包括:
根据所述训练误差对所述目标神经网络模型的参数权重进行调整以得到优化神经网络模型。
4.根据权利要求3所述的方法,其特征在于,所述根据所述训练误差对所述目标神经网络模型的参数权重进行调整以得到优化神经网络模型之后包括:
根据预设标准对所述优化神经网络模型进行评价。
5.根据权利要求1所述的方法,其特征在于,所述目标神经网络模型通过三层全连接层进行特征提取。
6.根据权利要求5所述的方法,其特征在于,每层所述全连接层包括10个神经元。
7.根据权利要求1所述的方法,其特征在于,所述目标神经网络模型可以为基于前向神经网络、卷积神经网络、玻尔兹曼机网络、深度置信网络、自动编码器网络、循环神经网络、Bert模型网络、生成式对抗网络或多层感知器网络的神经网络模型。
8.一种神经网络模型优化装置,其特征在于,包括:
输出分类模块,用于基于预设标记类别对训练数据的输出真实值进行分类;
模型训练模块,用于将所述训练数据输入至目标神经网络模型进行计算和特征提取以得到输出预测值和所述输出预测值的标记类别;
误差获取模块,用于根据同一标记类别的所述输出真实值和输出预测值得到所述目标神经网络模型的训练误差;
模型优化模块,用于根据所述训练误差对所述目标神经网络模型进行优化。
9.一种计算机设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法中的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法中的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南方科技大学,未经南方科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010590567.4/1.html,转载请声明来源钻瓜专利网。





