[发明专利]一种模型优化方法、装置、设备及可读存储介质在审
| 申请号: | 202010945736.1 | 申请日: | 2020-09-10 |
| 公开(公告)号: | CN114169490A | 公开(公告)日: | 2022-03-11 |
| 发明(设计)人: | 马文婷;张志鹏;徐青青 | 申请(专利权)人: | 中国移动通信有限公司研究院;中国移动通信集团有限公司 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
| 代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;黄灿 |
| 地址: | 100053 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 模型 优化 方法 装置 设备 可读 存储 介质 | ||
本发明提供一种模型优化方法、装置、设备及可读存储介质,涉及深度学习技术领域,该模型优化方法包括确定M个网络模型;基于待分析数据集确定所述M个网络模型的描述长度;从所述M个网络模型中确定描述长度最小的目标网络模型作为优化的网络模型,基于所述优化的网络模型进行数据处理。这样,解决了现有的深度学习网络模型的优化程度较弱,不能有效降低深度学习网络模型的复杂度的问题。
技术领域
本发明涉及深度学习技术领域,尤其涉及一种模型优化方法、装置、设备及可读存储介质。
背景技术
随着网络技术的飞速发展,深度学习网络模型的应用越来越广泛,深度学习网络模型也越来越复杂。过于复杂的网络模型在应用中,需要的训练数据、计算资源和存储资源较多,还容易发生过拟合的问题。目前,多采用在迁移学习的基础上进行网络剪枝来进行模型优化,网络剪枝是从网络的宽度上进行压缩而达到模型优化的目的,这样,首先就从网络的宽度上进行优化,深度学习网络模型的优化程度较弱,不能有效降低深度学习网络模型的复杂度。
发明内容
本发明实施例提供一种模型优化方法、装置、设备及可读存储介质,以解决现有的深度学习网络模型的优化程度较弱,不能有效降低深度学习网络模型的复杂度的问题。
为解决上述技术问题,本发明是这样实现的:
第一方面,本发明实施例提供了一种模型优化方法,包括:
确定M个网络模型;
基于待分析数据集确定所述M个网络模型的描述长度;
从所述M个网络模型中确定描述长度最小的目标网络模型作为优化的网络模型;
基于所述优化的网络模型进行数据处理。
第二方面,本发明实施例提供了一种模型优化装置,包括:
第一确定模块,用于确定M个网络模型;
第二确定模块,用于基于待分析数据集确定所述M个网络模型的描述长度;
优化模块,用于从所述M个网络模型中确定描述长度最小的目标网络模型作为优化的网络模型;
处理模块,用于基于所述优化的网络模型进行数据处理。
第三方面,本发明实施例提供了一种电子设备,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的模型优化方法的步骤。
第四方面,本发明实施例提供一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的模型优化方法的步骤。
本发明实施例中,确定了M个网络模型,并确定描述长度最小的目标网络模型作为优化的网络模型,并进一步基于优化的网络模型进行数据处理,这样,可以平衡网络模型的精度和复杂度,提高网络模型的优化程度,能在保证网络模型的计算精度的情况下有效降低深度学习网络模型的复杂度,提高数据处理的精度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的模型优化方法的流程图;
图2是本发明实施例提供的待分析图片示意图;
图3是本发明实施例提供的优化卷积层时的似然度和复杂度的计算结果示意图;
图4是本发明实施例提供的优化全连接层时的似然度和复杂度的计算结果示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信有限公司研究院;中国移动通信集团有限公司,未经中国移动通信有限公司研究院;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010945736.1/2.html,转载请声明来源钻瓜专利网。





