[发明专利]一种网络模型结构缩放方法、装置、电子设备及存储介质在审
申请号: | 202011414664.4 | 申请日: | 2020-12-04 |
公开(公告)号: | CN112527500A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 张潇澜;于彤;李峰;周镇镇;刘宏刚 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06N3/04 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 徐彦圣 |
地址: | 215000 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 模型 结构 缩放 方法 装置 电子设备 存储 介质 | ||
本发明提供了一种网络模型结构缩放方法、装置、电子设备及存储介质,属于网络模型的技术领域,缓解了现有技术中存在的网络模型结构缩放精度较低、难度较大的技术问题。方法包括以下步骤:获取缩放模型的资源约束值;根据所述资源约束值计算资源约束参数;根据所述资源约束参数计算缩放参数;根据所述缩放参数计算缩放系数;根据所述缩放系数计算缩放模型M0。
技术领域
本发明涉及网络模型的技术领域,尤其是涉及一种网络模型结构缩放方法、装置、电子设备及存储介质。
背景技术
随着物联网的快速发展,终端及移动端设备对智能的要求变得越来越高。边缘端的应用程序要求产生更快的网络服务响应,以满足物联网在实时业务、应用智能、安全与隐私保护等方面的需求。模型在边缘端部署的时候,规模和精度是同时需要考虑的因素。深度学习生成模型规模往往较大,无法直接应用在边缘端设备,因此模型缩放技术应运而生。由于模型结构的可理解性尚未解决,如何对模型进行缩放,目前并没有充足的理论依据,只能依靠实验分析。现有工作可以分为两个方面。一方面,尝试从单一维度去对模型规模进行压缩,比如深度,宽度和图片的分辨率等方面,这个工作较为简单,但是缩放后的模型容易变形,无法保证精度。另一方面,多维度的混合缩放技术,操作难度较大,增加大量人工成本。现有工作都没有考虑边缘端部署的资源需求,无法在给定资源的前提下找到最优的模型缩放解决方案。
发明内容
本发明的目的在于提供一种网络模型结构缩放方法、装置、电子设备及存储介质,缓解了现有技术中存在的网络模型结构缩放精度较低、难度较大的技术问题。
第一方面,本发明提供的网络模型结构缩放方法,包括以下步骤:
获取缩放模型的资源约束值;
根据所述资源约束值计算资源约束参数;
根据所述资源约束参数计算缩放参数;
根据所述缩放参数计算缩放系数;
根据所述缩放系数计算缩放模型。
进一步的,所述获取模型的资源约束值的步骤之前,还包括:
获取原始模型。
进一步的,根据所述资源约束值计算资源约束参数的步骤,具体包括:
根据以下算式计算资源约束参数;
Min(H(Φ)=(2ΦFlops(M)-F)2);
Flops(M)表示原始模型M的资源约束值,F表示用户输入的资源约束值,Φ表示资源约束参数。
进一步的,所述根据所述资源约束参数计算缩放参数的步骤,具体包括:
所述缩放参数包括α,β,γ
设置1≤α≤2,1≤β≤1.5,1≤γ≤1.5,第一搜索步长0.05;
根据预设约束条件,通过网格搜索算法获取多组缩放参数α,β,γ;
根据多组缩放参数α,β,γ计算多组缩放系数;
根据多组缩放系数计算多个缩放模型;
计算每个缩放模型的精度;
获取精度值最大的缩放模型Mi对应的缩放参数αi,βi,γi。
进一步的,所述根据缩放模型的精度获取精度值最大的缩放模型对应的缩放参数αi,βi,γi的步骤之后,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011414664.4/2.html,转载请声明来源钻瓜专利网。