[发明专利]模型压缩方法及装置在审
申请号: | 202110673860.1 | 申请日: | 2021-06-17 |
公开(公告)号: | CN113408724A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 孙强;陈瑞侠;孙强;刘恩甫;刘胜 | 申请(专利权)人: | 博众精工科技股份有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06K9/62 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 215200 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 压缩 方法 装置 | ||
本发明实施例公开了一种模型压缩方法及装置,该方法包括:获取待压缩网络模型以及目标压缩比;根据所述目标压缩比确定节点压缩方式,并且基于所述节点压缩方式以及所述目标压缩比对所述待压缩网络模型进行压缩,得到待赋值网络模型;根据所述待压缩网络模型以及所述待赋值网络模型,确定与所述待赋值网络模型中各待赋值节点对应的权重值;基于各权重值以及所述待赋值网络模型,确定目标压缩网络模型。通过本发明实施例的技术方案,实现了对深度学习模型的压缩,节约模型占用资源的技术效果。
技术领域
本发明实施例涉及数据处理技术,尤其涉及一种模型压缩方法及装置。
背景技术
随着深度学习的普及,在计算机视觉,语音识别,自然语言处理等领域中各种深度学习模型都得到了广泛的应用。
但是,由于深度学习模型的网络规模越来越大,模型越来越复杂,深度学习模型的存储就会占用较大的空间,在进行运算时,耗费的计算资源过大,时间过长。并且,移植和部署这些深度学习模型时也会存在速度过慢,甚至无法移植和部署的情况。
目前,模型压缩往往存在定制化的现象,没有一个统一的通用化的压缩算法,可以覆盖视觉,语音,编码器等诸多领域,使算法开发和模型压缩互不干扰。
发明内容
本发明实施例提供了一种模型压缩方法及装置,以实现对深度学习模型的压缩,节约模型占用资源的技术效果。
第一方面,本发明实施例提供了一种模型压缩方法,该方法包括:
获取待压缩网络模型以及目标压缩比;
根据所述目标压缩比确定节点压缩方式,并且基于所述节点压缩方式以及所述目标压缩比对所述待压缩网络模型进行压缩,得到待赋值网络模型;
根据所述待压缩网络模型以及所述待赋值网络模型,确定与所述待赋值网络模型中各待赋值节点对应的权重值;
基于各权重值以及所述待赋值网络模型,确定目标压缩网络模型。
第二方面,本发明实施例还提供了一种模型压缩装置,该装置包括:
待压缩网络模型模型获取模块,用于获取待压缩网络模型以及目标压缩比;
待赋值网络模型确定模块,用于根据所述目标压缩比确定节点压缩方式,并且基于所述节点压缩方式以及所述目标压缩比对所述待压缩网络模型进行压缩,得到待赋值网络模型;
权重值确定模块,用于根据所述待压缩网络模型以及所述待赋值网络模型,确定与所述待赋值网络模型中各待赋值节点对应的权重值;
目标压缩网络模型确定模块,用于基于各权重值以及所述待赋值网络模型,确定目标压缩网络模型。
第三方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例任一所述的模型压缩方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例任一所述的模型压缩方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于博众精工科技股份有限公司,未经博众精工科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110673860.1/2.html,转载请声明来源钻瓜专利网。