[发明专利]卷积神经网络模型压缩方法和装置、存储介质及电子装置有效
申请号: | 201910251951.9 | 申请日: | 2019-03-29 |
公开(公告)号: | CN110033083B | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 金坤;李峰;赵世杰;左小祥 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06N3/0464 | 分类号: | G06N3/0464;G06N3/082 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周婷婷 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积 神经网络 模型 压缩 方法 装置 存储 介质 电子 | ||
1.一种卷积神经网络模型的压缩方法,其特征在于,包括:
将卷积神经网络模型中的第一批量标准化层的参数合并到所述卷积神经网络模型中的第一卷积层中,生成包含有第一目标卷积层的第一目标神经网络模型,其中,所述卷积神经网络模型与所述第一目标神经网络模型对于相同的输入具有相同的输出,所述第一批量标准化层为在所述卷积神经网络模型中位于所述第一卷积层之后、且与所述第一卷积层连接的批量标准化层;
将所述第一目标神经网络模型中的所述第一目标卷积层中范数小于第一阈值的卷积核删除,得到第二目标神经网络模型,其中,所述第二目标神经网络模型的内存占用率小于所述第一目标神经网络模型的内存占用率;
对所述第二目标神经网络模型进行压缩,得到第三目标神经网络模型;
获取人物面部图像;
将所述人物面部图像输入到所述第三目标神经网络模型中;
获取所述第三目标神经网络模型输出的结果,其中,所述输出的结果为所述人物面部图像对应的人物的年龄。
2.根据权利要求1所述的方法,其特征在于,
所述得到第二目标神经网络模型之前,所述方法还包括:确定所述第一目标卷积层中每一组卷积核的P-范数,其中,P等于0或P等于1或P等于2或P等于正无穷;
所述将所述第一目标神经网络模型中的所述第一目标卷积层中范数小于第一阈值的卷积核删除包括:
设定每一组卷积核的剪枝率;
将每一组卷积核的p-范数按照从大到小的顺序进行排列;
删除所述每一组卷积核的P-范数中小于所述第一阈值的P-范数对应的目标组卷积核,直到满足所述剪枝率的要求,得到所述第二目标神经网络模型,其中,所述第二目标神经网络模型中所有卷积核的数量与所述第一目标神经网络模型中所有卷积核的数量的比值小于预定阈值。
3.根据权利要求2所述的方法,其特征在于,所述删除所述每一组卷积核的P-范数中,小于所述第一阈值的P-范数对应的目标组卷积核包括:将所述P-范数小于所述第一阈值的目标组卷积核的权重设置为0。
4.根据权利要求1至3中任一项所述的方法,其特征在于,在将所述卷积神经网络模型中的所述第一批量标准化层的参数合并到所述卷积神经网络模型中的所述第一卷积层中之前,还包括:
在所述卷积神经网络模型包含卷积层形成的跨层连接分支和/或多层串连分支的情况下,将所述卷积神经网络模型中除每个分支上的最后一个卷积层之外的卷积层作为所述第一卷积层。
5.根据权利要求1至3中任意一项所述的方法,其特征在于,将卷积神经网络模型中的第一批量标准化层的参数合并到所述卷积神经网络模型中的第一卷积层中包括:
根据所述第一卷积层的与所述第一卷积层的第i个输出特征图对应的N个卷积核、所述第一批量标准化层的与所述第一卷积层的第i个输出特征图对应的参数,计算得到所述第一目标卷积层的对应于所述第i个输出特征图的N个卷积核;
根据所述第一卷积层的与所述第一卷积层的第i个输出特征图对应的偏置、所述第一批量标准化层的与所述第一卷积层的第i个输出特征图对应的参数,计算得到所述第一目标卷积层的对应于所述第i个输出特征图的偏置;
根据所述第一卷积层的N个输入特征图与所述第一目标卷积层的对应于第i个输出特征图的N个卷积核之间的卷积和,以及,所述第一目标卷积层的对应于所述第i个输出特征图的偏置,确定出所述第一目标卷积层的第i个输出特征图,
其中,N为所述第一卷积层的输入特征图的个数,1≤i≤M,M为所述第一目标卷积层的输出特征图的个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910251951.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种识别AI设备中深度学习模型的方法
- 下一篇:突触系统与突触方法