[发明专利]基于分解和剪枝的卷积神经网络压缩方法、系统、装置在审
| 申请号: | 201911029615.6 | 申请日: | 2019-10-28 |
| 公开(公告)号: | CN110782019A | 公开(公告)日: | 2020-02-11 |
| 发明(设计)人: | 胡卫明;刘雨帆;阮晓峰;李兵;原春锋;潘健 | 申请(专利权)人: | 中国科学院自动化研究所 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04 |
| 代理公司: | 11576 北京市恒有知识产权代理事务所(普通合伙) | 代理人: | 郭文浩;尹文会 |
| 地址: | 100190 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 剪枝 稀疏 系数矩阵 表示层 卷积神经网络 压缩 结构化 低秩 分解 滤波器 近似 稀疏处理 卷积 人工智能领域 方法融合 分解算法 | ||
1.一种基于分解和剪枝的卷积神经网络压缩方法,其特征在于,该方法包括以下步骤:
步骤S100,获取待压缩的卷积神经网络,将所述卷积神经网络中每个待压缩的卷积层后面添加一层系数矩阵表示层,作为第一网络;
步骤S200,通过低秩近似分解算法分别对各所述系数矩阵表示层进行稀疏处理,并根据所述系数矩阵表示层稀疏的位置对对应的卷积层的滤波器进行剪枝处理,得到第二网络;
步骤S300,采用结构化稀疏剪枝方法分别对所述第二网络的各系数矩阵表示层进行稀疏处理,并根据所述系数矩阵表示层稀疏的位置对所述系数矩阵表示层的滤波器进行剪枝处理,得到第三网络;
步骤S400,对所述第三网络进行训练,将训练完成的网络作为压缩后的卷积神经网络。
2.根据权利要求1所述的基于分解和剪枝的卷积神经网络压缩方法,其特征在于,所述系数矩阵表示层为卷积核1×1的卷积层,其输入和输出通道数目都与对应的卷积层输出通道数目相同。
3.根据权利要求1所述的基于分解和剪枝的卷积神经网络压缩方法,其特征在于,步骤S200中“通过低秩近似分解算法分别对各所述系数矩阵表示层进行稀疏处理”,其方法为:
将各所述系数矩阵表示层的权重参数分别进行张量展开,得到各所述系数矩阵表示层对应的二维矩阵;
基于L21范数对各所述二维矩阵进行正则化,得到正则项;
将各正则项加入到所述卷积神经网络的损失函数,进行权重参数的更新。
4.根据权利要求3所述的基于分解和剪枝的卷积神经网络压缩方法,其特征在于,“将各正则项加入到所述卷积神经网络的损失函数,进行权重参数的更新”,其方法为:将各正则项加入到所述卷积神经网络的损失函数,通过二次近似算法和迭代阈值收敛算法对权重参数进行更新。
5.根据权利要求3所述的基于分解和剪枝的卷积神经网络压缩方法,其特征在于,步骤S200中“根据所述系数矩阵表示层稀疏的位置对对应的卷积层的滤波器进行剪枝处理”,其方法为:所述系数矩阵表示层稀疏的位置为基于L21范数对各所述二维矩阵进行正则化后列L2范数为0对应的索引值。
6.根据权利要求3所述的基于分解和剪枝的卷积神经网络压缩方法,其特征在于,步骤S300中“采用结构化稀疏剪枝方法分别对所述第二网络的各系数矩阵表示层进行稀疏处理”,其方法为:
将各所述系数矩阵表示层的权重参数张量展开得到的二维矩阵进行转置,得到转置二维矩阵;
基于L21范数对各所述转置二维矩阵进行正则化,得到正则项;
将各正则项加入到所述卷积神经网络的损失函数,进行权重参数的更新。
7.根据权利要求6所述的基于分解和剪枝的卷积神经网络压缩方法,其特征在于,步骤S300中“根据所述系数矩阵表示层稀疏的位置对所述系数矩阵表示层的滤波器进行剪枝处理”,其方法为:所述系数矩阵表示层稀疏的位置为基于L21范数对各所述转置二维矩阵进行正则化后行L2范数为0对应的索引值。
8.一种基于分解和剪枝的卷积神经网络压缩系统,其特征在于,该系统包括获取添加模块、低秩近似分解模块、结构化稀疏模块、训练输出模块;
所述获取添加模块,配置为获取待压缩的卷积神经网络,将所述卷积神经网络中每个待压缩的卷积层后面添加一层系数矩阵表示层,作为第一网络;
所述低秩近似分解模块,配置为通过低秩近似分解算法分别对各所述系数矩阵表示层进行稀疏处理,并根据所述系数矩阵表示层稀疏的位置对对应的卷积层的滤波器进行剪枝处理,得到第二网络;
所述结构化稀疏模块,配置为采用结构化稀疏剪枝方法分别对所述第二网络的各系数矩阵表示层进行稀疏处理,并根据所述系数矩阵表示层稀疏的位置对所述系数矩阵表示层的滤波器进行剪枝处理,得到第三网络;
所述训练输出模块,配置为对所述第三网络进行训练,将训练完成的网络作为压缩后的卷积神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911029615.6/1.html,转载请声明来源钻瓜专利网。





