[发明专利]一种基于线性无关的结构化剪枝方法在审
申请号: | 202110877016.0 | 申请日: | 2021-07-31 |
公开(公告)号: | CN113516241A | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 曹俊亮;卢康;杨赟;任鹏飞;杨彧;张龙涛;孙光泽;王刚;丁军峰;刘伟;刘慷;康媛 | 申请(专利权)人: | 西安烽火软件科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 陆志斌 |
地址: | 710065 陕西省西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 线性 无关 结构 剪枝 方法 | ||
1.一种基于线性无关的结构化剪枝方法,其特征在于,所述方法具体包含以下步骤:
步骤一、根据不同的计算机视觉任务,在数据集上训练一个深度网络模型;
步骤二、计算某个卷积层卷积核之间的冗余性,并对每个卷积层的卷积核进行FM变换,对变换后的矩阵计算极大线性无关组;
步骤三、对剪枝网络所有的卷积层重复步骤二,计算每个卷积层的极大线性无关组,得到剪枝之后的模型;
步骤四、使用训练数据对步骤三生成的剪枝之后的模型进行微调训练,获得剪枝之后模型的权重。
2.如权利要求1所述的一种基于线性无关的结构化剪枝方法,其特征在于,所述方法还包括:
步骤五、在验证集上对剪枝前后模型的性能进行验证。
3.如权利要求1或2所述的一种基于线性无关的结构化剪枝方法,其特征在于,步骤二中,所述FM变换的具体过程为:
设定某个卷积层表示为:
其中,Oi为第i层卷积层,n为该层卷积层中的第n个通道卷积核;
Cout表示该卷积层卷积核个数,则每个卷积核的尺寸表示为:
Cin×K×K;
其中,K为卷积核的Kernel size,Cin为该卷积核的通道个数;
将该卷积层每个卷积核拉伸为一维向量,则拉伸之后的向量尺寸为:
1×Cin×K×K;
将多个卷积核的向量合并为矩阵,则该矩阵的尺寸为:
Cout×(Cin×K×K)。
4.如权利要求3所述的一种基于线性无关的结构化剪枝方法,其特征在于,步骤二中,所述对变换后的矩阵计算极大线性无关组的具体过程为:
对经过FM变换后的卷积层的矩阵进行行列式变换,其中,行向量全为零为线性相关的向量,该向量所对应的卷积核为需要做剪枝的卷积核;
线性无关的向量表示为:
线性相关的向量表示为:
式中,m为线性相关的向量个数,n为线性无关的向量个数;
根据极大线性无关组的性质,线性相关的向量被线性无关的向量线性表示,即:
Ws=A*Wp; (1)
A={α1,α2,α3…αm},αk∈R1×n,k∈{1,2,…m}; (2)
其中,式(2)中k为线性相关的向量组索引,因此,Wsk=αk*Wp,则第k个线性相关的向量等于相关系数矩阵第k行和线性无关向量组乘积求和的结果:
即:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安烽火软件科技有限公司,未经西安烽火软件科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110877016.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语言教学系统及方法
- 下一篇:一种车载双膜陶瓷净化水系统