[发明专利]一种基于熵重要性准则模型的卷积核裁剪方法有效

专利信息
申请号: 201910400922.4 申请日: 2019-05-15
公开(公告)号: CN110119811B 公开(公告)日: 2021-07-27
发明(设计)人: 闵锐;蒋霆 申请(专利权)人: 电科瑞达(成都)科技有限公司
主分类号: G06N3/08 分类号: G06N3/08;G06N3/04
代理公司: 成都点睛专利代理事务所(普通合伙) 51232 代理人: 孙一峰
地址: 610041 四川省*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明属于神经网络技术领域,涉及一种基于熵重要性准则模型的卷积核裁剪方法。本发明为了让参数量大、计算量大且性能优越的卷积神经网络模型能够满足在现实应用中的实时性要求,提出了一种基于熵重要性准则模型卷积核裁剪方法,通过对每个卷积层的激活通道求图像熵的方式作为评估对应卷积核重要性的准则来裁剪信息量少的卷积核,从而得到了一个性能优异、参数量以及计算量少的小模型,该小模型不仅有性能优势且能够满足现实场景应用的实时性以及精度需求。
搜索关键词: 一种 基于 重要性 准则 模型 卷积 裁剪 方法
【主权项】:
1.一种基于熵重要性准则模型的卷积核裁剪方法,其特征在于,包括以下步骤:S1、获取训练样本:采集原始的光学图像数据,并进行数据归一化以及数据增强处理,获得训练样本;S2、构建卷积神经网络模型:构建一个由卷积滤波器与池化滤波器级联而成的卷积神经网络,卷积滤波器用于对输入数据进行特征提取,卷积滤波器的数量表示提取的特征的数量;池化滤波器用于对输入数据进行降维;S3、卷积神经网络模型训练:S31、参数初始化,包括学习率α、总的裁剪次数为n,每次裁剪后对当前模型微调训练迭代次数为m,Mini‑batch大小M,阈值T1,T2,T3,T4,信息熵公式中将一幅图像分成的局部区域个数为K,全局裁剪时每次迭代裁剪的卷积核个数为X,逐层裁剪时每次迭代裁剪的卷积核个数x,采用随机梯度优化算法SGD作为优化函数;S32、每次从训练样本中随机抽取包含M个样本的Mini‑batch作为训练数据进行训练;并基于熵重要性准则模型进行卷积核裁剪操作,具体裁剪方式如下:采用图像熵的评价准则作为熵重要性准则模型,在卷积神经网络模型训练的过程中,对每一卷积层的激活通道计算图像熵,对每一个卷积层的每个通道编号,将所有卷积层的激活通道汇总,根据图像熵的值计算排序;所述图像熵的大小用于反映一幅图像中平均信息量的多少,图像熵的表达式为:其中K表示对一幅图像分为几个部分,K的选择对整体性能会产生影响;pn表示每个部分中的像素个数占比整个图像所得到的概率;卷积核裁剪的方法是:在模型的第i层卷积层,定义Ii∈RN×C×H×W为输入张量,其中N为一个数据Batch的大小,C为输入的激活通道的维度,H,W为输入的宽高维度,定义Oi∈RN×D×H×W为输出张量,其中D为输出的激活通道的维度,定义wi=RN×C×B×B为卷积的参数矩阵,B为当前层卷积核的大小,卷积核裁剪目标为裁剪掉卷积核ωi;因卷积核是与单个的激活通道一一对应,将图像熵的值用于评估对应卷积核的重要性,在每次裁剪时,裁剪整个模型中X个熵值小的卷积核作为本次裁剪结果,随着裁剪次数增加,被裁剪掉的卷积核个数将增加,X的值根据整个模型的卷积核个数来设定,是一个超参数,设定大小对裁剪结果会产生影响;S33、每次裁剪后,继续微调训练m次,然后对当前的模型在测试集上进行测试,随着模型卷积核被裁剪,模型在测试集上的正确率将逐渐降低,每次测试的正确率都同设定的正确率的最低阈值T1进行比较,如果当前在测试集上的正确率小于等于T1,或者裁剪后的模型剩下的卷积核个数已经达到所设定的最少卷积核个数阈值T2,进入步骤S34;如果高于T1以及T2且没有达到最大裁剪次数n,那么回到步骤S32,继续训练;S34、对前序步骤中通过全局裁剪方式得到的模型,继续对该模型的每层卷积层进行逐层裁剪,具体方式为:从该模型的第一层卷积层开始遍历,设当前遍历的卷积层为i,计算i层当前剩下的激活通道的图像熵值,根据该图像熵值对该层所对应的卷积核进行排序,按照排序结果裁剪掉图像熵值小的x个卷积核;裁剪后,继续微调训练m次,然后对当前的模型在测试集上进行测试,随着模型单层卷积核继续被裁剪,模型在测试集上的正确率将逐渐降低,每次测试的正确率都同设定的正确率的最低阈值T3进行比较,如果当前在测试集上的正确率小于等于T3,或者裁剪后的模型剩下的卷积核个数已经达到所设定的最少卷积核个数阈值T4,那么遍历下一层卷积层,直到遍历完该模型的所有卷积层,否则,继续对当前层i进行裁剪。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电科瑞达(成都)科技有限公司,未经电科瑞达(成都)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910400922.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top