[发明专利]一种基于类别的滤波器剪枝方法在审
申请号: | 202111113265.9 | 申请日: | 2021-09-18 |
公开(公告)号: | CN113850373A | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 褚晶辉;李梦;吕卫 | 申请(专利权)人: | 天津大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 类别 滤波器 剪枝 方法 | ||
本发明涉及一种基于类别的滤波器剪枝方法,包括:基于原始VGG‑16进行重新搭建,加入激活值生成模块,得到新的网络模型,其中激活值生成模块由一个平均池化层和两个全连接层组成;训练加入激活值生成模块的网络模型,使模型在测试集上的测试准确率达到最高,获得最优模型;再次把训练集输入最优模型,利用激活值生成模块和输入图片,得到每个滤波器的激活值;计算所有通道重要性剪枝部分的滤波器的激活值方差,根据各个方差的大小,选择需要保留的滤波器,即得到深层网络的剪枝结果;得到全局的不同层的剪枝结果,计算每一层剪枝之后剩余的通道数,改变原始网络每一层通道数,将裁剪后的原始网络使用数据集重新训练,恢复精度。
技术领域
本发明涉及图像处理中模型轻量化领域,特别适用于计算资源较少的平台。
背景技术
图像分类与检测是计算机视觉与机器学习领域非常活跃的研究方向。图像分类与检测在很多领域得到广泛应用,包括人脸识别、垃圾分类、行为识别等。可以说,物体分类与检测已经应用于人们日常生活的方方面面。
在深度学习网络中,随着网络深度的加深,现有的卷积神经网络如VGG[1]、ResNet[2]、GoogleNet[3]、DenseNet[4]等复杂模型的计算量和参数量所带来的高额存储空间和计算资源消耗等问题导致模型不能直接部署在便携型设备上。因此,以去除参数、减少计算量、同时保持高精度为目标的模型压缩已成为一个热门的研究领域。近年来出现了很多模型压缩方法,大致可以分为四类:网络剪枝[5]、知识蒸馏[6]、矩阵分解[7]和轻量化设计[8]。
其中网络剪枝是对网络结构中不重要的一部分剪枝或者稀疏化,现有的剪枝算法分为结构化剪枝和非结构化剪枝。结构化剪枝是指去掉某些被判定为不重要的滤波器或者某些被判定为不重要的层。非结构化剪枝的本质是将滤波器的某些权重进行删除,同时使用迭代训练对剪枝带来的损失进行逐步调整。知识蒸馏是让简单网络的输出拟合训练好的复杂网络的输出,简单网络作为学生网络,复杂网络作为教师网络。因为教师网络提取出的知识包括预测结果中数据结构间的相似性以及更精确的特征,学生网络可以直接从教师网络中提取知识,而不是直接去学习真实标签。矩阵分解主要是利用神经网络中的冗余对权重矩阵进行降维,即将模型中的卷积和全连接层参数矩阵分解为多个小矩阵乘积的形式,这样可以大大降低模型的体积。轻量化设计则旨在设计更加精简有效的网络。大致分为两大方向:轻量化卷积结构和网络结构搜索。轻量化卷积结构中出现了SqueezeNet[8],MobileNet[9],ShffleNet[10]等轻量级网络系列。其中MobileNet将普通卷积操作分成深度卷积结构和逐点卷积结构两部分。简单来说就是把原始卷积层分成两层。第一层为深度卷积,对每个输入滤波器使用单滤波器的轻量级滤波器;第二层为逐点卷积,即尺寸为1×1的卷积,用来计算输入滤波器的线性组合。经过这样的拆分,可以将参数量变为原来的九分之一。NAS(Neural Architecture Search)[11]神经网络结构搜索与传统的网络模型的不同之处在于,传统网络层及参数均为人工设计,往往导致设计出的模型并非最优。NAS则通过搜索方法寻找最优的神经网络架构,但目前使用神经网络结构搜索需要很大的硬件和时间消耗,NAS还有待发展。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111113265.9/2.html,转载请声明来源钻瓜专利网。