[发明专利]基于维度拆分的图像压缩方法有效

申请号：	202110562209.7	申请日：	2021-05-24
公开（公告）号：	CN113411583B	公开（公告）日：	2022-09-02
发明（设计）人：	王琦;尹泽平;李学龙	申请（专利权）人：	西北工业大学
主分类号：	H04N19/149	分类号：	H04N19/149;H04N19/42;G06N3/04;G06N3/08;G06T7/11
代理公司：	西安凯多思知识产权代理事务所(普通合伙) 61290	代理人：	王鲜凯
地址：	710072 ***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于维度拆分图像压缩方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供了一种基于维度拆分的图像压缩方法。首先，利用通道拆分器对输入图像数据矩阵进行自适应通道拆分，分别得到包含信息较多的有效通道数据和包含信息较少冗余通道数据；然后，对有效通道数据分别进行分组卷积和点卷积，对冗余通道数据进行单个卷积层的简单卷积，分别得到相应通道的最终输出结果；最后，依据不同通道输出结果的重要性进行数据融合，得到压缩结果。本发明方法能够在保证任务精度的情况下选择信息最丰富、判别特征最明显的数据组合，有效地降低算法复杂度，实现轻量、快速的图像压缩。

技术领域

本发明属数据压缩技术领域，具体涉及一种基于维度拆分的图像压缩方法。

背景技术

随着图像处理单元(GPU)和张量处理单元(TPU)的发展，深度神经网络算法在许多领域取得了出色的表现，包括但不限于模式识别、目标检测、自然语言处理、语言信号处理和机器人控制等。这些成功多依赖于更大更深的神经网络模型。这些强大的模型也伴随着延迟、存储、算力和能耗等方面的巨大开销，在资源有限的移动设备和嵌入式设备上难以部署，难以实现离线智能。如K.Simonyan等人在“K.Simonyan,and A.Zisserman.Very DeepConvolutional Networks for Large-Scale Image Recognition,2015,ICLR”中提出的VGG(Visual Geometry Group)模型。这种模型占用超过500MB的存储空间，1.4×10⁸个参数，大约1000ms的性能延迟。这使得深度学习模型难以应用在有限硬件水平下进行快速而精确的反应，难以适应如自动驾驶、无人机目标追踪等领域的要求。与此同时，智能手机、智能汽车、智能手表等边缘智能设备的数量逐年增加，体积大、计算成本高的模型难以适应于嵌入式设备。因此，利用模型压缩技术，减少深度神经网络参数和降低计算复杂度有助于将深度学习算法的落地与应用。

现有的基于剪枝的模型压缩算法，如S.Han等人在“S.Han,J.Pool,J.Tran,andW.Dally.Learning both Weights and Connections for Efficient NeuralNetworks.In Advances in Neural Information Processing Systems,2015,pp.1135-1143.”提出的基于参数大小的剪枝算法只将不重要的参数置零，并没有减少矩阵尺寸与计算复杂度，实际加速效果不明显。此外这种基于剪枝的方法需要针对特定的网络结构进行微调，训练过程复杂。

基于稀疏矩阵分解的模型压缩算法有B.Liu等人在“B.Liu,M.Wang,and H,Foroosh.Sparse Convolutional Neural Networks.In Proceedings of the IEEEComputer Society Conference on Computer Vision and Pattern Recognition,2015,pp.806-814.”提出的将大型参数矩阵分解为小型矩阵的低秩矩阵分解法。这种方法在实际部署时需要特别设计底层硬件结构，难以广泛应用。

发明内容

为了克服现有技术的不足，本发明提供一种基于维度拆分的图像压缩方法。首先，利用通道拆分器对输入图像数据矩阵进行自适应通道拆分，分别得到包含信息较多的有效通道数据和包含信息较少冗余通道数据；然后，对有效通道数据分别进行分组卷积和点卷积，对冗余通道数据进行单个卷积层的简单卷积，分别得到相应通道的最终输出结果；最后，依据不同通道输出结果的重要性进行数据融合，得到压缩结果。本发明方法能够在保证任务精度的情况下选择信息最丰富、判别特征最明显的数据组合，有效地降低算法复杂度，并减少现有高性能神经网络对硬件计算能力、存储能力的依赖，解决神经网络在小型平台上高延迟的问题，实现轻量、快速的图像数据压缩。

一种基于维度拆分的图像压缩方法，其特征在于步骤如下：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西北工业大学，未经西北工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110562209.7/2.html，转载请声明来源钻瓜专利网。

上一篇：一种从沙棘籽粕中提取沙棘籽蛋白的方法
下一篇：一种具有自扩张密封结构的磁流变液缓速器

同类专利

专利分类

H 电学

H04 电通信技术
H04N 图像通信，如电视

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于维度拆分的图像压缩方法有效

专利文献下载