[发明专利]一种深度语义感知与BPG压缩工具的图像压缩方法在审
申请号: | 201911404225.2 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111145277A | 公开(公告)日: | 2020-05-12 |
发明(设计)人: | 吴振东;李锐;金长新 | 申请(专利权)人: | 山东浪潮人工智能研究院有限公司 |
主分类号: | G06T9/00 | 分类号: | G06T9/00;G06N3/04 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 罗文曌 |
地址: | 250100 山东省济南市高新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 语义 感知 bpg 压缩工具 图像 压缩 方法 | ||
本发明涉及图像压缩技术领域,具体提供了一种深度语义感知与BPG压缩工具的图像压缩方法。与现有技术相比,本发明的一种深度语义感知与BPG压缩工具的图像压缩方法,分为以下步骤:编码过程S101、原输入图像;S102、利用CNN卷积神经网络对图像处理和分类,输出特征图,通过CAM方法得到语义显著图;S103、将语义显著图划分为等级不同的注意力区域;S104、利用BPG压缩工具对上述不同注意力区域进行不同压缩率的压缩,生产多个.bpg中间文件。利用CAM良好的图像分类能力和计算边界框能力,提升图像压缩速度、压缩率,具有良好的推广价值。
技术领域
本发明涉及图像压缩技术领域,具体提供一种深度语义感知与BPG压缩工具的图像压缩方法。
背景技术
BPG是一种新型的图片格式,其设计初衷在于图片质量或文件大小成为瓶颈时,取代JPEG。这种压缩工具具备高压缩比,在质量类似的情况下,压缩后的图片文件比JPEG小很多。对于相同大小的图片,BPG的存储质量要远高于JPEG。
图像理解就是对图像的语义理解。它是以图像为对象,知识为核心,研究图像中有什么目标、目标之间的相互关系、图像是什么场景以及如何应用场景的一门学科。
传统的物体检测仅限于检测图像中的单个显著物体,从而不能保证语义对物体的完整性,与人眼注视所产生的结果是有误差的,因此不能很好的与压缩工具结合,导致图像压缩的速度和压缩率降低,压缩后的图像会降低失真率,减慢压缩过程。
发明内容
本发明是针对上述现有技术的不足,提供一种实用性强的深度语义感知与BPG压缩工具的图像压缩方法。
本发明解决其技术问题所采用的技术方案是:
一种深度语义感知与BPG压缩工具的图像压缩方法,分为以下步骤:
(一)编码过程
S101、原输入图像;
S102、利用CNN卷积神经网络对图像处理和分类,输出特征图,通过CAM方法得到语义显著图;
S103、将语义显著图划分为等级不同的注意力区域;
S104、利用BPG压缩工具对上述不同注意力区域进行不同压缩率的压缩,生产多个.bpg中间文件;
(二)解码过程
S201、将多个.bpg中间文件利用BPG压缩工具进行还原,生成多个图像区域;
S202、将图像区域根据特征图进行还原,形成输出图片。
进一步的,在步骤S102中CNN卷积神经网络定位单个图像多个感兴趣区域并捕捉场景结构,通过为图像中一组物体中每一个进行单独学习特征图,对重要特征求和,从而生成一个单一不变的特征图。
进一步的,CNN卷积神经网络是多层前馈体系结构,每一层学习的功能要应用前一层所输出的卷积滤波器的权重,并且梯度化进行,在每层中并行学习多个过滤器过程中,卷积层输出3-d特征图,其中,深度表示过滤器的数量。
进一步的,CNN卷积神经网络在每次卷积之后都包括一个最大池化步骤,通过替换几个相邻的激活系数来减少3-d特征图的高度和宽度,一次激活等于该窗口内的最大值,池化操作是属于跨步的,其中,池窗口的大小大于跨步,窗口重叠;对于给定的内核大小,输入数据的下采样和滤波器作用于3-d特征图上将会形成较大感受用于减少CNN卷积神经网络模型的参数数量并训练更深层的网络。
进一步的,步骤S102中所述的CAM类激活映射生成模糊边界,能够捕获不属于任何特定物体,只需对物体类的打上图像级别的标签,无需像素级注释或边框定位。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮人工智能研究院有限公司,未经山东浪潮人工智能研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911404225.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:骨盆三维数据的提取方法及装置
- 下一篇:一种硬件专用防尘防潮插槽