[发明专利]一种深度语义感知与BPG压缩工具的图像压缩方法在审
申请号: | 201911404225.2 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111145277A | 公开(公告)日: | 2020-05-12 |
发明(设计)人: | 吴振东;李锐;金长新 | 申请(专利权)人: | 山东浪潮人工智能研究院有限公司 |
主分类号: | G06T9/00 | 分类号: | G06T9/00;G06N3/04 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 罗文曌 |
地址: | 250100 山东省济南市高新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 语义 感知 bpg 压缩工具 图像 压缩 方法 | ||
1.一种深度语义感知与BPG压缩工具的图像压缩方法,其特征在于,分为以下步骤:
(一)编码过程
S101、原输入图像;
S102、利用CNN卷积神经网络对图像处理和分类,输出特征图,通过CAM方法得到语义显著图;
S103、将语义显著图划分为等级不同的注意力区域;
S104、利用BPG压缩工具对上述不同注意力区域进行不同压缩率的压缩,生产多个.bpg中间文件;
(二)解码过程
S201、将多个.bpg中间文件利用BPG压缩工具进行还原,生成多个图像区域;
S202、将图像区域根据特征图进行还原,形成输出图片。
2.根据权利要求1所述的一种深度语义感知与BPG压缩工具的图像压缩方法,其特征在于,在步骤S102中CNN卷积神经网络定位单个图像多个感兴趣区域并捕捉场景结构,通过为图像中一组物体中每一个进行单独学习特征图,对重要特征求和,从而生成一个单一不变的特征图。
3.根据权利要求2所述的一种深度语义感知与BPG压缩工具的图像压缩方法,其特征在于,CNN卷积神经网络是多层前馈体系结构,每一层学习的功能要应用前一层所输出的卷积滤波器的权重,并且梯度化进行,在每层中并行学习多个过滤器过程中,卷积层输出3-d特征图,其中,深度表示过滤器的数量。
4.根据权利要求3所述的一种深度语义感知与BPG压缩工具的图像压缩方法,其特征在于,CNN卷积神经网络在每次卷积之后都包括一个最大池化步骤,通过替换几个相邻的激活系数来减少3-d特征图的高度和宽度,一次激活等于该窗口内的最大值,池化操作是属于跨步的,其中,池窗口的大小大于跨步,窗口重叠;对于给定的内核大小,输入数据的下采样和滤波器作用于3-d特征图上将会形成较大感受用于减少CNN卷积神经网络模型的参数数量并训练更深层的网络。
5.根据权利要求1所述的一种深度语义感知与BPG压缩工具的图像压缩方法,其特征在于,步骤S102中所述的CAM类激活映射生成模糊边界,能够捕获不属于任何特定物体,只需对物体类的打上图像级别的标签,无需像素级注释或边框定位。
6.根据权利要求5所述的一种深度语义感知与BPG压缩工具的图像压缩方法,其特征在于,对于CAM的训练,目的是最小物体之间类别真实概率分布以及预测该概率分布,通过以下公式获得:
其中,中,c是物体的类别,d是3-d特征图,wdc是通过学习得到。
7.根据权利要求6所述的一种深度语义感知与BPG压缩工具的图像压缩方法,其特征在于,CAM方法用于平衡多个物体的激活程度,对于L层,每层l包含dl个特征,一张图的尺寸为n×n大小,共有C个类别,整个激活程度的结果为:k是最大池化的步长;
为了不让改物体的识别被限制在一个最为可能的类别上,需要消除图像中不存在类别激活程度所造成的影响,为此提出一种阈值运算,公式为所述运算用于将整张图片中所用特征没有足够大的总激活量的类别所丢弃,其中Zlc是在l层对于C类别所有激活程度的总和。
8.根据权利要求7所述的一种深度语义感知与BPG压缩工具的图像压缩方法,其特征在于,使用Zlc来过滤类别,多结构区域的注意力区域计算方式为:
为生成语义显著图每个像素点,是通过CAM所生成的,是所有类别激活程度Zlc在阈值T的总和,T是在训练期间所确定的超参数;
选出前五名的类别并通过等级进行加权总和,并将它们分开,形成语义显著图。
9.根据权利要求8所述的一种深度语义感知与BPG压缩工具的图像压缩方法,其特征在于,所述语义显著图对整张图片的注意力高低分为51个级别,不同区域的级别采用相应的BPG工具进行不同质量压缩,并将所有.bpg中间文件进行整合和存储。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮人工智能研究院有限公司,未经山东浪潮人工智能研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911404225.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:骨盆三维数据的提取方法及装置
- 下一篇:一种硬件专用防尘防潮插槽