[发明专利]一种图像显著性区域检测方法及装置有效
申请号: | 202110293047.1 | 申请日: | 2021-03-18 |
公开(公告)号: | CN112861883B | 公开(公告)日: | 2022-11-01 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 上海壁仞智能科技有限公司 |
主分类号: | G06V10/46 | 分类号: | G06V10/46;G06V10/56;G06V10/774 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 马瑞 |
地址: | 201114 上海市闵行区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 显著 区域 检测 方法 装置 | ||
本发明提供一种图像显著性区域检测方法及装置。其中,该方法包括:将待检测的原始图像转换为亮度色彩通道图像,并对亮度色彩通道图像进行降采样处理;将降采样处理后的亮度色彩通道图像输入到傅里叶编码层提取频域特征,得到相应的频域矩阵;将所述频域矩阵和所述原始图像对应的矩阵向量输入至全局注意力模型中进行处理,得到对应的定位向量,基于所述定位向量确定图像显著性区域;其中,所述全局注意力模型是基于预设原始图像和用于预先标记的图像显著位置的定位向量作为训练样本进行训练后得到的。采用本发明方法,能够减少全局注意力模型的计算量,提升对自然图像显著性检测准确率和效率,便于快速适用于不同场景的图像显著性检测需求。
技术领域
本发明涉及计算机图像处理技术领域,具体涉及一种图像显著性区域检测方法和装置。另外,还涉及一种电子设备及非暂态计算机可读存储介质。
背景技术
近年来,随着计算机图像处理技术的迅速发展,基于深度学习的图像应用,比如图像显著性区域检测已经取得了长足的进步。图像显著性区域检测的任务是检测图像中引起人眼注意的目标对象,比如行人检测中的行人或者特定场景中的目标异常点。现有技术中,基于卷积网络的图像显著性检测方法已经得到了广泛应用。然而,此种方法直接作用在原始图像通道上,没有考虑自然图像的频域特征的分布特征,限制了对图像显著性区域检测性能的进一步提升,很难获得较好的检测效果。
随着变换器(Transformer)类模型的深入发展,如何结合全局注意力方法实现更好的图像显著性检测成为本领域研究的重要课题。
发明内容
为此,本发明提供一种图像显著性区域检测方法及装置,以解决现有技术中存在的图像显著性区域检测方案的检测效果及性能较差的问题。
本发明提供一种图像显著性区域检测方法,包括:
将待检测的原始图像转换为亮度色彩通道图像,并对亮度色彩通道图像进行降采样处理;
将降采样处理后的亮度色彩通道图像输入到傅里叶编码层提取频域特征,得到相应的频域矩阵;
将所述频域矩阵和所述原始图像对应的矩阵向量输入至全局注意力模型中进行处理,得到对应的定位向量,基于所述定位向量确定图像显著性区域;
其中,所述全局注意力模型是基于预设原始图像和用于预先标记的图像显著位置的定位向量作为训练样本进行训练后得到的。
进一步的,所述对亮度色彩通道图像进行降采样处理,具体为:对色彩通道进行降采样处理,使得所述色彩通道的分辨率是亮度通道分辨率的四分之一。
进一步的,所述定位向量构成的矩阵中的各个单元与所述原始图像中的各个区域一一对应,每个单元的值表示所述原始图像中对应区域的显著度均值。
进一步的,所述的图像显著性区域检测方法,还包括:
对所述原始图像进行切块,获得若干个原始图像小块;
将所述原始图像小块分别变换为对应的一维向量,基于所述一维向量构成所述原始图像对应的矩阵向量。
进一步的,所述全局注意力模型为基于注意力机制的变换器模型;
所述将所述频域矩阵和所述原始图像对应的矩阵向量输入至全局注意力模型中进行处理,得到对应的定位向量,具体包括:
将编码后的所述频域矩阵和所述原始图像对应的矩阵向量输入至变换器模型中的编码器部分进行处理,获得相应的编码矩阵向量;
将所述编码矩阵向量输出到所述变换器模型中的解码器部分,获得相应的定位向量。
本发明还提供一种图像显著性区域检测方法,包括:
将待检测的原始图像转换为亮度色彩通道图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海壁仞智能科技有限公司,未经上海壁仞智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110293047.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种治疗视神经疾病的复合物及其制备方法和用途
- 下一篇:港口储能型岸电系统
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序