[发明专利]一种图像显著性区域检测方法及装置有效

专利信息
申请号: 202110293047.1 申请日: 2021-03-18
公开(公告)号: CN112861883B 公开(公告)日: 2022-11-01
发明(设计)人: 不公告发明人 申请(专利权)人: 上海壁仞智能科技有限公司
主分类号: G06V10/46 分类号: G06V10/46;G06V10/56;G06V10/774
代理公司: 北京路浩知识产权代理有限公司 11002 代理人: 马瑞
地址: 201114 上海市闵行区*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 图像 显著 区域 检测 方法 装置
【说明书】:

发明提供一种图像显著性区域检测方法及装置。其中,该方法包括:将待检测的原始图像转换为亮度色彩通道图像,并对亮度色彩通道图像进行降采样处理;将降采样处理后的亮度色彩通道图像输入到傅里叶编码层提取频域特征,得到相应的频域矩阵;将所述频域矩阵和所述原始图像对应的矩阵向量输入至全局注意力模型中进行处理,得到对应的定位向量,基于所述定位向量确定图像显著性区域;其中,所述全局注意力模型是基于预设原始图像和用于预先标记的图像显著位置的定位向量作为训练样本进行训练后得到的。采用本发明方法,能够减少全局注意力模型的计算量,提升对自然图像显著性检测准确率和效率,便于快速适用于不同场景的图像显著性检测需求。

技术领域

本发明涉及计算机图像处理技术领域,具体涉及一种图像显著性区域检测方法和装置。另外,还涉及一种电子设备及非暂态计算机可读存储介质。

背景技术

近年来,随着计算机图像处理技术的迅速发展,基于深度学习的图像应用,比如图像显著性区域检测已经取得了长足的进步。图像显著性区域检测的任务是检测图像中引起人眼注意的目标对象,比如行人检测中的行人或者特定场景中的目标异常点。现有技术中,基于卷积网络的图像显著性检测方法已经得到了广泛应用。然而,此种方法直接作用在原始图像通道上,没有考虑自然图像的频域特征的分布特征,限制了对图像显著性区域检测性能的进一步提升,很难获得较好的检测效果。

随着变换器(Transformer)类模型的深入发展,如何结合全局注意力方法实现更好的图像显著性检测成为本领域研究的重要课题。

发明内容

为此,本发明提供一种图像显著性区域检测方法及装置,以解决现有技术中存在的图像显著性区域检测方案的检测效果及性能较差的问题。

本发明提供一种图像显著性区域检测方法,包括:

将待检测的原始图像转换为亮度色彩通道图像,并对亮度色彩通道图像进行降采样处理;

将降采样处理后的亮度色彩通道图像输入到傅里叶编码层提取频域特征,得到相应的频域矩阵;

将所述频域矩阵和所述原始图像对应的矩阵向量输入至全局注意力模型中进行处理,得到对应的定位向量,基于所述定位向量确定图像显著性区域;

其中,所述全局注意力模型是基于预设原始图像和用于预先标记的图像显著位置的定位向量作为训练样本进行训练后得到的。

进一步的,所述对亮度色彩通道图像进行降采样处理,具体为:对色彩通道进行降采样处理,使得所述色彩通道的分辨率是亮度通道分辨率的四分之一。

进一步的,所述定位向量构成的矩阵中的各个单元与所述原始图像中的各个区域一一对应,每个单元的值表示所述原始图像中对应区域的显著度均值。

进一步的,所述的图像显著性区域检测方法,还包括:

对所述原始图像进行切块,获得若干个原始图像小块;

将所述原始图像小块分别变换为对应的一维向量,基于所述一维向量构成所述原始图像对应的矩阵向量。

进一步的,所述全局注意力模型为基于注意力机制的变换器模型;

所述将所述频域矩阵和所述原始图像对应的矩阵向量输入至全局注意力模型中进行处理,得到对应的定位向量,具体包括:

将编码后的所述频域矩阵和所述原始图像对应的矩阵向量输入至变换器模型中的编码器部分进行处理,获得相应的编码矩阵向量;

将所述编码矩阵向量输出到所述变换器模型中的解码器部分,获得相应的定位向量。

本发明还提供一种图像显著性区域检测方法,包括:

将待检测的原始图像转换为亮度色彩通道图像;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海壁仞智能科技有限公司,未经上海壁仞智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110293047.1/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top