[发明专利]基于目标语义和注意力机制的图像场景分类方法及装置有效

专利信息
申请号: 201911311047.9 申请日: 2019-12-18
公开(公告)号: CN111104898B 公开(公告)日: 2022-03-25
发明(设计)人: 陈丽琼;邹炼;范赐恩;王嘉乐;程谟凡;裘兆炳 申请(专利权)人: 武汉大学
主分类号: G06V10/764 分类号: G06V10/764;G06V20/00;G06V10/774;G06K9/62;G06N3/04
代理公司: 湖北武汉永嘉专利代理有限公司 42102 代理人: 张宇
地址: 430072 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 目标 语义 注意力 机制 图像 场景 分类 方法 装置
【权利要求书】:

1.一种基于目标语义和注意力机制的图像场景分类方法,其特征在于,包括:

(1)获取自然图像场景分类数据集,并按照所述数据集的标准划分训练集和测试集;

(2)计算所述训练集中每类场景的目标概率分布,以及在场景图片出现某类目标时,该场景图片属于某类场景的后验概率;

(3)构建基于注意力机制的场景分类网络,使用所述训练集对所述场景分类网络进行训练,并给定所述测试集中的待测图片,使用训练好的场景分类网络计算所述待测图片的场景分类概率;

(4)对于所述待测图片,利用预训练好的目标检测网络检测所述待测图片中存在的目标,并结合所述后验概率得到场景的修正系数;

(5)利用所述修正系数乘以所述场景分类概率,得到修正后的场景分类概率,排序后得到具有最高分类概率的场景类别;

步骤(3)包括:

(3.1)构建基于注意力机制的场景分类网络,利用预训练好的基网络初始化所述场景分类网络,使用所述训练集对所述场景分类网络进行训练;

(3.2)给定所述测试集中的待测图片,利用训练好的场景分类网络对所述待测图片所属的场景类别进行预测,得到每类场景的类别概率;

步骤(3.1)包括:

使用融合通道注意力和空间注意力的注意力模块嵌入基网络,得到基于注意力机制的场景分类网络,其中,所述注意力模块的输入为原始特征图,经过三个并行的卷积层后,将得到的三个特征图相加,得到中间特征图,所述中间特征图经过通道注意力模块得到第一特征图,经过空间注意力模块得到第二特征图,将所述第一特征图与所述第二特征图相加得到输出特征图;

其中,所述通道注意力模块的输入为所述中间特征图,分别采用最大池化和平均池化对所述中间特征图进行压缩,得到两个通道描述子,然后经过两个全连接层对通道描述子进行激活操作,将得到的结果相加,并将相加后的结果填充到所述中间特征图的大小,作为通道权重,最后将通道权重与所述中间特征图对应位置相乘,得到通道注意力模块的第一特征图;

所述空间注意力模块的输入为所述中间特征图,经过两个并行的膨胀卷积,将两个膨胀卷积后的特征图进行串联操作,再经过一个卷积层,得到空间注意力权重,最后将所述空间注意力权重填充到所述中间特征图的大小后,与所述中间特征图对应位置相乘,得到空间注意力模块的第二特征图;

步骤(4)包括:

(4.1)对于所述待测图片,利用预训练好的目标检测网络检测所述待测图片中包含的目标类别;

(4.2)基于所述待测图片中包含的目标类别及所述后验概率得到场景的修正系数;

由j∈[1,C]得到第j类场景sj的修正系数tj,C表示场景类别数量,α(oi)为权重系数,反映所述待测图片中是否包含第i类目标oi,p(sj|oi)表示所述待测图片出现目标oi时,所述待测图片属于场景sj的后验概率。

2.根据权利要求1所述的方法,其特征在于,步骤(2)包括:

(2.1)对所述训练集中的每张图片进行滑动取样,将每张图片分为若干图像块;

(2.2)将各图像块输入到预训练好的基网络进行目标识别,得到各图像块的目标类别概率,对所有图像块的目标类别概率进行求和,得到每张图片的目标概率分布,进而得到所述训练集中每类场景的目标概率分布;

(2.3)基于所述训练集中每类场景的目标概率分布得到在图片出现某类目标时,该图片属于某类场景的后验概率。

3.根据权利要求2所述的方法,其特征在于,由确定第j类场景sj中目标的概率分布,其中,Nj表示所述训练集中第j类场景的图片数量,fo(xi)表示属于第j类场景sj的第i张图片xi的目标概率分布。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911311047.9/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top