[发明专利]一种基于多尺度跨图像弱监督学习的违禁物检测方法在审
申请号: | 202110275640.3 | 申请日: | 2021-03-15 |
公开(公告)号: | CN113159120A | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 徐照程;田彦 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 刘静 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 尺度 图像 监督 学习 违禁 检测 方法 | ||
1.一种基于多尺度跨图像弱监督学习的违禁物检测方法,其特征在于,包括以下步骤:
(1)构建违禁物检测模型,包括用于图像多尺度特征提取与融合的特征交互模型、学习目标语义信息的跨图像弱监督语义分析模型、分割掩码辅助检测模型;
所述特征交互模型的构建方法如下:
输入原始图像I,通过编码器提取多尺度初始特征图编码器是由C个残差块组成的残差学习网络,C即为特征图的尺度数;相邻尺度下的特征图进行特征交互,即对低层特征图中层特征图和高层特征图进行采样得到相同分辨率的特征图,之后进行像素加和,得到对应尺度下的多尺度交互图f1i;将第k-1轮特征交互图作为新一轮特征交互的初始特征图K为总迭代次数,得到第k轮特征交互的输出特征图对每个尺度i下生成的K轮特征交互图进行像素加和,得到每个尺度i下的上下文信息特征图{fi},i=1,2,...,C;将各尺度下的上下文信息特征图通过门限卷积网络进行融合,得到原始图像的多尺度上下文融合特征图F;
所述跨图像弱监督语义分析模型的构建方法如下:
从训练集中随机抽样图像对(Im,In),图像In根据物体外接框标注信息裁剪图像内容,并缩放至固定尺寸,且ln∈{0,1}K为图像对应的one-hot格式的图像类别标签,K为违禁物候选类别数加1;使用特征交互模型输出特征图(Fm,Fn)∈RU×H×W作为模型输入,其中U,H,W分别为特征图的通道数、高度、宽度;特征图通过CFC操作获得类别感知的激活特征图(Sm,Sn)∈RQ×H×W,Q为激活特征图的通道数,通过GAP操作获得类别置信度向量(sm,sn)∈RQ,利用Sigmoid函数进行归一化,并根据归一化结果计算交叉熵损失函数Lce(·),得到单张图像Ij的分类损失:Lce(sj,lj),并将单张图像的分类损失加和得到图像对(Im,In)的分类损失:假设对特征图(Fm,Fn)作形状调整,得到展平特征图其中HW是输入特征图中的像素数目,计算跨图像联合注意力相似性矩阵来度量不同特征图任意位置间的相似性,其中,WP∈RU×U是需要学习的权值矩阵;将softmax函数应用于Pmn、Pnm进行归一化,得到跨图像联合注意力图(Am,An)∈RHW×HW;将与(Am,An)作矩阵乘法,得到展平的跨图像环境特征图和将作形状调整,获得环境特征图环境特征图通过CFC操作得到类别感知的激活特征图通过GAP操作获得类别置信度向量利用Sigmoid函数进行归一化,并根据归一化结果计算交叉熵损失函数Lce(·),从而构造跨图像联合注意力分类损失函数:其中,lm∩ln是图像对(Im,In)的共有类别标签集合;总分类损失函数其中α为跨图像联合注意力分类损失函数的权重;
所述分割掩码辅助检测模型包括分割模块和检测模块,构建方法如下:
将训练集中的任一图像Ij通过跨图像弱监督语义分析模型生成的类别感知激活图输入解码器,解码器由与编码器相对应的C个残差块组成,通过解码器得到语义分割掩码其中,θ是解码器网络权重,fd(·)为映射函数,Oj与输入图像Ij的分辨率相同;对跨图像弱监督语义分析模型中的类别置信度向量sj∈RQ进行上采样、二值化处理,将处理结果作为前景目标伪掩码,使用显著性概率图作为背景伪掩码,从而构成伪分割掩码Ej;优化分割模块损失函数:Lseg=∑jLbce(Oj,Ej),其中Lbce(·)为二值化交叉熵损失函数;将与下采样到的分辨率的语义分割掩码O′j进行级联,级联结果O″j分别输入分类分支和定位分支,分类分支由一层全连接层实现,用于预测分类置信度向量;定位分支由两层全连接层实现,用于定位目标位置pj=(xj,yj,wj,hj),其中(xj,yj)为目标中心位置坐标,(wj,hj)为目标外接框的像素宽度、高度;使用交叉熵损失函数Lce(·)优化模型分类分支,L1范式损失函数L1(·)优化目标定位分支,分割掩码辅助检测模型的检测模块总损失函数为:Ldet=∑j(Lce(rj,tj)+βL1(pj,dj)),其中,tj,dj分别为分类分支、定位分支的真实标签,rj为预测类别,β为混合平衡因子;
(2)得到检测结果:利用训练样本训练违禁物检测模型;测试时将待检测图像输入违禁物检测模型,得到违禁物位置和种类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110275640.3/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序