[发明专利]一种基于多尺度跨图像弱监督学习的违禁物检测方法在审

专利信息
申请号: 202110275640.3 申请日: 2021-03-15
公开(公告)号: CN113159120A 公开(公告)日: 2021-07-23
发明(设计)人: 徐照程;田彦 申请(专利权)人: 浙江工商大学
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04;G06N3/08
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 刘静
地址: 310018 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 尺度 图像 监督 学习 违禁 检测 方法
【权利要求书】:

1.一种基于多尺度跨图像弱监督学习的违禁物检测方法,其特征在于,包括以下步骤:

(1)构建违禁物检测模型,包括用于图像多尺度特征提取与融合的特征交互模型、学习目标语义信息的跨图像弱监督语义分析模型、分割掩码辅助检测模型;

所述特征交互模型的构建方法如下:

输入原始图像I,通过编码器提取多尺度初始特征图编码器是由C个残差块组成的残差学习网络,C即为特征图的尺度数;相邻尺度下的特征图进行特征交互,即对低层特征图中层特征图和高层特征图进行采样得到相同分辨率的特征图,之后进行像素加和,得到对应尺度下的多尺度交互图f1i;将第k-1轮特征交互图作为新一轮特征交互的初始特征图K为总迭代次数,得到第k轮特征交互的输出特征图对每个尺度i下生成的K轮特征交互图进行像素加和,得到每个尺度i下的上下文信息特征图{fi},i=1,2,...,C;将各尺度下的上下文信息特征图通过门限卷积网络进行融合,得到原始图像的多尺度上下文融合特征图F;

所述跨图像弱监督语义分析模型的构建方法如下:

从训练集中随机抽样图像对(Im,In),图像In根据物体外接框标注信息裁剪图像内容,并缩放至固定尺寸,且ln∈{0,1}K为图像对应的one-hot格式的图像类别标签,K为违禁物候选类别数加1;使用特征交互模型输出特征图(Fm,Fn)∈RU×H×W作为模型输入,其中U,H,W分别为特征图的通道数、高度、宽度;特征图通过CFC操作获得类别感知的激活特征图(Sm,Sn)∈RQ×H×W,Q为激活特征图的通道数,通过GAP操作获得类别置信度向量(sm,sn)∈RQ,利用Sigmoid函数进行归一化,并根据归一化结果计算交叉熵损失函数Lce(·),得到单张图像Ij的分类损失:Lce(sj,lj),并将单张图像的分类损失加和得到图像对(Im,In)的分类损失:假设对特征图(Fm,Fn)作形状调整,得到展平特征图其中HW是输入特征图中的像素数目,计算跨图像联合注意力相似性矩阵来度量不同特征图任意位置间的相似性,其中,WP∈RU×U是需要学习的权值矩阵;将softmax函数应用于Pmn、Pnm进行归一化,得到跨图像联合注意力图(Am,An)∈RHW×HW;将与(Am,An)作矩阵乘法,得到展平的跨图像环境特征图和将作形状调整,获得环境特征图环境特征图通过CFC操作得到类别感知的激活特征图通过GAP操作获得类别置信度向量利用Sigmoid函数进行归一化,并根据归一化结果计算交叉熵损失函数Lce(·),从而构造跨图像联合注意力分类损失函数:其中,lm∩ln是图像对(Im,In)的共有类别标签集合;总分类损失函数其中α为跨图像联合注意力分类损失函数的权重;

所述分割掩码辅助检测模型包括分割模块和检测模块,构建方法如下:

将训练集中的任一图像Ij通过跨图像弱监督语义分析模型生成的类别感知激活图输入解码器,解码器由与编码器相对应的C个残差块组成,通过解码器得到语义分割掩码其中,θ是解码器网络权重,fd(·)为映射函数,Oj与输入图像Ij的分辨率相同;对跨图像弱监督语义分析模型中的类别置信度向量sj∈RQ进行上采样、二值化处理,将处理结果作为前景目标伪掩码,使用显著性概率图作为背景伪掩码,从而构成伪分割掩码Ej;优化分割模块损失函数:Lseg=∑jLbce(Oj,Ej),其中Lbce(·)为二值化交叉熵损失函数;将与下采样到的分辨率的语义分割掩码O′j进行级联,级联结果O″j分别输入分类分支和定位分支,分类分支由一层全连接层实现,用于预测分类置信度向量;定位分支由两层全连接层实现,用于定位目标位置pj=(xj,yj,wj,hj),其中(xj,yj)为目标中心位置坐标,(wj,hj)为目标外接框的像素宽度、高度;使用交叉熵损失函数Lce(·)优化模型分类分支,L1范式损失函数L1(·)优化目标定位分支,分割掩码辅助检测模型的检测模块总损失函数为:Ldet=∑j(Lce(rj,tj)+βL1(pj,dj)),其中,tj,dj分别为分类分支、定位分支的真实标签,rj为预测类别,β为混合平衡因子;

(2)得到检测结果:利用训练样本训练违禁物检测模型;测试时将待检测图像输入违禁物检测模型,得到违禁物位置和种类。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110275640.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top