[发明专利]违禁品的检测方法及装置有效
| 申请号: | 202110266096.6 | 申请日: | 2021-03-11 |
| 公开(公告)号: | CN112884755B | 公开(公告)日: | 2023-07-04 |
| 发明(设计)人: | 宋红;杨健;艾丹妮;范敬凡;魏一凡 | 申请(专利权)人: | 北京理工大学 |
| 主分类号: | G06T7/00 | 分类号: | G06T7/00;G06V10/764;G06V10/40;G06V10/82;G06V10/80;G06N3/0464 |
| 代理公司: | 北京市中闻律师事务所 11388 | 代理人: | 冯梦洪 |
| 地址: | 100081 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 违禁品 检测 方法 装置 | ||
1.违禁品的检测方法,其特征在于:其包括以下步骤:
(1)对包含违禁物品的X射线图像进行图像随机翻转、归一化的预处理,并将预处理后的数据加载到卷积神经网络模型中;
(2)利用卷积神经网络对输入的X射线图像进行特征的提取、融合与增强;
(3)对经过处理后得到的特征金字塔每层的特征图,通过两个并行分支的子网络分别计算其中含有违禁物品的类别与位置信息;
(4)利用Soft-NMS算法去除冗余的候选检测框,并对结果进行输出,标出违禁物品具体的类别与位置;
所述步骤(1)中,将输入的图像在保持原有长宽比的基础上进行尺度的缩放,并填充缩放后的图像,将其填充为32的倍数,目的是在卷积的过程中避免特征的丢失;之后将图像的标注信息与图像一起按照50%的概率进行翻转;
所述步骤(2)包括以下分步骤:
(2.1)利用ResNet50作为特征提取网络,对输入的图像进行特征提取;
(2.2)利用改进的FPN网络及注意力机制对提取到的特征进行融合和增强;
所述步骤(2.1)中,利用ResNet50作为特征提取器,对输入的原始图像进行卷积操作,提取输入图像在不同尺度下的原始特征;利用改进后的FPN网络,对ResNet50主干网络卷积操作后得到的不同尺度的特征图通过横向连接和上采样,得到不同尺度和大小的特征图,使其既包含丰富的语义信息利于检测器的分类,又包含丰富的空间信息,利于检测器确定目标的位置;
所述步骤(2.2)中,首先对特征图做1x1卷积,接着对输入的最高层和最低层特征图分别做双线性插值,将最高层输入的特征图上采样到与最低层特征图大小相同、将最低层输入的特征图下采样到与最高层特征图大小相同,后与1x1卷积后的特征图逐元素相加作为横向连接,接着通过为上层特征图做最近邻插值的上采样使其与当前层特征图具有相同大小,将上采样的结果与当前层特征图进行逐元素相加,生成新的特征图。
2.根据权利要求1所述的违禁品的检测方法,其特征在于:所述步骤(2.2)中,将经过改进后的FPN网络输出的特征图进行大小的改变,统一缩放到中间特征图的大小,直接将特征图逐元素相加求平均,表示为公式(1):
其中,C为平均后的特征图,L为做运算时特征金字塔的层数,Cl为当前进行运算的第l层特征图,
之后利用两个并行的注意力机制网络Non-local和SE分别从空间和通道两个方面进一步对平均后的特征图进行增强,最后将增强后的特征图与输入特征图进行逐元素相加;从空间方面对特征图进行增强是指捕获到非相邻位置远距离的依赖关系,获得更为全局的信息;从通道方面对特征图进行增强是指建模特征图通道之间的相互依赖关系,通过学习的方式获得每个通道的重要程度,由此来提升有用的通道信息并抑制对任务用处不大的通道信息。
3.根据权利要求2所述的违禁品的检测方法,其特征在于:所述步骤(3)中,得到的特征金字塔每层都有分类和定位两个分支,分类分支计算目标出现的概率,边界框回归的定位分支计算anchor与附近标注框的偏移量;两分支网络进行卷积的过程中使用的归一化方法为Group Norm。
4.根据权利要求3所述的违禁品的检测方法,其特征在于:所述步骤(4)中,Soft-NMS算法表示为公式(3):
其中Si为第i个待处理候选框的置信度分数,为当前置信度分数最大的候选框与第i个待处理候选框的IOU,σ为方差。
5.根据权利要求1所述的违禁品的检测方法的实现装置,其特征在于:其包括:
预处理模块,其配置来对包含违禁物品的X射线图像进行图像随机翻转、归一化的预处理,并将预处理后的数据加载到卷积神经网络模型中;
特征处理模块,其配置来利用卷积神经网络对输入的X射线图像进行特征的提取、融合与增强;
类别与位置信息获取模块,其配置来对经过处理后得到的特征金字塔每层的特征图,通过两个并行分支的子网络分别计算其中含有违禁物品的类别与位置信息;
结果输出模块,其配置来利用Soft-NMS算法去除冗余的候选检测框,并对结果进行输出,标出违禁物品具体的类别与位置。
6.根据权利要求5所述的装置,其特征在于:所述特征处理模块执行以下步骤:
(2.1)利用ResNet50作为特征提取网络,对输入的图像进行特征提取;
(2.2)利用改进的FPN网络及注意力机制对提取到的特征进行融合和增强。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110266096.6/1.html,转载请声明来源钻瓜专利网。





