[发明专利]一种基于注意力机制连续视角的危险品检测方法在审
| 申请号: | 202110904444.8 | 申请日: | 2021-08-06 |
| 公开(公告)号: | CN114092783A | 公开(公告)日: | 2022-02-25 |
| 发明(设计)人: | 卓晴;喻望 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G06V20/00 | 分类号: | G06V20/00;G06V10/774;G06V10/82;G06K9/62;G06N3/04;H04N5/232 |
| 代理公司: | 北京康思博达知识产权代理事务所(普通合伙) 11426 | 代理人: | 潘炜;范国锋 |
| 地址: | 100084*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 注意力 机制 连续 视角 危险品 检测 方法 | ||
本发明公开了一种基于注意力机制连续视角的危险品检测方法,所述方法利用多视角拍摄危险品得到的一系列旋转图像,然后基于注意力机制,训练网络得到不同视角图像的不同权重。本发明公开的基于注意力机制连续视角的危险品检测方法,使得网络在物品识别与分类时更加有侧重点,既不会被不必要的多余角度所干扰到结果,也不会忽略有效信息而无法识别出危险品,显著提升了检测准确率。
技术领域
本发明涉及计算机视觉和图像处理技术领域,具体涉及一种基于注意力机制连续视角的危险品检测方法。
背景技术
危险物品检测是公共安全领域的一个关键问题,在危险品检测时,拍摄图像的机器大多是从单一的角度进行拍摄的,而危险品的放置角度不同,会产生不同的检测效果。例如:一把刀从不同角度拍摄,会产生不同的视觉效果,在很多角度会被错认成其他的生活用品。因此,单一角度的危险品识别会降低识别的准确率。
现有技术中,为解决上述问题,采取的方法为:对于连续的图像进行整体分析,利用关键点的匹配和跟踪,进一步对感兴趣的物体进行分类;或者针对单张图像,通过卷积神经网络提取特征信息,并对危险品进行识别。
例如:专利CN110458166A提出了一种基于可变形卷积的危险品检测方法、装置及设备,其是利用可变形卷积对危险品图像进行特征提取,但该方法没有考虑图像中危险品的旋转角度问题,对于某些角度,危险品的特征可能很不明显,只对于单一视角的图像进行特征提取再进行识别,可能会忽略掉一部分的危险物品。
专利CN110133741A提出了一种多视角匹配和跟踪的自动安检方法,其是对于连续视角组成的一系列图像进行整体分析,而忽略了不同图像间的差异。例如同意危险品,在正面与侧面观察具有截然不同的区别,包含的特征信息也会有很大的差别。如果简单地对所有视角进行关键点匹配和跟踪,可能不会获得理想的结果。
专利CN110018524A提出了一种基于视觉-属性的X射线安检违禁品识别方法,其仅采用yolo层在多个尺度对特征图进行边界框预测,也没有考虑方向变化对于预测结果的影响。如果只是对于单一视角的图像进行特征提取,然后再进行边界框预测和物品识别,可能会忽略掉一部分的目标物品,对最终结果产生影响。
综上,现有技术中的方法或没有考虑多角度下的危险品图像所带来的特征差异,或忽略了连续视角的多张图像在权重上的不同,均无法在考虑危险品的不同角度时得到较好的效果。
因此,有必要提供一种能够解决上述问题的危险品检测方法。
发明内容
为了克服上述问题,本发明人进行了锐意研究,设计出一种基于注意力机制连续视角的危险品检测方法,该方法利用多视角拍摄危险品得到的一系列旋转图像,然后基于注意力机制,训练网络得到不同视角图像的不同权重,从而使得网络在物品识别与分类时更加有侧重点,既不会被不必要的多余角度所干扰到结果,也不会忽略有效信息而无法识别出危险品,显著提升了检测准确率,从而完成了本发明。
具体来说,本发明的目的在于提供以下方面:
第一方面,提供一种基于注意力机制连续视角的危险品检测方法,其中,所述方法包括以下步骤:
步骤1,训练获得危险品分类模型。
步骤2,获取待检测危险品图像,利用训练获得的危险品分类模型,获得检测结果。
其中,步骤1包括以下子步骤:
步骤1-1,建立训练集;
步骤1-2,构建分类模型;
步骤1-3,训练分类模型。
其中,步骤1-1包括以下子步骤:
步骤1-1-1,获得危险品连续角度下的图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110904444.8/2.html,转载请声明来源钻瓜专利网。





