[发明专利]一种基于计算机视觉的监控场景下的吸烟行为检测方法在审
| 申请号: | 202010789052.7 | 申请日: | 2020-08-07 |
| 公开(公告)号: | CN112115775A | 公开(公告)日: | 2020-12-22 |
| 发明(设计)人: | 王素玉;陶思辉 | 申请(专利权)人: | 北京工业大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100124 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 计算机 视觉 监控 场景 吸烟 行为 检测 方法 | ||
本发明公开了一种基于计算机视觉的监控场景下的吸烟行为检测方法,所述方法包括:采集包含吸烟行为的视频图像,以及相似行为如打电话等行为的视频图像,采用预设计的目标检测网络模型对图像进行对人体位置的检测,对人体检测框使用预设的裁剪算法裁剪,使用预设的分类网络模型进行对裁剪框区域图像信息进行识别,进而得到吸烟识别结果;本发明在实施上具有成本低、实时检测、高准确性等优点。
技术领域
本发明涉及深度学习中目标检测技术领域、图像分类识别技术领域和一套动作检测规则方法和系统。
背景技术
目前,在视频行为理解的技术条件下,人体行为检测技术可用于监控摄像头下的吸烟检测技术方案主要如下几种:
(1)基于C3D(三维卷积)的方法,采用3D卷积深度网络对整段视频进行时空建模,直接进行吸烟行为识别。
(2)基于CNN-LSTM(卷积神经网络-长短时记忆神经网络)的方法,使用 CNN提取视频中每帧的特征信息,将每帧的特征信息使用LSTM进行处理,最终识别出行为。
(3)基于图像分割以及图像分类的方法,提取图像中手势信息,对手势信息进行识别,进一步得到吸烟行为的识别结果。
(4)基于目标检测-跟踪-识别方法,使用目标检测来对每一帧中的ROI进行跟踪,然后对检测到的动作进行行为识别。
(5)基于视频监控的烟雾检测,将每帧图像使用分类器进行关于含不含香烟烟雾的分类,进而完成吸烟行为识别的检测。
但是,现有的吸烟检测技术,存在着以下的缺点:
(1)以上所述的(1)、(2)、(4)的方法虽然在不同程度上提高了吸烟行为检测/识别的准确率,但由于算法时空复杂度高,所以很难达到实时检测,吸烟检测需要一定的实时性。
(2)以上所述的方法(3)的方法,由于需要近距离捕捉手势信息,很难在监控摄像头条件下进行吸烟行为检测。
(3)以上所述的方法(5)的方法,准确率较低,并且不能对人体进行定位进行精确的行为检测。
发明内容
本发明提供一种可以在一种基于计算机视觉的监控场景下的吸烟行为检测方法,该方法具有成本低、高鲁棒、高实时等优点,很容易部署到PC设备中。
本发明使用目标检测网络。目标检测网络接收视频图像,检测人体位置。分类器接收人体部分ROI区域(感兴趣区域Region ofInteresting),判断人是否吸烟。
为实现上述目的,本发明提供一种实时的检测吸烟行为的方法,所述实时的吸烟行为检测方法包括以下步骤:
S1、获取采集的包含吸烟人的视频图像,逐帧送入预设的目标检测网络中,得到人体位置信息,人体头部位置信息以及人体手部位置信息。
S2、通过S1得到人体ROI,为了使得吸烟检测更加精确,把人体ROI输入预设的裁剪模块,进行局部裁剪,得到人体上半身的区域;
S3、通过S2得到裁剪之后的ROI部分图像,把图像送入预设的分类网络,执行吸烟检测。
与现有技术相比较,本发明具有如下技术效果。
可以从技术原理和本方法实施的角度考虑下,本发明的技术特色以及技术优势所在之处。
1.本发明的算法使用了单阶目标检测网络,以及使用了分组卷积的轻量化主干网络所以时间复杂度和空间复杂相对较低,在使用轻量化的主干网络之后可以达到65FPS(单张图像推理达到15ms)可以做到实时检测。
2.本发明具有较高的鲁棒性,使用了大量的相似行为的图像进行训练,能够在相似行为之间,分辨出吸烟行为,具有较高的鲁棒性,能够很好适应监控摄像头下的俯视场景。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010789052.7/2.html,转载请声明来源钻瓜专利网。





