[发明专利]一种基于深度学习的施工工地图像安全帽检测方法在审
申请号: | 201910492639.9 | 申请日: | 2019-06-06 |
公开(公告)号: | CN110263686A | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 叶修梓;张三元;洪振杰;陈如龙 | 申请(专利权)人: | 温州大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 林超 |
地址: | 325035 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 安全帽 图像 检测 人员目标 施工工地 学习 佩戴 准确性要求 分类网络 目标检测 图像区域 图像使用 截取 迁移 分类 施工 | ||
1.一种基于深度学习的施工工地图像安全帽检测方法,其特征在于:该方法包括如下步骤:
1)采用已经标注信息区域的施工现场的视频图像,视频图像标注的信息区域分为人体区域和背景区域,将所有视频图像构建为训练数据,将训练数据输入到深度学习目标检测网络进行训练,使用该训练好的深度学习目标检测网络对图像进行人体区域检测,如果检测到人体区域,将人体区域的上部1/3作为人体头部区域;
2)构建佩戴安全帽和未佩戴安全帽的图像数据集,构建用于检测是否佩戴安全帽的深度学习分类网络,将图像数据集输入到深度学习分类网络进行训练;使用训练好的深度学习分类网络对步骤1)中的人体头部区域进行深度学习分类检测,判断人体头部区域中的是否存在佩戴安全帽的情况,从而实现施工现场图像中的安全帽检测。
2.根据权利要求1所述的一种基于深度学习的施工工地图像安全帽检测方法,其特征在于:
所述的步骤1)中,人体区域和背景区域均采用矩形包围框进行标注,并对人体区域和背景区域进行类型标记,其中人体区域对应为标签1,背景区域对应为标签1,从而组成人体区域检测的训练数据;将训练数据输入到深度学习目标检测网络中,采用梯度下降算法使得目标检测网络的损失函数收敛到一个最小值完成训练,损失函数使用smooth L1损失函数。
3.根据权利要求1所述的一种基于深度学习的施工工地图像安全帽检测方法,其特征在于:
所述的步骤1)中,深度学习目标检测网络主要由5个模块、5个模块依次连接构成:第一个模块为基础网络模块,使用去除了分类层的ResNet-50层网络;第二模块至第四模块均为高和宽减半模块,高宽减半模块主要由两个填充为1的3×3的卷积层串联后接着再连接一个步长为2×2的最大池化层构成;第五模块为全局最大池化层,将特征图的高和宽降为1;并且,在第二至第五模块的每个模块输出的特征图中,以每个像素为中心生成固定数量的锚框,对每个锚框分别采用类别预测层和边界预测层进行类别预测和边界框预测:类别预测层使用一个填充为1的3×3的卷积层,卷积层的输入和输出的高和宽保持不变,输出的通道数为锚框数×目标检测的类别数目,类别预测层使用卷积层的输出的通道来对类别进行预测;边界预测层使用的一个填充为1的3×3的卷积层,卷积层的输入和输出的高和宽保持不变,输出的通道数为锚框数×每个锚框预测的4个偏移量,4个偏移量为锚框的左上角坐标x和y,锚框的宽w和高h,边界预测层使用卷积层的输出的通道来对锚框的边界进行预测;目标检测网络包含有两个损失,分别为锚框类别损失和正类锚框偏移量损失,锚框类别损失的类别预测使用的多分类对数损失函数,正类锚框偏移量损失使用L1范数损失函数,锚框类别损失和正类锚框偏移量损失的损失相加作为目标检测网络的最终损失函数。
4.根据权利要求1所述的一种基于深度学习的施工工地图像安全帽检测方法,其特征在于:所述步骤3)中,所述的深度学习分类网络具体结构为:包括依次连接的六个分类模块层、一层一维数据转换层、一层全连接层、一层Softmax函数分类层,其中每个分类模块层主要由一个卷积层、一个ReLU函数激活层和一个最大池化层依次连接构成,图像数据集输入到第一个分类模块的卷积层中,预测结果从Softmax函数分类层输出。训练中采用Adam优化算法训练深度学习分类网络,直到深度学习分类网络的损失函数收敛到稳定的最小值,其中损失函数采用的是多分类对数损失函数。
5.根据权利要求1所述的一种基于深度学习的施工工地图像安全帽检测方法,其特征在于:所述步骤2)之后,当图像的检测结果为未佩戴安全帽时,发送未佩戴安全帽的人体区域图像和提醒信号到终端,进而发出警报声音提醒未佩戴安全帽的人。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温州大学,未经温州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910492639.9/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序