[发明专利]一种基于深度学习的行人遮挡检测方法有效
| 申请号: | 201911131589.8 | 申请日: | 2019-11-19 |
| 公开(公告)号: | CN111144203B | 公开(公告)日: | 2023-06-16 |
| 发明(设计)人: | 王慧燕;徐扬 | 申请(专利权)人: | 浙江工商大学 |
| 主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V20/52;G06V10/764;G06V10/80;G06V10/82;G06N3/0464;G06N3/084 |
| 代理公司: | 浙江杭州金通专利事务所有限公司 33100 | 代理人: | 许可唯 |
| 地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 行人 遮挡 检测 方法 | ||
本发明提供一种基于深度学习的行人遮挡检测方法,首先采用无锚点的数据预处理方式,并且对于行人数据进行遮挡扩充,还采用了随机色彩变换、水平翻转、随机尺寸变换等数据增强方式;其次是一种新的特征融合方式,对于精炼神经网络(Refinement Neural Network,RefineDet)的特征融合模块(Transfer Connection Block,TCB)进行改进,减少其下采样次数,对于ResNet的不同阶段进行了更为充分的特征融合;最终传入到检测头网络中,得到效果更好的行人遮挡检测算法RefinePedDet。本发明通过实际测试得到漏检率更低的行人遮挡检测算法。
技术领域
本发明涉及计算机视觉中图像处理和模式识别技术领域,具体涉及一种基于深度学习的行人遮挡检测方法。
背景技术
行人检测具有较为广泛的应用领域,可以应用在无人驾驶、视频监控与安防、搜索营救等领域,主要是指对于视频或者图片中的行人目标进行类别判断以及定位的过程。
然而,在实际场景中,行人被遮挡在所难免,主要表现在行人与行人之间的遮挡以及行人被物体的遮挡,从而导致目前已有的行人检测算法在检测行人的时候出现很多漏检,因此,行人遮挡检测是行人检测领域中较为复杂的领域。
发明内容
本发明的目的是提供一种漏检率更低、效果更好的基于深度学习的行人遮挡检测方法。
为了达到上述目的,本发明通过以下技术方案来实现:
一种基于深度学习的行人遮挡检测方法,包括如下步骤:
S1)获取行人坐标
获取带有行人坐标标签的数据集,数据集包括行人的全身部分及可见部分的坐标位置;
S2)数据预处理
S2-1)对于采集的行人数据的全身部分进行无锚点数据预处理;具体地,将行人标注的左上角、右下角坐标进行格式转化,转化为行人的中心点及行人的高度信息,其中,行人的宽度信息可根据高度:宽度=2.44:1来获取;
采用二维高斯掩码的方式对正样本提取中心点,如果中心点有重叠部分,选择重叠部分的最大值,公式为:
(1);
其中,G表示高斯函数,表示高斯掩码的最大值,表示行人的中心点坐标,表示行人宽和高的方差,表示行人的像素坐标;G的公式为:
(2);
S2-2)对于采集的行人数据的可见部分进行遮挡扩充处理;具体地,将行人的身体部位拆分为四个部分:左上半身、右下半身、左腿和右腿,并对这四个部分中的某一个部分以0.5为阈值随机遮挡;
S2-3)数据增强,包括随机色彩变换、水平翻转、随机尺寸变换等处理;
S3)对图像进行特征提取
S3-1)对深度残差网络类中的ResNet50基础网络进行改进;具体地,将原ResNet50的第一到第四阶段每个阶段的特征图都下采样2倍,共下采样16倍,在第五阶段卷积层添加空洞卷积模块,对第五阶段的特征图下采样16倍;
S3-2)对改进的精炼神经网络RefineNet的特征融合模块TCB进一步改进,减少特征融合模块TCB的下采样次数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911131589.8/2.html,转载请声明来源钻瓜专利网。





