[发明专利]一种基于深度学习的行人检测方法在审
申请号: | 202110420061.3 | 申请日: | 2021-04-19 |
公开(公告)号: | CN113033478A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 卢立晖;索婕;王化建;张立华;司鹏程;丁明亮;李磊;张正强 | 申请(专利权)人: | 曲阜师范大学;日照汇联众创智能技术研究院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京睿智保诚专利代理事务所(普通合伙) 11732 | 代理人: | 韩迎之 |
地址: | 276826 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 行人 检测 方法 | ||
本发明公开了一种基于深度学习的行人检测方法,属于深度学习及行人检测技术领域,包括以下步骤:基于传统SSD行人检测模型采用ResNet、VoVNet,K‑means聚类进行优化,解决了SSD算法存在行人密集或遮挡以及行人姿态过小导致的漏检、误检问题,提高了行人检测的准确性、实时性和小目标行人检测性能。
技术领域
本发明涉及深度学习及行人检测技术领域,更具体的说是涉及一种基于深度学习的行人检测方法。
背景技术
行人检测是计算机视觉领域中的一个重要研究分支,主要任务是判断输入的图像或视频序列中是否出现行人,并确定其位置。行人检测技术广泛地应用于视频监控、车辆辅助驾驶、智能机器人等多个领域。
目前,计算机视觉技术飞速发展,行人检测作为其重要研究领域也得了巨大的进步,逐渐趋于实际应用。随着深度学习算法在行人检测中的研究和应用,在卷积神经网络基础上衍生出了一系列深度学习行人检测算法。相比于传统检测算法,深度学习算法有更强的鲁棒性及泛化能力,能够更快、更准的检测到行人目标。得益于行人检测理论的不断创新和优化,行人检测为智能监控、无人驾驶等方面提供了技术支撑,有巨大的应用价值。
但是,实际监控场景中,目前的行人检测算法人仍存在行人的误检和漏检问题,且容易受到遮挡、行人姿态和尺度变化等因素的影响,检测性能有待于进一步加强。
因此,如何实现一种基于深度学习的行人检测方法是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种基于深度学习的行人检测方法,本发明的目的在于针对SSD算法存在行人密集或遮挡以及行人姿态过小导致的漏检、误检和耗费时间较长的问题,对SSD算法进行了优化,提供一种基于深度学习的行人检测方法,用以提高行人检测的精度、速度以及小目标行人检测性能。
为了实现上述目的,本发明采用如下技术方案:
一种基于深度学习的行人检测方法,包括:
S100:获取带有行人目标的样本数据集,并对所述样本数据集进行预处理;
S200:搭建SSD行人检测模型,并对所述SSD行人检测模型进行优化,得到优化后的SSD行人检测模型;
S300:将经过所述步骤S100预处理得到的样本数据集送入优化后的SSD行人检测模型进行训练,产生预选框,并经过处理得到检测框;
S400:利用所述检测框对所述样本数据集中的行人目标进行检测,将所述检测结果输出并显示。
优选的,在进行步骤S300时先对样本数据集进行K-means聚类,得到所述预选框的最佳宽高比,包括:
S10:设定k个聚类中心,设聚类中心的坐标为(Wi,Hi),计算每个所述预选框和每个聚类中心的距离,并将所述预选框分配给最近的聚类中心,具体表达式为:
d=1-IOU[(xj,yj,wj,hj),(xj,yj,Wj,Hj)]
j∈{1,2,…,N},i∈{1,2,…,k}
其中d为聚类中心距离,(xj,yj,wj,hj)为真实框的对应坐标,IOU为两框之间的交并比,N是预选框的数量,k为聚类中心点数量;
S20:预选框分配完成之后,重新计算每个簇的聚类中心点,即计算全部所述预选框的宽和高的平均值,具体的表达式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曲阜师范大学;日照汇联众创智能技术研究院,未经曲阜师范大学;日照汇联众创智能技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110420061.3/2.html,转载请声明来源钻瓜专利网。