[发明专利]一种港口场景下的行人检测方法、装置、设备及介质有效
| 申请号: | 202010027137.1 | 申请日: | 2020-01-10 |
| 公开(公告)号: | CN113128308B | 公开(公告)日: | 2022-05-20 |
| 发明(设计)人: | 邹逸群;肖志红;吴志虎;唐琎;汤松林;张泳祥;邹双;李江涛 | 申请(专利权)人: | 中南大学 |
| 主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V40/10;G06V10/46;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 长沙市融智专利事务所(普通合伙) 43114 | 代理人: | 龚燕妮 |
| 地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 港口 场景 行人 检测 方法 装置 设备 介质 | ||
本发明公开了一种港口场景下的行人检测方法、装置、设备及介质,其方法为:获取若干已知行人框的预处理图像,计算行人框中心在行人检测网络输出端的映射值;在行人检测网络的所有预测框中,选择与映射值匹配的预测框为正样本,其余预测框为负样本;以预处理图像作为输入、预测框的标签值作为学习目标,训练行人检测网络,得到行人检测系统;计算负样本预测框与预处理图像中所有行人框的交并比,若最大值大于0.5,则该负样本不参与训练;将待检测的预处理图像输入到行人检测系统,提取检测框;去掉行人置信度低于阈值的检测框以及重叠框,剩余的检测框即为待检测的行人框。本发明可解决目前检测方法中需要人为设计anchor的问题。
技术领域
本发明属于图像信息处理领域,具体涉及一种港口场景下的行人检测的方法。
背景技术
行人检测技术是指通过图像处理及模式识别等算法从给定的图像数据中检测出行人坐标位置并给予此检测结果的置信度。行人检测是计算机视觉中一个重要的研究热点,是众多实际应用中核心技术之一,例如,人类行为分析,行人姿态估计,行人属性分析,智能监控,自动驾驶等。因此行人检测技术具有极高的科研价值和商业价值,并有大量的学者从事行人检测的研究,众多有效的行人检测算法被提出来。
尽管近几年计算机视觉研究者致力于行人检测的研究中,但是行人检测问题依旧挑战性很大。这主要是因为有两个原因:其一,由于行人与摄像机的距离是不固定的,行人的尺度有很大的变化;其二,在实际环境中,大部分的行人距离摄像机较远,这些小目标的特征不明显,容易被误认为是背景,从而造成大量的漏检和误检。
为了获取给定图片中所有行人的坐标,行人检测器通常有以下三步:第一,对整张图片进行一系列的操作(梯度计算,卷积等),获取对应的特征;其次,使用不同尺度和形状的预选框遍历整张图;最后基于预选框中的特征,判断其中是否存在行人目标,如存在目标则调整预选框的坐标和大小,从而得到最后的行人检测框。其中,提取特征这一步骤是行人检测技术中最重要的一步,所以,现如今主要的研究方法可以被分为两类:基于手工特征的方法和基于深度特征学习的方法。
基于手工特征的方法主要考虑了行人的先验信息,对输入图像进行一系列的计算和投影,然后得到行人特征。例如,HOG(Histogram ofOriented Gradient,方向梯度直方图算法),挖掘行人的形状信息。对图像进行不同的变化,颜色空间转换,梯度计算,边缘检测等(LUV,Gabor,edges),并提出利用积分通道特征将其融合,从而获得更丰富的特征集。DPM(Deformable Part Model,可变形部件模型的检测算法)针对人体部件建立一定形式的空间约束,根据模型与部件模型的共同作用检测人体目标。上述传统行人检测方法的优点是计算速度快且不需要昂贵的计算资源如GPU和大量内存。但是,虽然这些行人检测算法能够在简单的环境中达到应用要求,在实际复杂的环境中,存在大量的误检和漏检。
相比之下,基于深度学习的行人检测系统通过大量的数据自主学习得到具有强大语义表述能力的特征,从而显著性地降低误检和漏检率,使得行人技术能够应用于真实场景。目前基于深度学习的行人检测算法大致可分为两类,其中一类算法是两阶段行人检测算法,如RCNN、SPPNet、Faster RCNN、Mask RCNN等,这类算法在第一阶段使用RPN(RegionProposal Network)或者FPN(Feature PyramidNetwork)等预选框提取网络获取行人预选框,然后将第一阶段获得的行人预选框送入第二阶段网络进行二次分类和回归,两阶段行人检测算法的优点是性能好,能够满足大多数场景的性能需求,但缺点是速度慢,在对实时性有要求的场景下基本无法使用。另一类算法是一阶段行人检测算法,如YOLO、SSD、RetinaNet等,这类算法相当于两阶段算法的第一阶段,即直接使用一个网络回归出行人框,一阶段算法的优点是速度快,基本能够满足实时性要求,但性能不如两阶段算法。这两类算法都是基于anchor的,而使用anchor就存在需要人为设计的问题,目前的解决方法是在训练集上使用kmeans聚类出anchor,但这种聚类出来的anchor仍然不能跨数据集使用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010027137.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于割草机的切割刀片及割草机
- 下一篇:拍摄装置位置校正系统及方法





