[发明专利]行人检测网络及模型训练方法、检测方法、介质、设备有效

专利信息
申请号: 201910198487.1 申请日: 2019-03-15
公开(公告)号: CN110008853B 公开(公告)日: 2023-05-30
发明(设计)人: 胡永健;陈浩;刘琲贝 申请(专利权)人: 华南理工大学;中新国际联合研究院
主分类号: G06V40/10 分类号: G06V40/10;G06V10/764;G06V10/82;G06N3/0464;G06N3/08
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 黄磊
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 行人 检测 网络 模型 训练 方法 介质 设备
【说明书】:

发明公开了一种行人检测网络,以VGG16为基础网络,包括fc6、fc7、conv6_2、conv7_2和conv8_2五个特征层。本发明还公开一种行人检测网络模型训练方法,包括步骤:计算行人框宽高比的期望值E;特征提取,得到置信度图和坐标偏置图;制定密集框生成策略;对训练数据文件进行预处理,训练行人检测网络得到行人检测网络模型。本发明还公开了一种行人检测方法,包括步骤:设置检测阈值,加载行人检测网络模型,初始化网络参数;将图片送入模型中,得到检测结果;将所有的检测框通过非极大值抑制对重复检测的框进行滤除,最后将结果保存在文件中。本发明基于密集框生成网络,有效地克服了现有技术在行人密集场景下漏检率高等缺点,提升该框架在行人密集场景下的检测性能。

技术领域

本发明涉及深度学习及行人检测领域,具体涉及一种密集行人检测网络及模型训练方法、密集行人检测方法、介质、设备。

背景技术

大数据时代的到来,带来了重大的时代转型,从科学研究到医疗保险,从银行业到互联网,科技信息技术产业都在不断的发展。特别是最近几年,人工智能开始进入人们的视野。人工智能是研究如何用计算机来模拟人脑的思维方式并作出决策的学科,其领域包括智能机器人、计算机视觉、自然语言处理和专家系统等。计算机视觉作为人工智能的一个重要研究领域,一直以来都是学术界和工业界研究的热点。计算机视觉技术就是教会计算机如何看懂和理解世界,其有很多应用场景。比如智能监控系统、无人驾驶汽车、智能机器人等。其中智能视频监控系统逐步成为图像智能分析中的一项重要应用领域和研究方向。

近年来,随着深度学习研究的火热,一批基于深度学习的目标检测方法也相继出现。2014年Girshick等人在CVPR会议上发表论文《Rich Feature Hierarchies forAccurate Object Detection and Semantic Segmentation》,提出了“候选窗口生成+对候选框提取特征分类”的目标检测两步法,大大提升了PASCAL VOC数据集上的检测精度。虽然R-CNN在精确度上有较大的提升,但是其缺点非常明显,就是速度较慢。随后,Girshick等人又于2015年发表论文《Faster R-CNN:towards real-time object detection withregion proposal networks》,Faster R-CNN摈弃了之前目标检测的通用模式(候选窗口生成+对候选框提取特征分类),采取了一种全新的,一种名为RPN(Region ProposalNetworks)网络生成候选区域的方法,提升了速度还有候选框的召回率。2016年,Redmon等人在CVPR会议上发表论文《You Only Look Once:Unified,Real-Time ObjectDetection》,提出YOLO目标检测方法,该方法使用了回归的思想,给定输入图像,直接在图像的多个位置上回归出这个位置的目标边框以及目标类别,这样大大提升了目标检测的速度,但是检测精度并不是很好。同年,Liu等人在ECCV会议上发表论文《SSD:Single ShotMultiBox Detector》,其在YOLO模型的基础上进行改进,提升了检测精度的同时,保持了实时检测的速度要求。针对密集行人检测,Felzenszwalb提出的一种基于可变形部件模型(Deformable Part Model,DPM)的目标检测算法,由于可变部件模型的使用,该算法对于目标的形变问题具有很强的鲁棒性,目前已成为众多检测器、人体姿态、图像分割和行为分类的重要部分。但是,DPM是手工设计的特征,目前很多针对密集行人检测的方法也还是停留在传统手工特征和手工特征与卷积神经网络相结合的方法,相较于深度学习的方法,显得检测性能不足,而Faster R-CNN、YOLO、SSD等目标检测算法直接用于密集检测也存在性能下降的问题。究其原因,是因为密集行人出现的场景下,行人之间相互遮挡,不同行人之间的特征存在太多相似性,会影响检测器的判断。

发明内容

本发明提供一种行人检测网络及模型训练方法、检测方法、介质、设备,该行人检测方法为基于密集框生成网络的密集行人检测方法,有效地克服了现有技术在行人密集场景下漏检率高等缺点,提升该框架在行人密集场景下的检测性能。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学;中新国际联合研究院,未经华南理工大学;中新国际联合研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910198487.1/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top