[发明专利]优化行人检测模型的训练数据集的方法、装置及存储介质在审
申请号: | 202011120107.1 | 申请日: | 2020-10-19 |
公开(公告)号: | CN112232225A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 张武强;王宝锋;支蓉;郭子杰 | 申请(专利权)人: | 戴姆勒股份公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 北京永新同创知识产权代理有限公司 11376 | 代理人: | 杨胜军 |
地址: | 德国斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 优化 行人 检测 模型 训练 数据 方法 装置 存储 介质 | ||
本发明提出了一种用于优化用于行人检测模型的训练数据集的方法,所述方法包括:获取原始的行人数据,原始的行人数据至少包括图像数据、行人位置数据和边界框尺寸数据;获取原始的行人数据的数据分布特性;利用原始的行人数据训练行人检测模型,从而获得原始检测结果;利用原始的行人数据训练数据生成模型,数据生成模型为生成式模型;根据数据分布特性和原始检测结果,利用数据生成模型生成具有特定的边界框尺寸数据的行人数据作为附加的行人数据;基于原始的行人数据和附加的行人数据,构建用于行人检测模型的训练数据集。本发明还涉及相应的优化装置和计算机可读存储介质。通过本发明,能够优化训练数据集,以获得准确性更高的行人检测模型。
技术领域
本发明涉及一种用于优化用于行人检测模型的训练数据集的方法、一种用于优化用于行人检测模型的训练数据集的优化装置以及一种计算机可读存储介质。
背景技术
基于计算机视觉的行人检测技术可通过处理摄像头采集到的图像或视频信息对行人的位置等进行检测。行人检测具有极其重大的意义,它是车辆辅助驾驶、车辆自动驾驶、智能视频监控和人体行为分析等应用中的关键技术。近年来,行人检测技术越来越受到学术界和工业界的重视。
传统的行人检测主要通过HOG+SVM来实现,即提取图片的HOG(Histogram ofOriented Gradient)特征并利用支持向量机(SVM)进行分类。这种方法使用人工特征来统计计算图像的梯度方向直方图结合SVM分类器来检测行人,虽然它在直立姿态行人图像上取得不错的效果,但是在行人相互遮挡以及非直立状态下效果不好,泛化能力较差。近些年,卷积神经网络在图像识别检测领域产生越来越好的结果,RCNN(Regions with CNNfeatures)等一系列目标检测模型的精度远远超过传统方法。
然而,目前以数据驱动为基础的深度学习行人检测方法在自动驾驶场景下依旧面临一些问题。例如,基于原始的行人数据训练得到的行人检测模型对于某些特殊姿态的行人的检测结果不够准确。可能发生边界框作为检测结果无法完整包含张开的四肢而导致行人重要的姿态信息丢失的情况。
现有技术在行人检测模型的准确性方面仍然存在诸多不足。
发明内容
本发明的目的在于提供一种改进的用于优化用于行人检测模型的训练数据集的方法以及相应的优化装置和计算机可读存储介质,从而优化用于行人检测模型的训练数据集,以获得准确性更高的行人检测模型。
根据本发明的第一方面,提供了一种用于优化用于行人检测模型的训练数据集的方法,其中,所述方法包括下述步骤:
获取原始的行人数据,所述原始的行人数据至少包括图像数据、行人位置数据和边界框尺寸数据;
获取原始的行人数据的数据分布特性;
利用原始的行人数据训练行人检测模型,从而获得原始检测结果;
利用原始的行人数据训练数据生成模型,所述数据生成模型为生成式模型;
根据数据分布特性和原始检测结果,利用数据生成模型生成具有特定的边界框尺寸数据的行人数据作为附加的行人数据;以及
基于原始的行人数据和附加的行人数据,构建用于行人检测模型的训练数据集。
根据本发明的一个实施例,所述方法还包括下述步骤:
针对边界框尺寸对原始检测结果进行评估,获得检测准确度相对较低的边界框尺寸;以及
根据检测准确度相对较低的边界框尺寸,确定所述特定的边界框尺寸数据。
根据本发明的一个实施例,检测准确度相对较低的边界框尺寸被确定为检测准确度低于平均检测准确度的边界框尺寸。
根据本发明的一个实施例,所述方法还包括下述步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于戴姆勒股份公司,未经戴姆勒股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011120107.1/2.html,转载请声明来源钻瓜专利网。