[发明专利]目标检测方法和模型训练方法、装置、电子设备和介质有效

专利信息
申请号: 202011374453.2 申请日: 2020-11-30
公开(公告)号: CN112487979B 公开(公告)日: 2023-08-04
发明(设计)人: 叶晓青;谭啸;孙昊 申请(专利权)人: 北京百度网讯科技有限公司
主分类号: G06V20/54 分类号: G06V20/54;G06V10/44;G06V10/764;G06V10/82;G06N3/0464;G06N3/084
代理公司: 中科专利商标代理有限责任公司 11021 代理人: 范芳茗
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 目标 检测 方法 模型 训练 装置 电子设备 介质
【说明书】:

本申请公开了一种目标检测模型的训练方法和目标检测方法、装置、电子设备以及介质,涉及人工智能领域,尤其涉及计算机视觉和深度学习技术。目标检测模型的训练方法包括:获取样本数据,样本数据包括样本图像、样本图像中的对象在3D空间中的3D标定信息以及对象的高斯热力图;使用目标检测模型,根据样本图像产生对象在3D空间中的3D标定信息以及对象的高斯热力图;以及根据所产生的3D标定信息与样本数据中的3D标定信息之间的差异、以及所产生的高斯热力图与样本数据中的高斯热力图之间的差异,调整目标检测模型的参数。

技术领域

本申请涉及人工智能领域,尤其涉及计算机视觉和深度学习技术,更具体地,涉及目标检测方法和模型训练方法、装置、电子设备和介质。

背景技术

随着人工智能领域的快速发展,自动驾驶和智能机器人等技术应用也得到了极大的推进。其中,在技术实现过程中涉及对三维物体的检测任务,相关技术中,三维物体检测方法主要基于车载双目或雷达数据,或者基于二维图像直接通过网络预测三维信息。但是依赖双目的方法对深度估计的精度要求较高,计算复杂度高,无法满足实时性需求,依赖雷达的方法成本较高,且不能满足各种应用场景需求,检测精度也较低,现有的基于二维图像的预测方法不够准确。

发明内容

本申请提供了目标检测方法和模型训练方法、装置、电子设备和介质。

根据第一方面,本申请提供了一种目标检测模型的训练方法,包括:获取样本数据,上述样本数据包括样本图像、上述样本图像中的对象在3D空间中的3D标定信息以及上述对象的高斯热力图;使用上述目标检测模型,根据上述样本图像产生上述对象在3D空间中的3D标定信息以及上述对象的高斯热力图;以及根据所产生的3D标定信息与上述样本数据中的3D标定信息之间的差异、以及所产生的高斯热力图与上述样本数据中的高斯热力图之间的差异,调整上述目标检测模型的参数。

根据第二方面,本申请提供了一种目标检测方法,包括:使用目标检测模型来根据输入图像确定输入图像中的对象在3D空间中的3D包围框的尺寸、上述对象在3D空间中的朝向以及上述对象的高斯热力图,上述目标检测模型是根据上述的方法训练的;根据上述对象的高斯热力图计算上述3D包围框在上述3D空间中的位置;以及基于上述3D包围框在上述3D空间中的位置、上述3D包围框的尺寸以及上述对象的朝向,生成包围上述对象的3D包围框。

根据第三方面,本申请提供了一种目标检测模型的训练装置,包括:获取模块,用于获取样本数据,上述样本数据包括样本图像、上述样本图像中的对象在3D空间中的3D标定信息以及上述对象的高斯热力图;检测模块,用于使用上述目标检测模型,根据上述样本图像产生上述对象在3D空间中的3D标定信息以及上述对象的高斯热力图;以及调整模块,用于根据所产生的3D标定信息与上述样本数据中的3D标定信息之间的差异、以及所产生的高斯热力图与上述样本数据中的高斯热力图之间的差异,调整上述目标检测模型的参数。

根据第四方面,本申请提供了一种目标检测装置,包括:检测模块,用于使用目标检测模型来根据输入图像确定输入图像中的对象在3D空间中的3D包围框的尺寸、上述对象在3D空间中的朝向以及上述对象的高斯热力图,上述目标检测模型是根据上述的方法训练的;计算模块,用于根据上述对象的高斯热力图计算上述3D包围框在上述3D空间中的位置;以及标定模块,用于基于上述3D包围框在上述3D空间中的位置、上述3D包围框的尺寸以及上述对象的朝向,生成包围上述对象的3D包围框。

根据第五方面,本申请提供了一种电子设备,包括:至少一个处理器和与所述至少一个处理器通信连接的存储器。其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方法。

根据第六方面,本申请提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如上所述的方法。

根据第七方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011374453.2/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top