[发明专利]物体检测方法、装置和电子设备在审

专利信息
申请号: 201611244381.3 申请日: 2016-12-29
公开(公告)号: CN108229514A 公开(公告)日: 2018-06-29
发明(设计)人: 王昌宝;闫俊杰 申请(专利权)人: 北京市商汤科技开发有限公司
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 北京天健君律专利代理事务所(普通合伙) 11461 代理人: 姚远达;刘洁
地址: 100084 北京市海淀区中*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 物体检测 像素 表象特征 电子设备 图像 空间上下文 上下文信息 所述空间 传统的 候选框 检测 算法
【说明书】:

发明实施例提供了一种物体检测方法、装置和电子设备,其中,所述物体检测方法包括:获取待检测的图像中的多个超像素;提取每个超像素的表象特征和多个超像素之间的空间上下文信息;根据所述表象特征和所述空间上下文信息,确定所述图像包括的至少一个物体的类别和/或位置。通过本发明实施例,基于超像素进行物体检测,能够自然地检测到传统的候选框产生算法漏掉的物体,可以有效提高物体检测的准确性。

技术领域

本发明实施例涉及人工智能技术领域,尤其涉及一种物体检测方法、装置和电子设备。

背景技术

随着物体检测技术的发展,物体检测为其他的很多高层计算机视觉问题的解决提供了方案,成为解决计算机视觉问题,比如图片搜索、人脸识别、跟踪以及行为识别等的基础。

目前,物体检测大部分的工作是把物体检测问题转化成图像分类物体的问题。这一过程往往是先产生一个候选的物体区域,也即候选框,然后接着去独立地分类这些候选框。例如,利用滑动窗口采样多个尺度和位置来得到大约每张图片100000个候选框,或者,根据图像特征来聚类或者分割得到每张图片大概2000个候选框;然后,再用图片分类技术来分类各个候选框;进而,根据分类结果获得物体检测的结果。

然而,上述先获得候选框再进行图像分类的方法中,因为现有产生候选框的方式很难保证图像中的每个物体都被覆盖到,如果一个物体在候选框产生步骤中被漏掉,那么这个物体就再也不可能被检测出来。因此,如何尽可能地避免漏检物体,进而提高物体检测的准确性,成为本领域技术人员亟待解决的问题。

发明内容

本发明实施例提供了一种能量函数训练方案和一种物体检测方案。

根据本发明实施例的一个方面,提供了一种物体检测方法,包括:获取待检测的图像中的多个超像素;提取每个超像素的表象特征和多个超像素之间的空间上下文信息;根据所述表象特征和所述空间上下文信息,确定所述图像包括的至少一个物体的类别和/或位置。

可选地,所述提取每个超像素的表象特征和多个超像素之间的空间上下文信息;根据所述表象特征和所述空间上下文信息,确定物体类别,包括:通过能量函数提取每个超像素的表象特征和多个超像素之间的空间上下文信息;并根据所述表象特征和所述空间上下文信息,确定物体类别和/或位置。

可选地,在所述获取进行了超像素分割后的待检测的物体图像中的多个超像素之前,所述方法还包括:获取用于训练的样本图像,其中,所述样本图像中包含有分割后的超像素的信息;使用所述样本图像训练所述能量函数。

可选地,使用所述样本图像训练所述能量函数,包括:使用所述样本图像、并基于区域卷积神经网络RCNN和设定的目标函数训练能量函数,直至所述能量函数对所述样本图像中的超像素的标注满足设定的训练终止条件;其中,所述能量函数包括以下数据代价项、平滑代价项、和标签代价项中的任一种或任一种以上的组合;所述数据代价项用于建模超像素的表象,所述平滑代价项用于建模超像素之间的空间上下文关系,所述标签代价项用于对超像素的标注数目进行惩罚;所述RCNN用于获取所述样本图像中设定类别的检测框并对所述设定类别的检测框进行分类;分类的结果被作为所述能量函数对超像素的初始标注;所述目标函数用于训练所述能量函数各个代价项的权重参数。

可选地,所述使用RCNN和设定的目标函数训练能量函数,直至所述能量函数对所述样本图像中的超像素的标注满足设定的训练终止条件,包括:通过所述RCNN对所述用于训练的样本图像进行检测,获取设定类别的目标对象检测框,和所述目标对象检测框的分类结果;将所述分类结果作为所述目标对象检测框对应的超像素的初始标注;根据所述初始标注和所述目标函数,确定所述能量函数的各个代价项的权重参数的初始权重;根据所述初始权重确定所述能量函数;根据确定的所述能量函数对所述目标对象检测框对应的超像素进行标注训练的结果,调整所述能量函数的权重参数,直至所述能量函数对所述样本图像中的超像素的标注满足设定的训练终止条件。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611244381.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top