[发明专利]一种目标检测方法及装置有效
申请号: | 201711001606.7 | 申请日: | 2017-10-24 |
公开(公告)号: | CN109697397B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 杨文鲜;刘昕冉;张翠翠 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/34;G06K9/62 |
代理公司: | 北京领科知识产权代理事务所(特殊普通合伙) 11690 | 代理人: | 张丹 |
地址: | 310052 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目标 检测 方法 装置 | ||
1.一种目标检测方法,用于将标注有初始边界框的初始图像中包含兴趣目标的图像分割出来,其特征在于,包括:
获取初始图像,所述初始图像中对兴趣目标标注有初始边界框;
将所述初始图像输入预先训练的回归模型,得到所述回归模型输出的包含调整后边界框的待分割图像,所述回归模型为利用标注有兴趣目标的真实边界框及标注有兴趣目标的初始边界框的训练图像进行预训练得到,所述回归模型的预训练过程,包括:获取标注有兴趣目标的真实边界框及标注有兴趣目标的初始边界框的训练图像;利用所述训练图像对回归模型进行训练,以使得回归模型输出的对所述初始边界框调整后的边界框与所述真实边界框的位置重合度满足设定条件;
将所述待分割图像中所述调整后边界框所包含的图像分割出来,作为包含所述兴趣目标的待分类图像。
2.根据权利要求1所述的方法,其特征在于,所述训练图像中标注有兴趣目标的初始边界框包括:
对兴趣目标的真实边界框进行位置扰动后得到的边界框。
3.根据权利要求1-2任一项所述的方法,其特征在于,还包括:
利用预先训练的分类模型,确定所述待分类图像所包含的兴趣目标的类别,所述分类模型为预先利用标记有分类类别的训练图像进行训练得到。
4.根据权利要求3所述的方法,其特征在于:
所述分类模型包括大尺寸兴趣目标分类模型和小尺寸兴趣目标分类模型;
所述大尺寸兴趣目标分类模型为利用标记有分类类别,且包含设定大尺寸级别的兴趣目标的训练图像进行训练得到;
所述小尺寸兴趣目标分类模型为利用标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像进行训练得到;
所述利用预先训练的分类模型,确定所述待分类图像所包含的兴趣目标的类别,包括:
若各待分类图像中仅存在属于设定大尺寸级别的兴趣目标,则利用所述大尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别;
若各待分类图像中仅存在属于设定小尺寸级别的兴趣目标,则利用所述小尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别。
5.根据权利要求4所述的方法,其特征在于,利用预先训练的分类模型,确定所述待分类图像所包含的兴趣目标的类别,还包括:
若各待分类图像中同时存在属于设定大尺寸级别和设定小尺寸级别的兴趣目标,则首先利用所述大尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别;然后对于大尺寸兴趣目标分类模型确定的类别属于噪声的目标待分类图像,利用所述小尺寸兴趣目标分类模型,确定所述目标待分类图像所包含的兴趣目标的最终分类类别。
6.根据权利要求4或5所述的方法,其特征在于,利用标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像训练得到小尺寸兴趣目标分类模型的过程,包括:
将标记有分类类别,且包含设定小尺寸级别的兴趣目标的训练图像在其所属初始图像上,按照设定比例进行边界外扩,将边界外扩后的训练图像及所述训练图像作为输入训练图像对;
利用输入训练图像对,对小尺寸兴趣目标分类模型进行训练;
所述利用所述小尺寸兴趣目标分类模型,确定所述待分类图像所包含的兴趣目标的类别,包括:
在所述初始图像中,将所述待分类图像的边界按照设定比例外扩,得到边界外扩后的待分类图像;
将所述待分类图像及其边界外扩后的待分类图像共同输入所述小尺寸兴趣目标分类模型,以得到小尺寸兴趣目标分类模型输出的所述待分类图像所包含的兴趣目标的类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711001606.7/1.html,转载请声明来源钻瓜专利网。