[发明专利]目标检测方法、装置、电子设备和计算机可读介质在审
| 申请号: | 202011489172.1 | 申请日: | 2020-12-16 |
| 公开(公告)号: | CN112613544A | 公开(公告)日: | 2021-04-06 |
| 发明(设计)人: | 宋林;王剑锋;黎泽明 | 申请(专利权)人: | 北京迈格威科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 王婷婷 |
| 地址: | 100086 北京市海淀区科*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 目标 检测 方法 装置 电子设备 计算机 可读 介质 | ||
1.一种目标检测方法,其特征在于,所述方法包括:
对待测图像进行特征提取,得到多尺度的第一特征图;
将所述多尺度的第一特征图分别输入至预先训练的目标检测模型中的定位网络和类别检测网络,得到定位结果和第一类别检测结果;
将所述定位网络的其中一网络层输出的特征输入至所述目标检测模型中的三维最大值滤波网络,得到第二类别检测结果;
将所述第一类别检测结果和所述第二类别检测结果进行融合,并基于所述定位结果和融合后的类别检测结果,得到目标检测结果。
2.根据权利要求1所述的方法,其特征在于,所述定位网络与所述类别检测网络分别包括多个卷积层,所述三维最大值滤波网络与所述定位网络的其中一个卷积层相连接。
3.根据权利要求1或2所述的方法,其特征在于,所述三维最大值滤波网络包括第一卷积层、三维最大值滤波层、归一化层和第二卷积层。
4.根据权利要求3所述的方法,其特征在于,所述将所述定位网络的其中一网络层输出的特征输入至所述目标检测模型中的三维最大值滤波网络,得到第二类别检测结果,包括:
将所述定位网络的其中一网络层输出的特征输入至所述第一卷积层,得到多尺度的第二特征图;
将所述多尺度的第二特征图输入至所述三维最大值滤波层,得到多尺度的第三特征图;
将所述多尺度的第一特征图和所述多尺度的第三特征图融合后输入至所述归一化层,并将所述归一化层输出的特征输入至所述第二卷积层,得到第二类别检测结果。
5.根据权利要求4所述的方法,其特征在于,所述三维最大值滤波层通过如下步骤生成所述多尺度的第三特征图:
依次将第二特征图的每个尺度作为目标尺度,执行如下步骤:
对除所述目标尺度外的其余至少一个尺度的第二特征图进行双线性插值,以将所述其余至少一个尺度转换为所述目标尺度;
对所述目标尺度的第二特征图进行三维最大池化处理,得到所述目标尺度的第三特征图。
6.根据权利要求5所述的方法,其特征在于,所述对除所述目标尺度外的其余至少一个尺度的第二特征图进行双线性插值,以将所述其余至少一个尺度转换为所述目标尺度,包括:
确定所述目标尺度的相邻尺度;
对所述相邻尺度的三维特征图进行双线性插值,以将所述相邻尺度的三维特征图的尺度转换为所述目标尺度。
7.根据权利要求1-6之一所述的方法,其特征在于,所述第一类别检测结果和所述第二类别检测结果均为多通道的特征图,所述多通道中的每一通道对应一个类别;
以及,所述将所述第一类别检测结果和所述第二类别检测结果进行融合,包括:
将同一类别对应的特征图按元素相乘。
8.根据权利要求1-7之一所述的方法,其特征在于,所述目标检测模型通过如下步骤训练得到:
获取样本集,所述样本集中包括已标注的图像样本;
将所述图像样本输入至所述基础模型,得到所述基础模型输出的多个候选检测结果,每个候选检测结果中包括类别检测结果和定位结果;
采用匈牙利算法从所述多个候选检测结果中选取目标检测结果;
基于所述目标检测结果和所述图像样本的标注,训练所述基础模型;
当所述基础模型训练完成时,将训练后的基础模型确定为目标检测模型。
9.根据权利要求8所述的方法,其特征在于,所述基于所述检测目标和所述图像样本的标注,训练所述基础模型,包括:
基于所述目标检测结果、所述图像样本的标注以及预设的第一损失函数,确定第一损失值;
基于所述基础模型输出的类别检测结果、所述图像样本的标注以及预设的第二损失函数,确定第二损失值;
基于所述第一损失值和所述第二损失值,训练所述基础模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011489172.1/1.html,转载请声明来源钻瓜专利网。





