[发明专利]一种复杂背景下目标检测方法、装置、设备及介质在审
申请号: | 202110790494.8 | 申请日: | 2021-07-13 |
公开(公告)号: | CN113469100A | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 张英;杨一帆 | 申请(专利权)人: | 北京航科威视光电信息技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/08 |
代理公司: | 北京科领智诚知识产权代理事务所(普通合伙) 11782 | 代理人: | 陈士骞 |
地址: | 100083 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 复杂 背景 目标 检测 方法 装置 设备 介质 | ||
1.一种复杂背景下目标检测方法,其特征在于,包括:
基于目标检测模型中的预设特征提取网络对输入图像进行特征提取,得到特征尺度依次递减的多个原始特征图;
基于目标检测模型中的特征融合单元,在所述多个原始特征图中,从设定尺度的原始特征图开始,进行特征信息增强操作,并将每次特征信息增强操作得到的融合特征图作为下次特征信息增强操作的基础,直到得到与特征尺度最大的原始特征图相同尺度的融合特征图;其中,所述特征信息增强操作包括对当前遍历的当前原始特征图上采样到与上一层原始特征图相同的尺度,并将上采样后的结果与所述上一层的原始特征图进行特征融合,得到融合特征图;其中,所述融合特征图的通道数与对应的原始特征图的通道数保持一致;
基于目标检测模型中的特征检测单元,对完成特征信息增强操作得到的多个融合特征图,设定尺度的原始特征图、以及所述多个原始特征图中未进行特征信息增强操作的其他原始特征图进行分类和回归,得到所述输入图像中不同尺度的目标物体的类别信息和位置信息。
2.根据所述权利要求1所述的方法,其特征在于,所述将上采样后的结果与所述上一层的原始特征图进行特征融合,包括:
采用加和Eltw Sum操作,将上采样后的特征图与所述当前原始特征图的上一层的原始特征图中对应位置的元素相加。
3.根据权利要求1所述的方法,其特征在于,所述目标检测模型还包括预测单元,连接在所述特征提取网络和所述特征检测单元之间,相应的,所述方法还包括:
基于所述预测单元,对完成特征信息增强操作得到的多个融合特征图,设定尺度的原始特征图、以及所述多个原始特征图中未进行特征信息增强操作的其他原始特征图中的任意一个特征图,进行通道数调整,得到特征信息增强后的增强特征图;相应的,
基于目标检测模型中的特征检测单元,对各增强特征图进行分类和回归,得到所述输入图像中不同尺度的目标物体的类别信息和位置信息。
4.根据权利要求3所述的方法,其特征在于,对完成特征信息增强操作得到的多个融合特征图,设定尺度的原始特征图、以及所述多个原始特征图中未进行特征信息增强操作的其他原始特征图中的任意一个特征图,进行通道数调整,包括:
对于完成特征信息增强操作得到的多个融合特征图,设定尺度的原始特征图、以及所述多个原始特征图中未进行特征信息增强操作的其他原始特征图中的任意一个特征图,均经过三次通道数调整,并将每次调整的结果进行拼接,得到拼接结果;其中,第一次通道数调整是利用1×1的卷积核进行;第二次通道数调整是先后利用1×1和3×3的卷积核进行;第三次通道数调整是先后依次利用1×1、3×3和3×3的卷积核进行;
对所述任意一个特征图经过1×1的通道数调整,得到第一特征序列;并将所述拼接结果再次经过1×1的通道数调整,得到第二特征序列;将第一特征序列和第二特征序列对应的元素进行相加,得到特征信息增强后的增强特征图。
5.根据权利要求3所述的方法,其特征在于,对各增强特征图进行分类和回归,得到所述输入图像中不同尺度的目标物体的类别信息和位置信息,包括:
在每个增强特征图上,确定目标物体对应的预测边界框的类别置信度和位置偏移;
通过非极大值抑制方法NNS,根据所述类别置信度和所述位置偏移,确定目标物体对应的目标类别和目标预测框。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航科威视光电信息技术有限公司,未经北京航科威视光电信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110790494.8/1.html,转载请声明来源钻瓜专利网。