[发明专利]目标检测方法、目标检测模型的训练方法及其装置在审
申请号: | 202110721018.0 | 申请日: | 2021-06-28 |
公开(公告)号: | CN113591567A | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 张为明 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张梦瑶 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 检测 方法 模型 训练 及其 装置 | ||
1.一种目标检测方法,包括:
获取待处理的图像,并提取所述图像中的图像特征;
基于所述图像特征,预测所述图像中的各个部位属性组,其中,所述部位属性组中包括至少两个部位的属性信息,所述至少两个部位属于同一个目标;
根据各个所述部位属性组,生成所述图像的目标检测结果。
2.根据权利要求1所述的方法,其中,所述提取所述图像中的图像特征,包括:
提取所述图像在多个维度上的维度特征;
对所述多个维度上的维度特征进行融合处理,得到所述图像特征。
3.根据权利要求1或2所述的方法,其中,所述提取所述图像中的图像特征,包括:
采用目标检测模型中的主干网络层+融合网络层,提取所述图像特征,其中,所述主干网络层用于提取所述图像中多个维度上的维度特征,所述融合网络层用于对所述多个维度上的维度特征进行融合处理。
4.根据权利要求3所述的方法,其中,所述主干网络层为残差网络层;
所述融合网络层为特征图金字塔网络层。
5.根据权利要求1所述的方法,其中,所述基于所述图像特征,预测所述图像中的各个部位属性组,包括:
采用所述目标检测模型中的各个分支对所述图像特征进行预测处理,获取各个所述部位属性组,其中,每个分支用于预测一个部位属性组。
6.根据权利要求1所述的方法,其中,所述目标为车辆,所述部位包括以下属性中的至少一种:车灯、车窗、车轮。
7.一种目标检测模型的训练方法,包括:
获取初始的目标检测模型,其中,所述目标检测模型包括:用于提取图像中图像特征的主干网络层+融合网络层、以及各个分支;其中,每个分支用于结合所述图像特征预测所述图像中的一个部位属性组;所述部位属性组中包括至少两个部位的属性信息,所述至少两个部位属于同一个目标;
获取训练数据,其中,所述训练数据包括:样本图像、所述样本图像中各个样本目标上各个部位的属性信息;
以所述样本图像为输入,结合所述目标检测模型输出的各个预测目标上各个部位的预测属性信息以及所述样本图像中各个样本目标上各个部位的属性信息构建损失函数,对所述初始的目标检测模型进行训练。
8.一种目标检测装置,包括:
第一获取模块,用于获取待处理的图像,并提取所述图像中的图像特征;
预测模块,用于基于所述图像特征,预测所述图像中的各个部位属性组,其中,所述部位属性组中包括至少两个部位的属性信息,所述至少两个部位属于同一个目标;
生成模块,用于根据各个所述部位属性组,生成所述图像的目标检测结果。
9.根据权利要求8所述的装置,其中,所述第一获取模块,具体用于:
提取所述图像在多个维度上的维度特征;
对所述多个维度上的维度特征进行融合处理,得到所述图像特征。
10.根据权利要求8或9所述的装置,其中,所述第一获取模块,还用于:
采用目标检测模型中的主干网络层+融合网络层,提取所述图像特征,其中,所述主干网络层用于提取所述图像中多个维度上的维度特征,所述融合网络层用于对所述多个维度上的维度特征进行融合处理。
11.根据权利要求10所述的装置,其中,所述主干网络层为残差网络层;
所述融合网络层为特征图金字塔网络层。
12.根据权利要求8所述的装置,其中,所述预测模块,还用于:
采用所述目标检测模型中的各个分支对所述图像特征进行预测处理,获取各个所述部位属性组,其中,每个分支用于预测一个部位属性组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110721018.0/1.html,转载请声明来源钻瓜专利网。