[发明专利]一种目标检测模型的训练方法、目标检测方法及相关装置有效
申请号: | 202210188209.X | 申请日: | 2022-02-28 |
公开(公告)号: | CN114266945B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 李峰;张浩;刘世隆;张磊 | 申请(专利权)人: | 粤港澳大湾区数字经济研究院(福田) |
主分类号: | G06V10/778 | 分类号: | G06V10/778;G06V10/764;G06V10/30;G06V10/774 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 温宏梅 |
地址: | 518045 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目标 检测 模型 训练 方法 相关 装置 | ||
1.一种目标检测模型的训练方法,其特征在于,所述的训练方法包括:
对训练图片的标注信息执行预设次数的添加噪声操作,以得到预设数量的噪声标注信息,其中,所述标注信息包括目标框和所述目标框对应的目标类别;
根据噪声标注信息生成的去噪组,以得到预设数量的去噪组;
基于预设数量的去噪组、初始化生成的匹配组以及所述训练图片,对目标检测模型进行训练,其中,所述匹配组是初始化生成的包括若干匹配查询向量的向量组,所述匹配查询向量是可学习的查询向量;
其中,所述添加噪声操作包括对目标框的添加框噪声操作和/或对目标类别添加类别噪声操作;所述标注信息包括多个目标框,所述添加噪声操作为分别对多个目标框中的每个目标框执行添加框噪声操作,以及分别对每个目标框对应的目标类别执行添加类别噪声操作;
所述目标检测模型是基于Transformer的目标检测模型,包括编码模块和解码模块;
所述基于预设数量的去噪组、初始化生成的匹配组以及所述训练图片,对目标检测模型进行训练具体包括:基于所述训练图片及所述目标检测模型的编码模块生成若干特征图块;基于所述若干特征图块、预设数量的去噪组、初始化生成的匹配组及所述目标检测模型的解码模块,生成预测信息;基于所述预测信息和所述标注信息对目标检测模型的训练进行调整;
所述基于所述若干特征图块、预设数量的去噪组、初始化生成的匹配组及所述目标检测模型的解码模块,生成预测信息具体包括:基于预设数量的去噪组和初始化生成的匹配组确定注意力掩码矩阵;将若干特征图块、预设数量的去噪组、初始化生成的匹配组以及注意力掩码矩阵输入所述目标检测模型的解码模块,通过所述解码模块输出预测信息。
2.根据权利要求1所述的目标检测模型的训练方法,其特征在于,所述预设数量的噪声标注信息中的各噪声标注信息互不相同。
3.根据权利要求1所述的目标检测模型的训练方法,其特征在于,所述目标框包括目标框中心点坐标、目标框宽度和目标框高度;所述对目标框添加框噪声操作具体包括:
为所述目标框随机生成目标框噪声,其中,目标框噪声包括目标框中心点坐标噪声、目标框宽度噪声和目标框高度噪声中的一种或者多种;
基于所述目标框噪声对所述目标框进行调整,以得到噪声目标框。
4.根据权利要求3所述的目标检测模型的训练方法,其特征在于,所述目标框中心点坐标噪声中的x轴坐标的绝对值小于,目标框中心点坐标噪声中的y轴坐标的绝对值小于;目标框宽度噪声的绝对值小于,目标框高度噪声的绝对值小于,其中,和均为0-1间的数值,表示目标框宽度,表示目标框高度。
5.根据权利要求1所述的目标检测模型的训练方法,其特征在于,所述对目标类别添加类别噪声操作具体包括:
按照预设概率将所述目标类别替换为噪声类别,其中,所述噪声类别包含于所述训练图片所属的训练样本集对应的类别集合内,并且所述噪声类别所述目标类别不同。
6.根据权利要求1所述的目标检测模型的训练方法,其特征在于,所述根据噪声标注信息生成去噪组,以得到预设数量的去噪组具体包括:
将所述噪声标注信息中的噪声目标框转换为噪声目标框向量,并将所述噪声目标框对应的噪声类别转换为噪声类别向量;
将所述噪声目标框向量与所述噪声类别向量连接生成去噪查询向量,根据生成的去噪查询向量形成去噪组。
7.根据权利要求1所述的目标检测模型的训练方法,其特征在于,所述预测信息包括各去噪组各自对应的第一预测信息和所述匹配组对应的第二预测信息,其中,所述第二预测信息为通过匈牙利匹配所得到的。
8.根据权利要求1所述的目标检测模型的训练方法,其特征在于,所述目标检测模型的解码模块配置有注意力机制,其中,所述若干特征图块为注意力机制中的key值和value值;所述去噪组、初始化生成的匹配组以及注意力掩码矩阵为注意力机制中的查询向量值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于粤港澳大湾区数字经济研究院(福田),未经粤港澳大湾区数字经济研究院(福田)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210188209.X/1.html,转载请声明来源钻瓜专利网。