[发明专利]一种伪标签框生成方法、装置及电子设备在审
申请号: | 202210464331.5 | 申请日: | 2022-04-29 |
公开(公告)号: | CN114973064A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 万方;邵滨;廖明祥;许松岑;叶齐祥 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/46;G06V10/764 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 郭建凯;陈霁 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 标签 生成 方法 装置 电子设备 | ||
1.一种伪标签框生成方法,其特征在于,所述方法包括:
确定目标图像中各个目标的类别,以得到N个类别;
基于所述N个类别,对所述目标图像进行处理,以得到N个注意力图,其中,每个所述注意力图均与所述N个类别中的一个类别相关联,每个所述注意力图均用于呈现所述目标图像中一个类别的目标;
基于所述N个注意力图,得到所述目标图像中各个目标的伪标签框。
2.根据权利要求1所述的方法,其特征在于,所述对所述目标图像进行处理,以得到N个注意力图,具体包括:
基于C个第一标记,并通过注意力机制,对所述目标图像中进行处理,以得到C个注意力图和C个类别的分类得分,每个所述第一标记均用于对一个类别的语义进行学习,C≥N;
基于所述C个类别的分类得分,从所述C个注意力图中筛选出所述N个注意力图,其中,与所述N个注意力图相关联的每个类别的分类得分均高于预设分数阈值。
3.根据权利要求1或2所述的方法,其特征在于,所述基于所述N个注意力图,得到所述目标图像中各个目标的伪标签框之后,所述方法还包括:
针对任意一个伪标签框,调整所述任意一个伪标签框在至少一个方向上的尺寸,以得到目标伪标签框,所述目标伪标签框内包含有一个完整的目标。
4.根据权利要求1-3任一所述的方法,其特征在于,所述基于所述N个注意力图,得到所述目标图像中各个目标的伪标签框,具体包括:
对所述N个注意力图中的每个注意力图均进行二值化处理,并利用连通域的方式对二值化处理后的图像进行处理,得到所述目标图像中各个目标的伪标签框。
5.根据权利要求1-4任一所述的方法,其特征在于,所述方法还包括:
对所述目标图像中所包含的目标进行检测,以得到预测标签框集合,所述预测标签框集合中包括所述目标图像中各个目标的预测标签框;
基于伪标签框集合和所述预测标签框集合,对目标检测模型进行训练,所述伪标签框集合中包括所述目标图像中各个目标的伪标签框。
6.根据权利要求5所述的方法,其特征在于,所述基于伪标签框集合和所述预测标签框集合,对目标检测模型进行训练,具体包括:
基于所述伪标签框集合中的各个伪标签框,从所述预测标签框集合中选取x个预测标签框,x的取值与所述伪标签框的数量相等,所述x个预测标签框中的中每个标签框均与所述伪标签框集合中的一个伪标签框相关联;
基于所述伪标签框集合中的伪标签框和所述x个预测标签框,更新所述目标检测模型中第一网络和第二网络的网络参数,所述第一网络用于得到所述伪标签框集合,所述第二网络用于得到所述预测标签框集合。
7.一种伪标签框生成装置,其特征在于,所述装置包括:
确定模块,用于确定目标图像中各个目标的类别,以得到N个类别;
处理模块,用于基于所述N个类别,对所述目标图像进行处理,以得到N个注意力图,其中,每个所述注意力图均与所述N个类别中的一个类别相关联,每个所述注意力图均用于呈现所述目标图像中一个类别的目标;
所述处理模块,还用于基于所述N个注意力图,得到所述目标图像中各个目标的伪标签框。
8.根据权利要求7所述的装置,其特征在于,所述处理模块在对所述目标图像进行处理,以得到N个注意力图时,具体用于:
基于C个第一标记,并通过注意力机制,对所述目标图像中进行处理,以得到C个注意力图和C个类别的分类得分,每个所述第一标记均用于对一个类别的语义进行学习,C≥N;
基于所述C个类别的分类得分,从所述C个注意力图中筛选出所述N个注意力图,其中,与所述N个注意力图相关联的每个类别的分类得分均高于预设分数阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210464331.5/1.html,转载请声明来源钻瓜专利网。