[发明专利]图像标签的确定方法、装置、电子设备和存储介质在审
申请号: | 202210143921.8 | 申请日: | 2022-02-16 |
公开(公告)号: | CN114494787A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 王粟瑶;梁俪倩 | 申请(专利权)人: | 北京地平线信息技术有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06K9/62;G06V10/774 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 李洪娟 |
地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 标签 确定 方法 装置 电子设备 存储 介质 | ||
1.一种图像标签的确定方法,包括:
获取第一图像数据;
基于训练获得的第一半监督语义分割模型对所述第一图像数据进行预测,获得对应的第一预测结果;所述第一预测结果包括所述第一图像数据对应的第一概率数据,所述第一概率数据包括所述第一图像数据中各第一像素分别属于各类型的概率;
基于所述第一概率数据,确定所述第一图像数据对应的第一伪标签数据,所述第一伪标签数据包括各所述第一像素所属的类型;
基于所述第一概率数据,确定各所述第一像素分别对应的第一置信度;
基于各所述第一像素分别对应的第一置信度及所述第一伪标签数据,确定所述第一图像数据对应的第一标签数据。
2.根据权利要求1所述的方法,其中,所述基于各所述第一像素分别对应的第一置信度及所述第一伪标签数据,确定所述第一图像数据对应的第一标签数据,包括:
基于各所述第一像素分别对应的第一置信度,确定所述第一图像数据对应的第二置信度;
若所述第二置信度小于第一阈值,则将所述第一伪标签数据中所述第一置信度小于第二阈值的第一像素所属的类型更新为第一类型,获得所述第一伪标签数据对应的第二伪标签数据,所述第一类型表示该第一像素对监督无效;
将所述第二伪标签数据作为所述第一图像数据对应的所述第一标签数据。
3.根据权利要求1所述的方法,其中,所述第一图像数据为难样本图像数据;所述获取第一图像数据,包括:
获取无标签图像数据;
基于所述无标签图像数据,确定所述第一图像数据。
4.根据权利要求3所述的方法,其中,所述基于所述无标签图像数据,确定所述第一图像数据,包括:
基于训练获得的第一语义分割模型,对所述无标签图像数据进行预测,获得所述无标签图像数据对应的第二预测结果;所述第二预测结果包括所述无标签图像数据中各第二像素分别属于各类型的第一概率;
基于训练获得的第二语义分割模型,对所述无标签图像数据进行预测,获得所述无标签图像数据对应的第三预测结果;所述第三预测结果包括所述无标签图像数据中各所述第二像素分别属于各类型的第二概率;
根据所述第二预测结果确定对应的第三伪标签数据,并根据所述第三预测结果确定对应的第四伪标签数据;所述第三伪标签数据包括所述第二预测结果对应的各所述第二像素所属的类型;所述第四伪标签数据包括所述第三预测结果对应的各所述第二像素所属的类型;
根据所述第三伪标签数据和所述第四伪标签数据,确定两者之间的差异值;所述差异值为IOU值和/或像素差异数量;
根据所述差异值,确定所述第一图像数据。
5.根据权利要求4所述的方法,其中,所述无标签图像数据包括至少一个无标签图像;所述差异值包括各所述无标签图像分别对应的差异值;
所述根据所述差异值,确定所述第一图像数据,包括:
对于所述无标签图像数据中任一的无标签图像作为第一无标签图像,若所述第一无标签图像对应的IOU值小于IOU阈值和/或所述第一无标签图像对应的像素差异数量大于差异数量阈值,则将所述第一无标签图像作为所述第一图像数据。
6.根据权利要求3所述的方法,其中,所述无标签图像数据包括至少一个无标签图像;所述基于所述无标签图像数据,确定所述第一图像数据,包括:
基于第三语义分割模型对所述无标签图像数据进行预测,获得第四预测结果;所述第四预测结果包括所述无标签图像数据中各无标签图像的各第三像素分别属于各类型的概率;
基于所述第四预测结果,确定各所述无标签图像的各所述第三像素分别对应的置信度;
基于各所述无标签图像的各所述第三像素分别对应的置信度,确定各所述无标签图像分别对应的置信度;
基于各所述无标签图像分别对应的置信度及预设置信度阈值,确定所述第一图像数据。
7.根据权利要求6所述的方法,其中,所述基于所述第四预测结果,确定各所述无标签图像的各所述第三像素分别对应的置信度,包括:
对于一个第三像素,将该第三像素对应的最大概率与第二大概率的差值作为该第三像素对应的置信度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京地平线信息技术有限公司,未经北京地平线信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210143921.8/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序