[发明专利]图像标签的确定方法、装置、电子设备和存储介质在审
申请号: | 202210143921.8 | 申请日: | 2022-02-16 |
公开(公告)号: | CN114494787A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 王粟瑶;梁俪倩 | 申请(专利权)人: | 北京地平线信息技术有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06K9/62;G06V10/774 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 李洪娟 |
地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 标签 确定 方法 装置 电子设备 存储 介质 | ||
本公开实施例公开了一种图像标签的确定方法、装置、电子设备和存储介质,其中,方法包括:获取第一图像数据;基于训练获得的第一半监督语义分割模型对第一图像数据进行预测,获得对应的第一预测结果;第一预测结果包括第一图像数据对应的第一概率数据,第一概率数据包括第一图像数据中各第一像素分别属于各类型的概率;基于第一概率数据,确定第一图像数据对应的第一伪标签数据,第一伪标签数据包括各第一像素所属的类型;基于第一概率数据,确定各第一像素分别对应的第一置信度;基于各第一像素分别对应的第一置信度及第一伪标签数据,确定第一图像数据对应的第一标签数据。实现图像的自动化标注,从而有效降低人工标注工作量,提高工作效率。
技术领域
本公开涉及计算机视觉技术,尤其是一种图像标签的确定方法、装置、电子设备和存储介质。
背景技术
在计算机视觉领域,需要基于各种模型实现图像的语义分割,模型的训练需要大量标注有标签的图像数据,为了减少数据标注的人工参与,基于半监督的语义分割模型训练方法逐渐成为重要技术之一,基于半监督的语义分割模型的训练可以结合有标签数据和无标签数据实现对语义分割模型的训练,为了进一步优化语义分割模型的性能,通常会确定出一些对模型训练更有价值的难样本图像数据,对其进行人工标注,进而将难样本图像数据及人工标注的对应标签用于语义分割模型的优化训练,但是将难样本进行人工标注,增大了人工标注的工作量,工作效率低。
发明内容
为了解决上述难样本人工标注工作效率低等技术问题,提出了本公开。本公开的实施例提供了一种图像标签的确定方法、装置、电子设备和存储介质。
根据本公开实施例的一个方面,提供了一种图像标签的确定方法,包括:获取第一图像数据;基于训练获得的第一半监督语义分割模型对所述第一图像数据进行预测,获得对应的第一预测结果;所述第一预测结果包括所述第一图像数据对应的第一概率数据,所述第一概率数据包括所述第一图像数据中各第一像素分别属于各类型的概率;基于所述第一概率数据,确定所述第一图像数据对应的第一伪标签数据,所述第一伪标签数据包括各所述第一像素所属的类型;基于所述第一概率数据,确定各所述第一像素分别对应的第一置信度;基于各所述第一像素分别对应的第一置信度及所述第一伪标签数据,确定所述第一图像数据对应的第一标签数据。
根据本公开实施例的另一个方面,提供了一种图像标签的确定装置,包括:第一获取模块,用于获取第一图像数据;第一处理模块,用于基于训练获得的第一半监督语义分割模型对所述第一图像数据进行预测,获得对应的第一预测结果;所述第一预测结果包括所述第一图像数据对应的第一概率数据,所述第一概率数据包括所述第一图像数据中各第一像素分别属于各类型的概率;第二处理模块,用于基于所述第一概率数据,确定所述第一图像数据对应的第一伪标签数据,所述第一伪标签数据包括各所述第一像素所属的类型;第三处理模块,用于基于所述第一概率数据,确定各所述第一像素分别对应的第一置信度;第四处理模块,用于基于各所述第一像素分别对应的第一置信度及所述第一伪标签数据,确定所述第一图像数据对应的第一标签数据。
根据本公开实施例的再一方面,提供一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行本公开上述任一实施例所述的图像标签的确定方法。
根据本公开实施例的又一方面,提供一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现本公开上述任一实施例所述的图像标签的确定方法。
基于本公开上述实施例提供的图像标签的确定方法、装置、电子设备和存储介质,可以基于半监督语义分割模型对待标注的第一图像数据进行预测,进而基于预测结果确定第一图像数据对应的伪标签及第一图像数据中各像素分别对应的置信度,进而基于伪标签和各像素分别对应的置信度确定第一图像数据对应的标签数据,实现图像的自动化标注,从而有效降低人工标注工作量,提高工作效率。
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京地平线信息技术有限公司,未经北京地平线信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210143921.8/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序