[发明专利]伪标签及标签预测模型的生成方法、装置、介质及设备有效
| 申请号: | 202010796408.X | 申请日: | 2020-08-10 |
| 公开(公告)号: | CN111898696B | 公开(公告)日: | 2023-10-27 |
| 发明(设计)人: | 李悦翔;马锴;郑冶枫;胡一凡;陈嘉伟;魏东;曹世磊 | 申请(专利权)人: | 腾讯云计算(长沙)有限责任公司 |
| 主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/82;G06N3/0464;G06N3/08;G06N20/00 |
| 代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 王鹏健 |
| 地址: | 410000 湖南省长沙市岳麓区天顶街道环*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 标签 预测 模型 生成 方法 装置 介质 设备 | ||
本申请的实施例提供了一种伪标签及标签预测模型的生成方法、装置、介质及设备。该标签预测模型的生成方法包括:通过已标注图像对机器学习模型进行监督训练得到第一模型;基于自监督学习任务,通过未标注图像和已标注图像对所述第一模型中包含的编码器网络进行自监督训练得到第二模型;通过所述第二模型预测未标注图像的伪标签;根据未标注图像和所述未标注图像的伪标签,以及所述已标注图像对所述第二模型进行联合训练,得到标签预测模型。本申请实施例的技术方案提高了伪标签的生成效率,并且也可以提高伪标签生成的准确性,不仅降低了机器学习模型在训练时对标注数据的需求,而且有利于提升基于生成的伪标签训练得到的机器学习模型的性能。
技术领域
本申请涉及计算机及通信技术领域,具体而言,涉及一种伪标签及标签预测模型的生成方法、装置、介质及设备。
背景技术
在人工智能的应用中,伪标签是在模型训练时给未标记数据生成的预测标签,这样做的目的是为了解决数据未被标记的问题。相关技术中在生成未标记数据的伪标签时不仅计算量较大,导致伪标签的生成效率较低,而且生成的伪标签的准确性也较低,进而影响了基于伪标签得到的机器学习模型的性能。
发明内容
本申请的实施例提供了一种伪标签及标签预测模型的生成方法、装置、介质及设备,进而至少在一定程度上可以提高伪标签的生成效率,进而有利于提升基于生成的伪标签训练得到的机器学习模型的性能。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供了一种图像伪标签的生成方法,包括:基于自监督学习任务对待处理图像进行图像变换处理,生成所述待处理图像对应的多个变换图像;将所述多个变换图像分别输入至第二模型中,所述第二模型是基于自监督学习任务,通过未标注图像和已标注图像对第一模型中包含的编码器网络进行自监督训练后得到的,所述第一模型是通过所述已标注图像对机器学习模型进行监督训练得到的;获取所述第二模型输出的所述多个变换图像分别对应的预测标签;根据所述多个变换图像分别对应的预测标签,生成所述待处理图像的伪标签。
根据本申请实施例的一个方面,提供了一种标签预测模型的生成方法,包括:通过已标注图像对机器学习模型进行监督训练,得到第一模型;基于自监督学习任务,通过未标注图像和所述已标注图像对所述第一模型中包含的编码器网络进行自监督训练,得到第二模型;通过所述第二模型预测所述未标注图像的伪标签;根据所述未标注图像和所述未标注图像的伪标签,以及所述已标注图像对所述第二模型进行联合训练,得到标签预测模型。
根据本申请实施例的一个方面,提供了一种图像伪标签的生成装置,包括:第一生成单元,配置为基于自监督学习任务对待处理图像进行图像变换处理,生成所述待处理图像对应的多个变换图像;输入单元,配置为将所述多个变换图像分别输入至第二模型中,所述第二模型是基于自监督学习任务,通过未标注图像和已标注图像对第一模型中包含的编码器网络进行自监督训练后得到的,所述第一模型是通过所述已标注图像对机器学习模型进行监督训练得到的;获取单元,配置为获取所述第二模型输出的所述多个变换图像分别对应的预测标签;第二生成单元,配置为根据所述多个变换图像分别对应的预测标签,生成所述待处理图像的伪标签。
在本申请的一些实施例中,基于前述方案,所述第一生成单元配置为:按照设定的图像划分方式将所述待处理图像划分为多个图像块,并对所述待处理图像的多个图像块进行排列组合,以生成所述待处理图像对应的多个变换图像。
在本申请的一些实施例中,基于前述方案,所述第二生成单元配置为:计算所述多个变换图像分别对应的预测标签的均值,将所述均值作为所述待处理图像的伪标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯云计算(长沙)有限责任公司,未经腾讯云计算(长沙)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010796408.X/2.html,转载请声明来源钻瓜专利网。





