[发明专利]伪标签及标签预测模型的生成方法、装置、介质及设备有效
| 申请号: | 202010796408.X | 申请日: | 2020-08-10 |
| 公开(公告)号: | CN111898696B | 公开(公告)日: | 2023-10-27 |
| 发明(设计)人: | 李悦翔;马锴;郑冶枫;胡一凡;陈嘉伟;魏东;曹世磊 | 申请(专利权)人: | 腾讯云计算(长沙)有限责任公司 |
| 主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/82;G06N3/0464;G06N3/08;G06N20/00 |
| 代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 王鹏健 |
| 地址: | 410000 湖南省长沙市岳麓区天顶街道环*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 标签 预测 模型 生成 方法 装置 介质 设备 | ||
1.一种图像伪标签的生成方法,其特征在于,包括:
基于自监督学习任务对待处理图像进行图像变换处理,生成所述待处理图像对应的多个变换图像;
将所述多个变换图像分别输入至第二模型中,所述第二模型是基于自监督学习任务,通过未标注图像和已标注图像对第一模型中包含的编码器网络进行自监督训练后得到的,所述第一模型是通过所述已标注图像对机器学习模型进行监督训练得到的;
获取所述第二模型输出的所述多个变换图像分别对应的预测标签;
根据所述多个变换图像分别对应的预测标签,生成所述待处理图像的伪标签。
2.根据权利要求1所述的图像伪标签的生成方法,其特征在于,基于自监督学习任务对待处理图像进行图像变换处理,包括:
按照设定的图像划分方式将所述待处理图像划分为多个图像块,并对所述待处理图像的多个图像块进行排列组合,以生成所述待处理图像对应的多个变换图像。
3.根据权利要求1或2所述的图像伪标签的生成方法,其特征在于,根据所述多个变换图像分别对应的预测标签,生成所述待处理图像的伪标签,包括:
计算所述多个变换图像分别对应的预测标签的均值,将所述均值作为所述待处理图像的伪标签。
4.一种标签预测模型的生成方法,其特征在于,包括:
通过已标注图像对机器学习模型进行监督训练,得到第一模型;
基于自监督学习任务,通过未标注图像和所述已标注图像对所述第一模型中包含的编码器网络进行自监督训练,得到第二模型;
通过所述第二模型预测所述未标注图像的伪标签;
根据所述未标注图像和所述未标注图像的伪标签,以及所述已标注图像对所述第二模型进行联合训练,得到标签预测模型。
5.根据权利要求4所述的标签预测模型的生成方法,其特征在于,基于自监督学习任务,通过未标注图像和所述已标注图像对所述第一模型中包含的编码器网络进行自监督训练,包括:
基于自监督学习任务,生成所述未标注图像和所述已标注图像中各个图像对应的变换图像;
将所述各个图像作为训练目标、并将所述各个图像对应的变换图像作为训练样本对所述第一模型中包含的编码器网络进行训练。
6.根据权利要求5所述的标签预测模型的生成方法,其特征在于,基于自监督学习任务,生成所述未标注图像和所述已标注图像中各个图像对应的变换图像,包括:
按照设定的图像划分方式对所述未标注图像和所述已标注图像分别进行划分得到各个图像对应的多个图像块;
对所述各个图像对应的多个图像块进行重新排列,以生成所述各个图像对应的变换图像。
7.根据权利要求6所述的标签预测模型的生成方法,其特征在于,对所述各个图像对应的多个图像块进行重新排列,包括:
从预定的排列组合序列中随机选择一个排列组合序列对所述各个图像对应的多个图像块进行重新排列。
8.根据权利要求7所述的标签预测模型的生成方法,其特征在于,所述标签预测模型的生成方法还包括:
按照所述图像划分方式将指定图像划分为多个图像块,并生成所述指定图像的多个图像块所对应的排列组合序列;
从所述排列组合序列中选择出相互之间差别大于或等于设定值的预定数量个排列组合序列作为所述预定的排列组合序列。
9.根据权利要求8所述的标签预测模型的生成方法,其特征在于,所述标签预测模型的生成方法还包括:
计算所述排列组合序列中每两个排列组合序列之间的汉明距离,根据所述汉明距离确定所述每两个排列组合序列之间的差别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯云计算(长沙)有限责任公司,未经腾讯云计算(长沙)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010796408.X/1.html,转载请声明来源钻瓜专利网。





