[发明专利]数据处理方法、自学习系统及电子设备在审
| 申请号: | 202010001468.8 | 申请日: | 2020-01-02 |
| 公开(公告)号: | CN113065662A | 公开(公告)日: | 2021-07-02 |
| 发明(设计)人: | 陈超;付志航;黄建强;华先胜 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/04;G06N3/08 |
| 代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 柴艳波;刘戈 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据处理 方法 自学习 系统 电子设备 | ||
本申请实施例提供一种数据处理方法、自学习系统及电子设备。其中,数据处理方法包括:基于带标签的第一图像样本,对自学习模型进行监督训练得到第一损失;基于无标签的第二图像样本,对自学习模型进行无监督训练得到第二损失;获取监督训练过程中自学习模型的目标模型层对应的第一输出数据及无监督训练过程中目标模型层对应的第二输出数据;根据第一输出数据及第二输出数据确定第三损失;基于第一损失、第二损失及第三损失,对自学习模型进行优化处理;其中,所述自学习模型用于处理图像。本申请实施例提供的技术方案,有助于克服因源域与目标域概率分布不同造成的学习效果差的问题,提高自学习模型的域自适应学习效果,且具有较好的性能。
技术领域
本申请涉及计算机技术领域,尤其涉及一种数据处理方法、自学习系统及电子设备。
背景技术
传统的机器学习算法中,通常假设训练样本和测试样本来自同一概率分布,然后设计相应的模型和判别准则对待测试样例的输出进行预测。然而在很多实际场景中,训练样本集(如带标签样本集,亦可称为源域)和测试样本集(如无标签样本集,亦可称为目标域)可能来自不同概率分布的数据。这种情况下,利用训练样本集完成训练的自学习模型,在对测试样本集中的待测试样本进行测试时自学习模型的输出结果准确度较低,即自学习模型的性能会出现严重退化的情况。
如何在这种源域(如带标签样本集)和目标域(如测试样本集)概率分布不一致的情况下进行学习即为域自适应学习问题。因此,域自适应学习的重点在于如何克服源域分布和目标域分布不同,实现目标域上的学习任务。
发明内容
本申请各实施例提供一种能提高自学习模型的域自适应学习效果的数据处理方法、自学习系统及电子设备。
在本申请的一个实施例中,提供了一种数据处理方法。该数据处理方法包括:
基于带标签的第一图像样本,对自学习模型进行监督训练,得到第一损失;
基于无标签的第二图像样本,对所述自学习模型进行无监督训练,得到第二损失;
获取所述监督训练过程中所述自学习模型的目标模型层对应的第一输出数据及所述无监督训练过程中所述目标模型层对应的第二输出数据;
根据所述第一输出数据及所述第二输出数据,确定第三损失;
基于所述第一损失、所述第二损失及所述第三损失,对所述自学习模型进行优化处理;
其中,所述自学习模型用于处理图像。
在本申请的另一个实施例中,提供了一种数据处理方法。该数据处理方法包括:
获取待分类对象;
将所述待分类对象作为自学习模型的入参,执行所述自学习模型得到所述待分类对象所属的分类信息;
其中,所述自学习模型是利用无监督域自适应算法完成的训练;利用所述无监督域自适应算法训练过程包括:基于带标签的第一图像样本,对所述自学习模型进行监督训练得到第一损失;基于无标签的第二图像样本,对所述自学习模型进行无监督训练得到第二损失;获取所述监督训练过程中所述自学习模型的目标模型层对应的第一输出数据及所述无监督训练过程中所述目标模型层对应的第二输出数据;根据所述第一输出数据及所述第二输出数据,确定第三损失;基于所述第一损失、所述第二损失及所述第三损失,对所述自学习模型进行优化处理。
在本申请的又一个实施例中,提供了一种自学习系统。该自学习系统包括:
至少一个模型层,用于对输入的带标签的第一图像样本进行数据处理,得到第一处理结果;对输入的无标签的第二图像样本进行数据处理,得到第二处理结果;
输出层,与所述至少一个模型层中的一模型层连接,用于基于所述第一处理结果输出第一输出结果;基于所述第二处理结果输出第二输出结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010001468.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:存储管理方法、设备、装置和计算机可读存储介质
- 下一篇:咬纸质量在线检测装置





