[发明专利]数据处理方法、自学习系统及电子设备在审
| 申请号: | 202010001468.8 | 申请日: | 2020-01-02 |
| 公开(公告)号: | CN113065662A | 公开(公告)日: | 2021-07-02 |
| 发明(设计)人: | 陈超;付志航;黄建强;华先胜 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/04;G06N3/08 |
| 代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 柴艳波;刘戈 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据处理 方法 自学习 系统 电子设备 | ||
1.一种数据处理方法,其特征在于,包括:
基于带标签的第一图像样本,对自学习模型进行监督训练,得到第一损失;
基于无标签的第二图像样本,对所述自学习模型进行无监督训练,得到第二损失;
获取所述监督训练过程中所述自学习模型的目标模型层对应的第一输出数据及所述无监督训练过程中所述目标模型层对应的第二输出数据;
根据所述第一输出数据及所述第二输出数据,确定第三损失;
基于所述第一损失、所述第二损失及所述第三损失,对所述自学习模型进行优化处理;
其中,所述自学习模型用于处理图像。
2.根据权利要求1所述的方法,其特征在于,所述自学习模型包含至少一个模型层以及与所述至少一模型层中一模型层连接的输出层;
所述目标模型层为与所述输出层连接的模型层。
3.根据权利要求1或2所述的方法,其特征在于,根据所述第一输出数据及所述第二输出数据,确定第三损失,包括:
对所述第一输出数据及所述第二输出数据进行高阶矩匹配处理,以得到符合匹配要求的第一P阶矩及第二P阶矩;
根据所述第一P阶矩及所述第二P阶矩,确定所述第三损失;
其中,所述P为大于或等于3的数值。
4.根据权利要求3所述的方法,其特征在于,所述第一输出数据是维度为L的第一特征向量,所述第二输出数据是维度为L的第二特征向量;其中,维度L为所述目标模型层中神经元的个数;以及
所述第一输出数据及所述第二输出数据进行高阶矩匹配处理,以得到符合匹配要求的第一P阶矩及第二P阶矩,包括:
分别对所述第一特征向量及所述第二特征向量进行向量外积计算,以得到所述第一P阶矩及所述第二P阶矩。
5.根据权利要求3所述的方法,其特征在于,根据所述第一P阶矩及所述第二P阶矩,确定所述第三损失,包括:
确定所述第一P阶矩及所述第二P阶矩的差异;
根据所述差异,确定所述第三损失。
6.根据权利要求1或2所述的方法,其特征在于,基于所述第一损失、所述第二损失及所述第三损失,对所述自学习模型进行优化处理,包括:
基于所述第一损失、所述第二损失及所述第三损失,计算总损失;
在所述总损失满足收敛条件的情况下,所述自学习模型完成训练;
在所述总损失不满足收敛条件的情况下,根据所述总损失,优化所述自学习模型中的参数。
7.根据权利要求6所述的方法,其特征在于,基于所述第一损失、所述第二损失及所述第三损失,计算总损失,包括:
将所述第一损失、所述第二损失及所述第三损失的损失和,作为所述总损失;或者
将所述第一损失、所述第二损失及所述第三损失的损失加权和,作为所述总损失;或者
将所述第一损失、所述第二损失及所述第三损失作为第一损失计算模型的入参,执行所述第一损失计算模型得到所述总损失;或者
将所述第一损失、所述第二损失及所述第三损失中的两项作为第二损失计算模型的入参执行所述第二损失计算模型得到第一数值;将所述第一损失、所述第二损失及所述第三损失中剩余的一项及所述第一数值作为第三损失计算模型的入参执行所述第三损失计算模型得到所述总损失。
8.根据权利要求1或2所述的方法,其特征在于,基于无标签的第二图像样本,对所述自学习模型进行无监督训练,得到第二损失,包括:
将所述无标签的第二图像样本作为所述自学习模型的入参,执行所述自学习模型得到第三输出数据;其中,所述第三输出数据中包含:所述自学习模型的输出层所含多个神经元中各神经元对应输出的数据项;
根据所述多个神经元中各神经元对应输出的数据项,确定所述第二损失。
9.根据权利要求1或2所述的方法,其特征在于,所述自学习模型的输出层所含神经元的个数为类别数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010001468.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:存储管理方法、设备、装置和计算机可读存储介质
- 下一篇:咬纸质量在线检测装置





