[发明专利]一种模型的训练方法、数据处理方法及设备在审
申请号: | 202110352634.3 | 申请日: | 2021-03-31 |
公开(公告)号: | CN113011568A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 何建忠;李蕊煌;贾旭;刘健庄 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06F17/16 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 数据处理 设备 | ||
本申请实施例公开了一种模型的训练方法、数据处理方法及设备,可应用于人工智能领域中,具体可应用于计算机视觉领域,方法包括:首先为每个域(包括目标域和多个源域)的每个类别建立原型(即类别中心),再在每个域内基于计算出的原型建立一个关系矩阵(即相似度矩阵),之后根据每个域各自对应的相似度矩阵构建得到一个目标张量,通过相似度矩阵构建域之间的高阶关联,并将该高阶关联融合进目标损失函数,使得模型学习提取域无关的特征。该方法借助张量的低秩约束挖掘多个源域和目标域之间的高阶关联,增强了不同域上提取的特征的一致性,使得模型即使在没有见过的目标域上也有不错的性能提升,并且不会额外增加推理阶段的运行时间及计算开销。
技术领域
本申请涉及人工智能领域,尤其涉及一种模型的训练方法、数据处理方法及设备。
背景技术
以大量标注数据作为网络训练的“燃料”,深度学习算法在各个计算机视觉任务中都表现出了优异的性能(如,图像分类、目标检测、视频分析等)、机器翻译、语音识别等领域中。然而,不同源域的数据(即有标签的数据)之间存在着较大的域间差异,这些差异使得直接将在某个源域上学习到的知识迁移到具有不同数据分布的其他目标域时性能大大的降低,极大地增加了深度学习算法部署的难度。
为了解决这个问题,迁移学习方法、无监督领域自适应(unsupervised domainadaptation,UDA)算法、多源域适应算法被提出,这些算法致力于学习域不变的特征(即从不同域的数据中提取的特征与其来自哪个域无关,也就是数据间的可迁移特征),以便更好的将在源域学习到的知识迁移到目标域上,提升目标域的性能。
目前,大部分的迁移学习方法主要是通过对抗训练或者基于对抗生成的损失等方式来减小从源域和目标域上提取的特征之间的差异,这种通过对抗训练学习提取域不变特征的方式使得模型训练过程不稳定,且增加了训练难度;大部分无监督域适应方法则针对的是单个源域到单个目标域的,然而实际应用中有很多相关的源域都能用来提升模型在目标域的性能表现;多源域适应算法志在利用相关的源域数据,学习到与任务相关的不同源域共通的域无关特征,从而提升模型在目标域上的泛化能力及判别力,目前多源域适应算法仅考虑源域和目标域之间成对的关联,而忽略了所有域之间的关联。
发明内容
本申请实施例提供了一种模型的训练方法、数据处理方法及设备,用于为每个域(包括目标域和多个源域)的每个类别建立原型(即类别中心),再在每个域内基于计算出的原型建立一个关系矩阵(即相似度矩阵),之后根据每个域各自对应的相似度矩阵构建得到一个目标张量,通过相似度矩阵构建域之间的高阶关联,并将该高阶关联融合进目标损失函数,使得模型学习提取域无关的特征,从而提升模型在目标域上的性能。
基于此,本申请实施例提供以下技术方案:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110352634.3/2.html,转载请声明来源钻瓜专利网。