[发明专利]模型训练方法、预测方法、装置和电子设备在审
| 申请号: | 202110860353.9 | 申请日: | 2021-07-27 |
| 公开(公告)号: | CN115700555A | 公开(公告)日: | 2023-02-07 |
| 发明(设计)人: | 谭清宇;何瑞丹;邴立东;吴慧途 | 申请(专利权)人: | 阿里巴巴新加坡控股有限公司;新加坡国立大学 |
| 主分类号: | G06F18/241 | 分类号: | G06F18/241;G06F16/35 |
| 代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 童磊;李辉 |
| 地址: | 新加坡*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 训练 方法 预测 装置 电子设备 | ||
本说明书实施例公开了一种模型训练方法、预测方法、装置和电子设备。所述模型训练方法包括:将若干数量的样本数据输入至预测模型,得到所述样本数据的预测结果;根据所述预测结果和所述样本数据的标签,利用所述预测模型的损失函数计算损失信息,所述损失函数包括第一函数项和第二函数项,所述第一函数项用于增加不同标签所对应样本数据之间的差异,所述第二函数项用于减小预测结果和标签之间的差异;根据所述损失信息,确定所述预测模型的参数。本说明书实施例可以增强模型的领域适应性。
技术领域
本说明书实施例涉及计算机技术领域,特别涉及一种模型训练方法、预测方法、装置和电子设备。
背景技术
随着人工智能技术的发展,通过样本数据训练预测模型,再利用训练后的预测模型对业务数据进行预测,这种方式在越来越多的领域得到普及应用。
在一些场景中,可以通过源领域的样本数据训练预测模型,再利用训练后的预测模型对源领域的业务数据进行预测。所述源领域可以包括热门领域、成熟领域等。随着业务的快速发展,有可能需要对目标领域的业务数据进行预测。所述目标领域可以包括新兴领域、冷门领域等。然而,目标领域下样本数据的数量往往较少,甚至,目标领域下不存在样本数据。这样便无法通过目标领域的样本数据训练预测模型,无法对目标领域的业务数据进行预测。
为了对目标领域的业务数据进行预测,一种解决方案是,直接利用源领域的预测模型对目标领域的业务数据进行预测。然而,源领域的预测模型是采用传统的模型训练方法训练得到的。采用传统的模型训练方法训练得到的模型,领域适应性较差。这样,若直接利用源领域的预测模型对目标领域的业务数据进行预测,会造成预测结果的准确性不高。
发明内容
本说明书实施例提供一种模型训练方法、预测方法、装置和电子设备,以增强模型的领域适应性。本说明书实施例的技术方案如下。
本说明书实施例的第一方面,提供了一种模型训练方法,包括:
将若干数量的样本数据输入至预测模型,得到所述样本数据的预测结果;
根据所述预测结果和所述样本数据的标签,利用所述预测模型的损失函数计算损失信息,所述损失函数包括第一函数项和第二函数项,所述第一函数项用于增加不同标签所对应样本数据之间的差异,所述第二函数项用于减小预测结果和标签之间的差异;
根据所述损失信息,确定所述预测模型的参数
本说明书实施例的第二方面,提供了一种预测方法,包括:
将业务数据输入至训练后的预测模型,得到所述业务数据的预测结果,所述预测模型采用如第一方面所述的模型训练方法训练得到。
本说明书实施例的第三方面,提供了一种模型训练装置,包括:
预测单元,用于将若干数量的样本数据输入至预测模型,得到所述样本数据的预测结果;
计算单元,用于根据所述预测结果和所述样本数据的标签,利用所述预测模型的损失函数计算损失信息,所述损失函数包括第一函数项和第二函数项,所述第一函数项用于增加不同标签所对应样本数据之间的差异,所述第二函数项用于减小预测结果和标签之间的差异;
确定单元,用于根据所述损失信息,确定所述预测模型的参数。
本说明书实施例的第四方面,提供了一种预测装置,包括:
预测单元,用于将业务数据输入至训练后的预测模型,得到所述业务数据的预测结果,所述预测模型采用如第一方面所述的模型训练方法训练得到。
本说明书实施例的第五方面,提供了一种电子设备,包括:
至少一个处理器;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴新加坡控股有限公司;新加坡国立大学,未经阿里巴巴新加坡控股有限公司;新加坡国立大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110860353.9/2.html,转载请声明来源钻瓜专利网。





