[发明专利]模型训练方法、预测方法、装置和电子设备在审
| 申请号: | 202110860353.9 | 申请日: | 2021-07-27 |
| 公开(公告)号: | CN115700555A | 公开(公告)日: | 2023-02-07 |
| 发明(设计)人: | 谭清宇;何瑞丹;邴立东;吴慧途 | 申请(专利权)人: | 阿里巴巴新加坡控股有限公司;新加坡国立大学 |
| 主分类号: | G06F18/241 | 分类号: | G06F18/241;G06F16/35 |
| 代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 童磊;李辉 |
| 地址: | 新加坡*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 训练 方法 预测 装置 电子设备 | ||
1.一种模型训练方法,包括:
将若干数量的样本数据输入至预测模型,得到所述样本数据的预测结果;
根据所述预测结果和所述样本数据的标签,利用所述预测模型的损失函数计算损失信息,所述损失函数包括第一函数项和第二函数项,所述第一函数项用于增加不同标签所对应样本数据之间的差异,所述第二函数项用于减小预测结果和标签之间的差异;
根据所述损失信息,确定所述预测模型的参数。
2.如权利要求1所述的方法,所述预测模型包括特征提取子模型和预测子模型;
所述将若干数量的样本数据输入至预测模型,包括:
将若干数量的样本数据输入至特征提取子模型,得到所述样本数据的特征数据;
将所述特征数据输入至预测子模型,得到所述样本数据的预测结果;
所述利用所述预测模型的损失函数计算损失信息,包括:
根据所述标签和所述特征数据,计算第一函数项的损失信息;
根据所述标签和所述预测结果,计算第二函数项的损失信息;
根据第一函数项的损失信息和第二函数项的损失信息,计算所述损失函数的损失信息。
3.如权利要求2所述的方法,所述特征提取子模型包括编码模块和降维模块;
所述将若干数量的样本数据输入至特征提取子模型,包括:
将若干数量的样本数据输入至编码模块,得到所述样本数据的编码数据;
将所述编码数据输入至降维模块,得到对所述编码数据降维后的特征数据。
4.如权利要求2所述的方法,所述方法还包括:
将所述标签和所述特征数据进行对应存储。
5.如权利要求2所述的方法,所述方法还包括:
读取若干数量的特征数据及其对应的标签;
所述计算第一函数项的损失信息,包括:
根据样本数据的标签、样本数据的特征数据、读取的标签、以及读取的特征数据,计算第一函数项的损失信息。
6.如权利要求1所述的方法,所述预测模型包括情感分类模型,所述样本数据包括文本数据,所述标签包括情感类别标签。
7.一种预测方法,包括:
将业务数据输入至训练后的预测模型,得到所述业务数据的预测结果,所述预测模型采用如权利要求1-6中任一项方法训练得到。
8.如权利要求7所述的方法,所述预测模型基于一个或多个源领域的样本数据训练得到,所述将业务数据输入至训练后的预测模型,包括:
将目标领域的业务数据输入至训练后的预测模型,得到所述业务数据的预测结果,所述目标领域和所述源领域不同。
9.如权利要求7所述的方法,所述业务数据包括文本数据,所述预测模型包括情感分类模型,所述预测结果包括情感类别。
10.一种模型训练装置,包括:
预测单元,用于将若干数量的样本数据输入至预测模型,得到所述样本数据的预测结果;
计算单元,用于根据所述预测结果和所述样本数据的标签,利用所述预测模型的损失函数计算损失信息,所述损失函数包括第一函数项和第二函数项,所述第一函数项用于增加不同标签所对应样本数据之间的差异,所述第二函数项用于减小预测结果和标签之间的差异;
确定单元,用于根据所述损失信息,确定所述预测模型的参数。
11.一种预测装置,包括:
预测单元,用于将业务数据输入至训练后的预测模型,得到所述业务数据的预测结果,所述预测模型采用如权利要求1-6中任一项方法训练得到。
12.一种电子设备,包括:
至少一个处理器;
存储有程序指令的存储器,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如权利要求1-9中任一项方法的指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴新加坡控股有限公司;新加坡国立大学,未经阿里巴巴新加坡控股有限公司;新加坡国立大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110860353.9/1.html,转载请声明来源钻瓜专利网。





