[发明专利]多任务模型的训练方法及装置有效
| 申请号: | 202010131419.6 | 申请日: | 2020-02-28 |
| 公开(公告)号: | CN111310848B | 公开(公告)日: | 2022-06-28 |
| 发明(设计)人: | 彭爽;陈晓军;崔恒斌 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F40/30 |
| 代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 张明;周良玉 |
| 地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 任务 模型 训练 方法 装置 | ||
本说明书实施例提供一种多任务模型的训练方法及装置,在训练方法中,获取训练样本集,该训练样本集中的每个样本包括由一个问题和多个历史会话对组成的输入文本、第一标签和第二标签。对于任意的第一训练样本,将其中的输入文本输入文本编码层,得到输入文本的文本向量。从文本向量中确定出多个答案中各答案的语义向量。将各答案的语义向量输入问答相关性分类层,通过输出得到第一预测结果。基于第一预测结果和第一标签,确定第一预测损失。将文本向量输入答案选择层,通过输出得到第二预测结果。基于第二预测结果和第二标签,确定第二预测损失。基于训练样本集中各样本的第一预测损失与第二预测损失的融合结果,调整多任务模型的参数。
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及一种多任务模型的训练方法及装置。
背景技术
在智能客服场景中,为实现用户问题的解答,通常会训练多种任务。这里的多种任务例如可以为问答相关性任务或者答案选择任务等。其中,问答相关性任务是指从用户与客服的多个历史会话对(一个历史会话对包括一个用户问句和一个答案)中,选择出与当前问题相关性最高的答案。答案选择任务是指从输入文本(当前问题+多个历史会话对)中,确定出可回答当前问题的内容所在的位置。这里的可回答当前问题的内容可以为某个历史会话对的答案的部分或者全部内容。
对于如上所述的多种任务,传统技术中通常会一一进行单独训练。如,针对每个任务,会基于对应于该任务的训练样本,训练相应的机器学习模型。
因此,需要提供一种方案,以提升多任务的训练效率。
发明内容
本说明书一个或多个实施例描述了一种多任务模型的训练方法及装置,可以降低模型训练的成本和开销。
第一方面,提供了一种多任务模型的训练方法,包括:
获取训练样本集;所述训练样本集中的每个样本包括由一个问题和多个历史会话对组成的输入文本、第一标签和第二标签,所述多个历史会话对中的每个历史会话对包括一个用户问句和一个答案;所述第一标签指示所述多个历史会话对的多个答案中与所述问题相关性最高的答案;所述第二标签指示可回答所述问题的内容在所述输入文本中的真实位置;所述可回答所述问题的内容包含在所述多个答案的第i个答案中;
对于所述训练样本集中任意的第一训练样本,将其中的输入文本输入所述文本编码层,得到所述输入文本的文本向量;
从所述输入文本的文本向量中确定出所述多个答案中各答案的语义向量;
将所述多个答案中各答案的语义向量输入所述问答相关性分类层,通过所述问答相关性分类层的输出得到第一预测结果;基于所述第一预测结果和所述第一标签,确定第一预测损失;
将所述输入文本的文本向量输入所述答案选择层,通过所述答案选择层的输出得到第二预测结果;基于所述第二预测结果和所述第二标签,确定第二预测损失;
基于所述训练样本集中各样本的第一预测损失与第二预测损失的融合结果,调整所述多任务模型的参数。
第二方面,提供了一种多任务模型的训练装置,包括:
获取单元,用于获取训练样本集;所述训练样本集中的每个样本包括由一个问题和多个历史会话对组成的输入文本、第一标签和第二标签,所述多个历史会话对中的每个历史会话对包括一个用户问句和一个答案;所述第一标签指示所述多个历史会话对的多个答案中与所述问题相关性最高的答案;所述第二标签指示可回答所述问题的内容在所述输入文本中的真实位置;所述可回答所述问题的内容包含在所述多个答案的第i个答案中;
输入单元,用于对于所述获取单元获取的所述训练样本集中任意的第一训练样本,将其中的输入文本输入所述文本编码层,得到所述输入文本的文本向量;
确定单元,用于从所述输入文本的文本向量中确定出所述多个答案中各答案的语义向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010131419.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种驮背车的托部
- 下一篇:一种板材切割生产线及其控制方法





