[发明专利]针对多任务模型的训练方法及装置有效
申请号: | 201911203428.5 | 申请日: | 2019-11-29 |
公开(公告)号: | CN110909145B | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 张望舒;温祖杰 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F16/33 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 任务 模型 训练 方法 装置 | ||
1.一种针对多任务模型的训练方法,所述多任务模型包括语义编码层,针对搜索交互场景的搜索分类层,以及针对问答交互场景的问答分类层,所述方法包括:
获取多个训练样本,其中包括所述搜索交互场景下采集的若干搜索训练样本和所述问答交互场景下采集的若干问答训练样本,所述多个训练样本中每个训练样本至少包括用户输入文本和对应的标准文本类别标签;
对于所述多个训练样本中任意的第一样本,至少将其中的用户输入文本输入所述语义编码层,得到语义向量,并且,将所述语义向量分别输入所述搜索分类层和所述问答分类层;
当所述第一样本属于所述若干搜索训练样本时,基于所述搜索分类层输出的分类结果和所述第一样本中的标准文本类别标签,确定所述第一样本对应的预测损失;
当所述第一样本属于所述若干问答训练样本时,基于所述问答分类层输出的分类结果和所述第一样本中的标准文本类别标签,确定所述第一样本对应的预测损失;
基于所述多个训练样本各自对应的预测损失之和,调整所述多任务模型的参数。
2.根据权利要求1所述的方法,其中,每个训练样本中还包括业务代码,用于指示在跳转至用户输入文本的输入界面之前显示的界面所对应的业务;所述至少将其中的用户输入文本输入所述语义编码层,包括:
将所述用户输入文本和所述业务代码进行拼接后,输入所述语义编码层。
3.一种针对多任务模型的训练方法,所述多任务模型包括语义编码层,针对搜索交互场景的搜索关联度预测层,以及针对问答交互场景的问答关联度预测层,所述方法包括:
获取多个训练样本,其中包括所述搜索交互场景下采集的若干搜索训练样本和所述问答交互场景下采集的若干问答训练样本,所述多个训练样本中每个训练样本至少包括历史文本对和对应的文本关联标签,所述历史文本对包括用户输入文本和对应的标准文本;
对于所述多个训练样本中任意的第一样本,至少将其中的历史文本对输入所述语义编码层,得到语义向量,并且,将所述语义向量分别输入所述搜索关联度预测层和所述问答关联度预测层;
当所述第一样本属于所述若干搜索训练样本时,至少基于所述搜索关联度预测层输出的预测结果和所述第一样本中的文本关联标签,确定与所述第一样本相关的预测损失;
当所述第一样本属于所述若干问答训练样本时,基于所述问答关联度预测层输出的预测结果和所述第一样本中的文本关联标签,确定所述第一样本相关的预测损失;
基于所述多个训练样本各自相关的预测损失之和,调整所述多任务模型的参数。
4.根据权利要求3所述的方法,其中,每个训练样本中还包括业务代码,用于指示在跳转至用户输入文本的输入界面之前显示的界面所对应的业务;所述至少将其中的历史文本对输入所述语义编码层,包括:
至少将所述历史文本对和所述业务代码组成的第一输入序列,输入所述语义编码层。
5.根据权利要求4所述的方法,其中,至少将所述历史文本对和所述业务代码组成的第一输入序列,输入所述语义编码层,包括:
基于预先设定的用于区分用户输入文本、标准文本和业务代码的三种字符,确定与所述第一输入序列对应的第二输入序列;
将所述第一输入序列和所述第二输入序列共同输入所述语义编码层。
6.根据权利要求3所述的方法,其中,所述文本关联标签指示对应的用户输入文本和标准文本之间是否相关联。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911203428.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于轮传动的市政垃圾用粉碎设备
- 下一篇:一种数字印刷装置