[发明专利]意图识别模型训练方法、装置及电子设备有效

专利信息
申请号: 201911368294.2 申请日: 2019-12-26
公开(公告)号: CN111143561B 公开(公告)日: 2023-04-07
发明(设计)人: 张红阳;韩磊;孙叔琦;孙珂;李婷婷 申请(专利权)人: 北京百度网讯科技有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F16/36;G06F40/30;G06F40/295;G06N3/044;G06N3/08
代理公司: 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人: 戎郑华
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 意图 识别 模型 训练 方法 装置 电子设备
【说明书】:

本申请提出一种意图识别模型训练方法、装置及电子设备,涉及人工智能技术领域。其中,该方法包括:确定训练样本集中各意图对应的槽位特征;根据每个样本与各意图对应的槽位特征的匹配度,确定每个样本的第一意图向量;利用第一预设的编码器,对每个样本对应的分词向量、词性向量及实体向量进行编码处理,确定每个样本对应的第二意图向量;利用预设的解码器,对每个样本对应的第一意图向量及第二意图向量进行解码处理,确定每个样本对应的预测意图;根据每个样本对应的预测意图与标注意图的差异,对第一预设的编码器及预设的解码器进行更新。由此,通过这种意图识别模型训练方法,提升了深度神经网络模型在小规模训练样本下的意图识别的准确性。

技术领域

本申请涉及计算机技术领域,尤其涉及人工智能技术领域,提出一种意图识别模型训练方法、装置及电子设备。

背景技术

在人机对话交互过程中,机器需要理解对话语句的意图,目前通常使用基于深度神经网络的分类模型进行意图分类,从而得到一条对话的意图。

相关技术中,为了保证分类模型的准确性,通常需要数十万级以上的标注训练语料训练意图分类模型。但是在实际应用中,由于标注数据的成本较高,冷启动阶段通常只有万级别甚至百级别的标注训练数据。在万级别以下的小规模训练语料上,由于训练数据的不足,深度神经网络模型很难对对话的语义进行准确的建模,从而导致意图识别的准确性较差,影响了用户体验。

发明内容

本申请提出的意图识别模型训练方法、装置及电子设备,用于解决相关技术中,基于深度神经网络训练意图识别模型时,若训练语料的规模较小,由于训练数据的不足,深度神经网络模型很难对对话的语义进行准确的建模,从而导致意图识别的准确性较差,影响了用户体验的问题。

本申请一方面实施例提出的意图识别模型训练方法,包括:对训练样本集中每个样本的意图及槽位进行统计,确定各意图对应的槽位特征;根据每个样本与各意图对应的槽位特征的匹配度,确定每个样本的第一意图向量;利用第一预设的编码器,对每个样本对应的分词向量、词性向量及实体向量进行编码处理,确定每个样本对应的第二意图向量;利用预设的解码器,对每个样本对应的第一意图向量及第二意图向量进行解码处理,确定每个样本对应的预测意图;根据每个样本对应的预测意图与标注意图的差异,对所述第一预设的编码器及所述预设的解码器进行更新。

本申请另一方面实施例提出的意图识别模型训练装置,包括:第一确定模块,用于对训练样本集中每个样本的意图及槽位进行统计,确定各意图对应的槽位特征;第二确定模块,用于根据每个样本与各意图对应的槽位特征的匹配度,确定每个样本的第一意图向量;第三确定模块,用于利用第一预设的编码器,对每个样本对应的分词向量、词性向量及实体向量进行编码处理,确定每个样本对应的第二意图向量;第四确定模块,用于利用预设的解码器,对每个样本对应的第一意图向量及第二意图向量进行解码处理,确定每个样本对应的预测意图;第一更新模块,用于根据每个样本对应的预测意图与标注意图的差异,对所述第一预设的编码器及所述预设的解码器进行更新。

本申请再一方面实施例提出的电子设备,其包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如前所述的意图识别模型训练方法。

本申请又一方面实施例提出的存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行如前所述的意图识别模型训练方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911368294.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top