[发明专利]基于Bert模型的意图识别方法、装置及相关设备有效

专利信息
申请号: 202110319798.6 申请日: 2021-03-25
公开(公告)号: CN113051930B 公开(公告)日: 2023-04-14
发明(设计)人: 王伟;黄勇其;于翠翠;张黔 申请(专利权)人: 华润数字科技有限公司
主分类号: G06F40/30 分类号: G06F40/30;G06F40/216;G06F40/284;G06F40/289
代理公司: 广州嘉权专利商标事务所有限公司 44205 代理人: 周翀
地址: 518000 广东省深圳市福田区梅林街*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 bert 模型 意图 识别 方法 装置 相关 设备
【说明书】:

发明实施例公开了基于Bert模型的意图识别方法、装置及相关设备。该方法包括:对训练语料进行分词处理得到多个单词,并基于多个单词构建语料矩阵;构建训练语料中每个单词的对话序列标识向量以及邻接语义向量;获取训练语料中每一单词的词向量及位置向量,并对每一单词对应的词向量、位置向量、对话序列标识向量以及邻接语义向量进行组合,得到每个单词的输入向量;基于输入向量,通过预置的Bert模型对所输入向量进行预测,得到输入向量所属意图的预测概率,从而构建意图识别模型;获取目标识别语料对应的目标输入向量,通过意图识别模型进行意图识别,得到意图识别结果。该方法使意图识别更准确。

技术领域

本发明涉及人工智能领域,尤其涉及一种基于Bert模型的意图识别方法、装置及相关设备。

背景技术

近年来通过深度神经网络进行对话状态管理已成为对话机器人领域的主流技术。对话状态管理具体来说是对话机器人通过识别用户意图和槽位抽取,实现与用户交互完成特定任务。其中,意图是表明用户想实现何种目的,例如订机票还是订火车票;而槽位是指完成对话的关键要素,例如在订票流程中必须要填写的出发时间、出发地、目的地等要素。

传统的技术是将意图识别视为多分类任务,预先定义好一定类别的意图,通过各种神经网络模型实现分类。通过这些方法完成意图识别需要对每个任务进行大量的标注,需要耗费较多人力和时间成本,影响了实际应用范围。当前技术发展趋势是在预置了丰富语义特征的开源预训练模型(例如Bert模型)基础上,再进行优化改进,以达到更好的效果。

发明内容

本发明实施例提供了一种基于Bert模型的意图识别方法、装置及相关设备,旨在解决现有技术中意图识别准确性不高的问题。

第一方面,本发明实施例提供了一种基于Bert模型的意图识别方法,其包括:

将训练语料进行分词处理得到多个单词,并基于多个所述单词构建语料矩阵,其中,所述训练语料包含多个对话序列;

根据所述训练语料中每个对话序列的先后顺序确定所述对话序列内每个单词的对话序列标识向量;以及获取所述训练语料中每一单词在所述语料矩阵的邻接词序列,并根据所述邻接词序列计算得到对应的邻接语义向量;

获取所述训练语料中每个单词的词向量及位置向量,并对所述词向量、位置向量、对话序列标识向量以及邻接语义向量进行组合,得到所述训练语料每个单词的输入向量;

基于所述输入向量,通过预置的Bert模型对所述输入向量进行预测,得到所述输入向量所属意图的预测概率,从而构建意图识别模型;

获取待识别的目标语料对应的目标输入向量,通过所述意图识别模型进行意图识别,得到意图识别结果。

第二方面,本发明实施例提供了一基于Bert模型的意图识别装置,其包括:

构建模块,用于将训练语料进行分词处理得到多个单词,并基于多个所述单词构建语料矩阵,其中,所述训练语料包含多个对话序列;

计算模块,用于根据所述训练语料中每个对话序列的先后顺序确定所述对话序列内每个单词的对话序列标识向量;以及获取所述训练语料中每一单词在所述语料矩阵的邻接词序列,并根据所述邻接词序列计算得到对应的邻接语义向量;

组合模块,用于获取所述训练语料中每个单词的词向量及位置向量,并对所述词向量、位置向量、对话序列标识向量以及邻接语义向量进行组合,得到所述训练语料每个单词的输入向量;

预测模块,用于基于所述输入向量,通过预置的Bert模型对所述输入向量进行预测,得到所述输入向量所属意图的预测概率,从而构建意图识别模型;

识别模块,用于获取待识别的目标语料对应的目标输入向量,通过所述意图识别模型进行意图识别,得到意图识别结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华润数字科技有限公司,未经华润数字科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110319798.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top