[发明专利]口语理解模型的训练方法、识别方法、系统、设备及介质在审

专利信息
申请号: 202010378089.0 申请日: 2020-05-07
公开(公告)号: CN111581968A 公开(公告)日: 2020-08-25
发明(设计)人: 杨森;罗超;吉聪睿;李巍;胡泓 申请(专利权)人: 携程计算机技术(上海)有限公司
主分类号: G06F40/289 分类号: G06F40/289;G06N3/04;G06N20/00
代理公司: 上海弼兴律师事务所 31283 代理人: 薛琦;林嵩
地址: 200335 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 口语 理解 模型 训练 方法 识别 系统 设备 介质
【说明书】:

发明公开了一种口语理解模型的训练方法、识别方法、系统、设备及介质,该训练方法包括:获取若干历史口语语句分别对应的文本语句;标注每一文本语句中的第一信息,第一信息包括用于表征文本语句中目的的标记目的信息以及存放标记目的信息对应槽位的标记槽位信息;获取每一文本语句中每一个词的词向量及每一个字的字向量;采用联合机器学习模型,根据第一信息、词向量及字向量训练以得到口语理解模型。本发明通过将历史口语语句中获取的文本语句中的词向量及字向量输入至联合机器学习模型中训练以得到口语理解模型,通过结合词的含义及字的含义,从而能够更准确的训练出口语理解模型,进一步减小口语理解的误差。

技术领域

本发明涉及口语识别领域,特别涉及一种口语理解模型的训练方法、识别方法、系统、设备及介质。

背景技术

在口语识别中一般通过三块内容对口语进行理解,即Domain Classification(领域分类)、Intent Classification(目的分类)、Slot Filling(槽填充)三块,换句话说,在用户进行口语对话时,识别语句中的Slot Filling而后,将Intent Classification及Domain Classification填充Slot Filling,从而达到筛选语句中的有用信息,理解口语中的重要内容的目的,目前识别上述三块内容的主流的方法一般为pipe mode(管道模型)和joint model(联合模型),pipe model指分别使用不同的模型对这三块内容进行建模,例如使用SVM(一种文本分类算法)、LR(一种文本分类算法)、DNN(一种文本分类算法)等文本分类算法来实现Domain Classification、Intent Classification,使用HMM(一种序列标注算法)、CRF(一种序列标注算法)、RNN+CRFCRF(一种序列标注算法)等序列标注算法来实现Slot Filling。但是,现有技术中的上述方案不仅没有考虑到intent(目的)和slot(槽)之间的相互关系,而且训练多个模型也不高效。

另一种主流方法是对它们进行联和建模,仅使用一个模型来进行识别。常用联和建模方法通过设计联和损失函数对intent和slot进行建模,使用gate(一种神经网络)机制来计算slot和intent的相关性从而提升slot效果,使用胶囊网络的Dynamic Routing(动态路径)来构建slot和intent之间关系,从而达到相互促进的作用。joint model同时考虑到了slot和intent之间的相互关系,效果往往优于pipe model。但是这种方法在对口语语义的理解与口语的真实语义仍然存在偏差。

发明内容

本发明要解决的技术问题是为了克服现有技术中在对话中对口语理解容易产生偏差的缺陷,提供一种能准确识别理解口语中关键信息的口语理解模型的训练方法、识别方法、系统、设备及介质。

本发明是通过下述技术方案来解决上述技术问题:

本发明提供了一种口语理解模型的训练方法,所述训练方法包括:

获取若干历史口语语句分别对应的文本语句;

标注每一所述文本语句中的第一信息,所述第一信息包括用于表征所述文本语句中目的的标记目的信息以及存放所述标记目的信息的槽位的标记槽位信息;

获取每一所述文本语句中每一个词的词向量及每一个字的字向量;

采用联合机器学习模型,根据所述第一信息、所述词向量及所述字向量训练以得到所述口语理解模型,所述联合机器学习模型包括若干机器学习模型组合成的模型。

本发明通过将历史口语语句中获取的文本语句中的词向量及字向量共同输入至联合机器学习模型中进行训练以得到口语理解模型。本实施例通过结合文本语句中的词的含义及字的含义,从而能够更准确的训练出口语理解模型,进一步减小口语理解的误差。

较佳地,所述联合机器学习模型包括Attention(一种机器学习模型)机制;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程计算机技术(上海)有限公司,未经携程计算机技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010378089.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top