[发明专利]一种语句意图识别方法和电子设备在审
| 申请号: | 202210539326.6 | 申请日: | 2022-05-17 |
| 公开(公告)号: | CN114860938A | 公开(公告)日: | 2022-08-05 |
| 发明(设计)人: | 孟禹光;马雪超 | 申请(专利权)人: | 上海弘玑信息技术有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06N3/04 |
| 代理公司: | 江苏瑞途律师事务所 32346 | 代理人: | 李维朝 |
| 地址: | 200000 上海市闵*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语句 意图 识别 方法 电子设备 | ||
本发明公开一种语句意图识别方法和电子设备,属于自然语言处理技术领域。针对现有技术中存在的语句意图识别计算量大,且准确率不高的问题,本发明根据拆句模型数据集训练得到拆句模型;根据多标签分类模型数据集训练得到多标签分类模型;所述拆句模型获取第一数据,并对所述第一数据中的多个语句表示多个意图的多意图语句进行拆分,获得第二数据;所述多标签分类模型获取所述第二数据,并对所述第二数据中的单意图语句、单个语句表示多个意图的多意图语句中的一种或两种进行识别,获得所述第一数据的意图。本发明避免了语句识别中,单一模型无法处理所有语句类型的情况,解决了语句意图识别准确率不高的问题,客观上提升了用户体验。
技术领域
本发明涉及自然语言处理技术领域,更具体地说,涉及一种语句意图识别方法和电子设备。
背景技术
对话系统在实际应用时,经常会面临用户想同时表达多个意图的情形,即一句话中想表达多个意思。比如在智能音箱控制技术领域,用户想要同时控制两个家电,或者控制同一家电执行不同的操作。又比如在智能客服技术领域,用户想同时询问两件事情。
苹果的Siri、亚马逊的Alexa等语音交互助手的广泛应用宣告着语音交互时代已经到来。语音交互的总体流程大致可分为语音识别(Automatic Speech Recognition,ASR)、语义理解(Natural Language Understanding,NLU)、对话管理(DialogueManagement,DM)和语音合成(Text-To-Speech,TTS)四个步骤。其中,ASR是将用户说出的话语转化为文本,NLU是理解用户的意图并抽取语音转化文本中的关键信息,DM是对机器和用户的对话进行管理,TTS是将机器生成的文本用语音返回给用户。机器对于语义理解的准确率依赖于ASR的准确率,但最重要的还是取决于NLU的准确率。而语句意图识别(Multi-intent,MI)是NLU中的难题。与多标签分类类似,语句意图识别难于如何准确地确定用户有多少个意图,用户的这些意图分别属于什么类别。
对于用户的语句意图识别,现有技术主要分为两种:一种是将问题转化为传统的分类问题;二是调整现有的算法来适应多意图的分类,但都不能更好的解决计算量大、准确率低的问题。
在传统的对话系统中,对多意图的处理过程繁琐,且准确率低下,用户体验感不好,造成对话系统功能的缺失。当对话系统遇到多个意图时,通常会按照一个意图输入对话管理系统进行处理,也就是丢弃系统没有识别到的另一个意图,这种做法,会影响到系统的实际使用体验,也会影响到对话系统的对话流畅性。
具体的,现有技术在语句意图识别中存在以下不足:第一,对话系统的对话连续性缺失;第二,对用户实际表达是意图理解存在偏差,导致系统执行动作出错。
发明内容
1.要解决的技术问题
针对现有技术中存在的语句意图识别中,特别是多意图语句识别时计算量大,且准确率不高的问题,本发明提供一种语句意图识别方法和电子设备,它可以实现提高语句意图识别准确性,且计算量不大,适合广泛推广。
2.技术方案
本发明的目的通过以下技术方案实现。
第一方面,本发明公开一种语句意图识别方法,包括以下步骤:
获取拆句模型数据集,根据拆句模型数据集训练得到拆句模型;
获取多标签分类模型数据集,根据多标签分类模型数据集训练得到多标签分类模型;
所述拆句模型获取第一数据,并对所述第一数据中的多个语句表示多个意图的多意图语句进行拆分,获得第二数据;所述第一数据即需要进行意图识别的数据,根据应用场景的不同形式也可以不同,可以是单意图语句、单个语句表示多个意图的多意图语句或多个语句表示多个意图的多意图语句的一种或多种;所述第二数据为通过拆句模型拆分后输出的数据,第二数据包括单意图语句、单个语句表示多个意图的多意图语句中的一种或两种;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海弘玑信息技术有限公司,未经上海弘玑信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210539326.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:化学气相沉积炉
- 下一篇:一种基于多目标优化的复杂系统序贯测试序列生成方法





