[发明专利]基于任务型对话系统的语义理解方法、装置、设备及介质在审

专利信息
申请号: 202110008442.0 申请日: 2021-01-05
公开(公告)号: CN112699686A 公开(公告)日: 2021-04-23
发明(设计)人: 王梦婷;李利娟 申请(专利权)人: 浙江诺诺网络科技有限公司
主分类号: G06F40/30 分类号: G06F40/30;G06F40/279
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 侯珊
地址: 310000 浙江省杭州市西*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 任务 对话 系统 语义 理解 方法 装置 设备 介质
【说明书】:

发明公开了一种基于任务型对话系统的语义理解方法、装置、设备及介质;在本方案中,提取的特征向量包括稀疏矩阵特征向量和稠密矩阵特征向量,通过该方式,可以让特征向量保留更多的语义信息、上下文和句子结构信息,提高语义理解的准确性;并且,本方案通过联合意图分类及实体分类的语义理解模块对特征向量进行处理,相比于单一任务具有更高的识别效率及准确率。

技术领域

本发明涉及对话系统和自然语言理解领域,更具体地说,涉及一种基于任务型对话系统的语义理解方法、装置、设备及介质。

背景技术

自然语言处理是人工智能的一个子领域,是指机器能够理解和解释人类语言的能力,应用场景非常广泛,例如情感分析,自动文摘,对话系统等。对话系统主要分为任务型,问答型和闲聊型三大类,其中任务型对话系统需要较强的领域知识,实现模块主要由语音识别(Automatic Speech Recognition,ASR)、语义理解(Natural LanguageUnderstanding,NLU)、对话管理(Dialog Management,DM)、自然语言生成(NaturalLanguage Generation,NLG)和语音合成(Text To Speech,TIS)这五部分组成。

目前,对话系统的难点主要在于语义理解和对话管理,而语义理解模块是对话管理正常执行的前提和保障,目标是将语音识别后的文本转化为结构化的语义表示,主要包括意图分类和实体识别。当前主流的实现方法一般将两者当作独立的任务进行处理,即通过不同的模型分别进行识别。意图分类属于文本分类问题,目前主要方法有朴素贝叶斯,支持向量机(Support Vector Machine,SVN)等基于传统机器学习模型的方法,以及卷积神经网络(Convolutional Neural Networks,CNN),循环神经网络(Recurrent NeuralNetwork,RNN)等基于深度神经网络模型的方法。实体识别属于序列标注问题,常用的模型同样有传统机器学习方法和深度学习方法,例如最大熵马尔可夫(Maximum EntropyMarkov Model,MEMM),条件随机场(Conditional Random Fields,CRF),长短期机器网络模型(Long Short-Term Memory,LSTM)等。另外,当下最为流行的实体抽取方法是将神经网络模型和传统个机器学习模型以计算联合概率的方式结合在一起,例如LSTM+CRF模型。

意图分类和实体抽取处理的数据均为文本数据,因此都需要先将文本数据转化为特征向量。特征提取的方法主要包括两大类,稀疏矩阵表示和稠密矩阵表示,前者主要包括字和词级别的One-Hot、n-gram等方法,后者主要是指引入预训练模型,例如BERT,Glove等句子级别的特征提取方法。

语义理解模块主要流程是先对语料进行特征向量化,通过字词级别的稀疏矩阵表示或者句子级别的稠密矩阵表示,然后分别通过不同深度网络模型进行意图分类和实体抽取。这样存在两处问题,一是提取的特征向量不足以充分表示对话文本信息,即只存在字词级别的语义信息,或者只存在句子级别的上下文和结构信息;二是将意图分类和实体识别当作单一任务对待处理,不仅降低了在线识别效率,也降低了识别准确率。

发明内容

本发明的目的在于提供一种基于任务型对话系统的语义理解方法、装置、设备及介质,以提高语义理解的准确率。

为实现上述目的,本发明提供一种基于任务型对话系统的语义理解方法,包括:

获取待处理的文本信息;

确定所述文本信息中与每个字符对应的一维向量;

将每个字符对应的一维向量输入特征提取模块,通过所述特征提取模块提取与所述文本信息对应的特征向量;所述特征向量包括稀疏矩阵特征向量和稠密矩阵特征向量;

将所述特征向量输入语义理解模块,通过所述语义理解模块获得与所述文本信息对应的语义理解结果;其中,所述语义理解模块为联合意图分类及实体分类的语义理解模块。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江诺诺网络科技有限公司,未经浙江诺诺网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110008442.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top