[发明专利]文本意图识别方法、装置、电子设备及存储介质在审
申请号: | 202011092923.6 | 申请日: | 2020-10-13 |
公开(公告)号: | CN112183101A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 李小娟;徐国强 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/186;G06F40/151;G06F40/30;G06K9/62;G06N3/04;G06F16/35 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 迟珊珊 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 意图 识别 方法 装置 电子设备 存储 介质 | ||
本发明涉及人工智能技术领域,提供一种文本意图识别方法、装置、电子设备及存储介质,所述方法包括:获取会话文本进行实体识别得到多个实体;根据会话文本生成第一文本向量,根据多个实体生成实体特征向量;将第一文本向量转换为多个粒度第二文本向量;对多个粒度的第二文本向量进行特征提取得到语义特征向量,拼接语义特征向量及实体特征向量得到模板特征向量确定会话文本对应的意图类别。本发明通过将会话文本转换为语义特征向量和实体特征向量进行拼接确定会话文本的意图类别,增加实体特征辅助意图分类,提高了意图识别的识别准确率,可应用于医疗平台的病历管理,协助医生分析详尽的病历,为制定准确有效的治疗方案提供基础。
技术领域
本发明涉及人工智能技术领域,具体涉及一种文本意图识别方法、装置、电子设备及存储介质。
背景技术
意图识别是智能机器人核心模块之一,现有的意图识别方法主要有三种,基于规则模板的方法,基于过往日志匹配的方法,基于分类模型的方法,无论是基于日志匹配或者文本分类模型,其本质都是基于人工整理或历史数据进行意图分类,在当前的智能客户对话系统中,例如以下3个句子:句子A:你好,平安银行武汉都市花园社区支行在哪?句子B:你好,平安银行武汉鹦鹉花园社区支行在哪?句子C:你好,我要去平安银行武汉都市花园社区支行?三个句子都是在问地址,且都是武汉同叫“花园社区支行”的地址,其中句子A和句子C是指向一个地址,句子A和句子B由于所处的区不同,导致答案差异会很大,但句子A和句子B的句式及文字都很相似,通过现有的意图识别模型得到的答案为:句子A和句子B的相似性要高于句子A和句子C的相似性,导致意图识别错误。
此外,这种句式相同但意思不同的情况在客服场景下及其常见,例如保险行业保险名目五花八门,差一个字就是不同的险种之间的差别,或者医疗领域中,差一个字就是不同疾病之间的差别,即意图识别粒度较细时,导致意图识别的识别准确率较低。
发明内容
鉴于以上内容,有必要提出一种文本意图识别方法、装置、电子设备及存储介质,通过将会话文本转换为语义特征向量和实体特征向量进行拼接确定会话文本的意图类别,增加实体特征辅助意图分类,提高了意图识别的识别准确率。
本发明的第一方面提供一种文本意图识别方法,所述方法包括:
获取会话文本,并对所述会话文本进行实体识别得到多个实体;
根据所述会话文本生成包含上下文特征的第一文本向量,及根据所述多个实体生成实体特征向量;
通过卷积运算将所述第一文本向量转换为多个粒度第二文本向量;
对所述多个粒度的第二文本向量进行特征提取得到语义特征向量,拼接所述语义特征向量及所述实体特征向量得到模板特征向量;
根据所述模板特征向量确定所述会话文本对应的意图类别。
可选的,所述将所述多个实体转换成实体特征向量包括:
利用词向量映射模型将所述多个实体映射为词向量集合,其中,每个实体对应一个词向量;
计算所述词向量集合的每个维度的均值;
根据所述每个维度的均值生成实体特征向量。
可选的,所述通过卷积运算将所述第一文本向量转换为多个第二文本向量包括:
获取多个预设的卷积核矩阵向量;
针对每一个预设的卷积核矩阵向量,从所述第一文本向量中的起始位置开始逐次滑动直至滑动至所述第一文本向量中的终止位置,获取每次滑动时所述预设的卷积核矩阵向量对应的子矩阵向量;
计算每次滑动时所述预设的卷积核矩阵向量与对应的子矩阵向量的乘积得到多个元素,并累加所述多个元素得到卷积结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011092923.6/2.html,转载请声明来源钻瓜专利网。