[发明专利]文本意图识别方法、装置及存储介质在审

专利信息
申请号: 202010862153.2 申请日: 2020-08-24
公开(公告)号: CN114090726A 公开(公告)日: 2022-02-25
发明(设计)人: 张钊;徐坤;孟函可;王宝军;张宇洋 申请(专利权)人: 华为技术有限公司
主分类号: G06F16/33 分类号: G06F16/33;G06F16/332;G06F16/35;G06F40/211;G06F40/295;G06F40/30
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 熊永强;李稷芳
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文本 意图 识别 方法 装置 存储 介质
【说明书】:

本申请涉及人工智能技术领域的文本意图识别,具体公开了一种文本意图识别方法、装置及存储介质。该方法包括:根据预先构造的实体字典库,确定待识别文本中的至少一个实体以及所述至少一个实体中每个实体在所述待识别文本中的位置;对所述每个实体以及所述每个实体在所述待识别文本中的位置进行编码,得到与所述每个实体对应的第一特征向量;对所述待识别文本中的每个单词分别进行编码,得到所述每个单词对应的第二特征向量;根据所述每个实体对应的第一特征向量以及所述每个单词对应的第二特征向量,确定所述待识别文本对应的意图。本申请实施例有利于提高文本意图识别的精确度。

技术领域

发明涉及人工智能(Artificial Intelligence,AI)技术领域的文本意图识别,具体涉及一种文本意图识别方法、装置及存储介质。

背景技术

人机对话中的自然语言理解(Natural Language Understanding,NLU)任务通常可以分为意图识别和槽位填充两个子任务,意图识别用于确定任务场景,槽位填充用于提取句子语义成分,确定任务的具体需求。目前NLU系统通常包括由规则、统计、深度学习中的一种几种方式组合而成的系统,其中,由于基于深度学习组成的系统由数据驱动,易于维护,扩展性强受众多开发者重视。

在深度学习系统中,意图识别与槽位填充两个任务相互影响,可以串行判断也可以并行判断。目前对意图的识别和槽位填充主要是通过确定实体类型实现,但是,这种识别方式需要通过先验知识确定实体类型。但是,在实体类型变化或者特征不明显的情况下,确定出的实体类型可能是错误,使用错误的实体类型进行意图识别和槽位填充,则会生成错误的意图,导致对句子的意图识别率较低。模型泛化能力低。

发明内容

本申请提供了一种文本意图识别方法、装置及存储介质。通过与预先构造的实体字典进行匹配,提高意图识别准确率。

第一方面,本申请实施例提供一种文本意图识别方法,包括:根据预先构造的实体字典库,确定待识别文本中的至少一个实体以及所述至少一个实体中每个实体在所述待识别文本中的位置;对所述每个实体以及所述每个实体在所述待识别文本中的位置进行编码,得到与所述每个实体对应的第一特征向量;对所述待识别文本中的每个单词分别进行编码,得到所述每个单词对应的第二特征向量;根据所述每个实体对应的第一特征向量以及所述每个单词对应的第二特征向量,确定所述待识别文本对应的意图。

可以看出,在本申请实施例中,使用预先构造的实体字典库确定出待识别文本中的实体;然后,对实体以及实体在待识别文本中的位置进行编码,并将编码得到的第一特征向量与每个单词的第二特征向量进行融合。相当于先通过先验知识确定出待识别文本中的实体类型,并将先验知识融合到文本意图的识别过程中,从而提高对待识别文本的识别精度。

在一些可能的实施方式中,所述对所述每个实体以及所述每个实体在所述待识别文本中的位置进行编码,得到与所述每个实体对应的第一特征向量,包括:对所述每个实体进行编码,得到所述每个实体对应的第三特征向量;对所述每个实体在所述待识别文本中的位置进行编码,得到所述每个实体对应的第四特征向量;将所述每个实体对应的第三特征向量以及第四特征向量进行叠加,得到所述每个实体对应的第一特征向量。

可以看出,在本实施方式中,在确定出实体后,还确定该实体在待识别文本中的位置信息,所以,每个实体的第一特征向量包含实体的语义信息以及空间位置信息,由于位置信息也反映出匹配出的实体的合理性,比如,待识别文本“播放你好旧时光”,如果匹配出的实体是“你好旧时光”,并给出相应的位置信息,可以看出这个实体是个合理的,如果匹配出的实体是“旧时光”,在给出位置信息后,可知剩余的文本“播放你好”不是合理的句式,从而确定实体“旧时光”是不合理的。所以,使用每个实体的第一特征向量进行意图识别,可以提高文本意图识别的准确率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010862153.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top