[发明专利]意图识别方法、装置、对话机器人和计算机可读存储介质在审
申请号: | 202010966550.4 | 申请日: | 2020-09-15 |
公开(公告)号: | CN112115702A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 郑悦;江丹丹;景艳山 | 申请(专利权)人: | 北京明略昭辉科技有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/284;G06N3/04;G06N3/08 |
代理公司: | 青岛清泰联信知识产权代理有限公司 37256 | 代理人: | 赵燕 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 意图 识别 方法 装置 对话 机器 人和 计算机 可读 存储 介质 | ||
本申请涉及一种意图识别方法、装置、对话机器人、计算机设备和计算机可读存储介质,其中,该意图识别方法包括:待识别文本获取步骤,用于获取一待识别文本并设置候选意图,所述候选意图个数为N;向量表示步骤,用于经一文本转换器将所述待识别文本中每一字转换为相应的字向量后,通过一双向循环神经网络及池化层对所述字向量进行特征提取、池化得到所述待识别文本的句向量,并经一复合线性层将所述句向量的维度转换为N,得到一N维句向量;归一化步骤,用于将所述N维句向量经一Softmax层进行归一化处理,从而识别得到每一候选意图及其概率,从而得到用户问句所对应的意图。通过本申请,提高意图识别精确度,同时降低训练成本、提高训练效率。
技术领域
本申请涉及人工智能技术领域,特别是涉及意图识别方法、装置、对话机器人、计算机设备和计算机可读存储介质。
背景技术
近年来,随着深度学习技术的发展,各种基于深度学习的前沿技术被应用于自然语言处理中。其中,对话机器人是自然语言处理的一个分支,特别是垂直领域下的对话机器人,如淘宝购物中的阿里小蜜,已在业界有广泛的应用。
意图识别属于自然语言处理中的文本分类问题,是对话机器人中一个重要的模块,它负责从用户的输入中提取意图,并给后续操作,如知识图谱推理,提供明确的方向,因此该模块需要极高的精确度。文本分类问题主要包括:第一部分为特征提取,其在该领域下主要有两种方案:基于词频的特征、基于embedding的特征,词频特征可以通过统计词在每句中出现的概率得到,而embedding特征需要通过一些技术如Word2Vec或BERT(Bidirectional Encoder Representation fromTransformers)词向量化模型实现文本转换。第二部分为模型分类器,其主要可以分为两块:基于传统机器学习的分类器,如逻辑回归,朴素贝叶斯等;基于深度学习的分类器,如卷积神经网络,循环神经网络(RecurrentNeural Network,简称RNN)等。第三部分,为了满足不同业务上的需求,在提取特征前和得到模型结果后会添加一些业务逻辑。
目前业界比较成熟的方案为从用户输入的句子中提取词频特征并将其输入传统机器学习模型,结合模型输出和业务规则得到最终意图。另一种相对前沿,但在业界没有大规模采用的方案为:将句子输入BERT得到词向量,然后将得到的词向量输入LSTM(LongShort-Term Memory,长短期记忆网络)模型,得到每一层输出并对每一层的输出做聚合操作得到最后的M维向量,其中M为目标意图的个数。
上述相关技术中,基于词频的特征虽然工业化程度高,可解释性强,但是其存在维度爆炸问题。特征维度完全取决于词汇表长度,需要在机器上开辟大量的存储空间。与此同时,在如此量级的特征数下,模型拟合速度也相对比较缓慢,因此只能选择相对简单的分类器,所以精度不会特别高。同样,BERT作为2018年提出的训练词向量技术,虽然能解决维度爆炸问题,但有一个致命的缺点,其最小的模型都有上亿级别的参数数量,因而导致训练模型需要耗费大量的时间和GPU资源,同时其响应速度相对于较为朴素的分类器慢一个级别。另外,LSTM作为上个世纪提出的模型,虽然有效,但存在模型训练缓慢和响应速度缓慢的问题。
因此,利用上述现有技术实现意图识别响应速度缓慢,效率、精度较低,而且训练成本高。
发明内容
本申请实施例提供了一种意图识别方法、装置、对话机器人、计算机设备和计算机可读存储介质,提高意图识别精确度,同时降低训练成本、提高训练效率。
第一方面,本申请实施例提供了一种意图识别方法,包括:
待识别文本获取步骤,用于获取一待识别文本并设置候选意图,所述候选意图个数为N;
向量表示步骤,用于经一文本转换器将所述待识别文本中每一字转换为相应的字向量后,通过一双向循环神经网络及池化层对所述字向量进行特征提取、池化得到所述待识别文本的句向量,并经一复合线性层将所述句向量的维度转换为N,得到一N维句向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略昭辉科技有限公司,未经北京明略昭辉科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010966550.4/2.html,转载请声明来源钻瓜专利网。