[发明专利]一种基于文本相似度的意图识别方法在审
申请号: | 201910617459.9 | 申请日: | 2019-07-10 |
公开(公告)号: | CN110136699A | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 司马华鹏;姚奥 | 申请(专利权)人: | 南京硅基智能科技有限公司 |
主分类号: | G10L15/10 | 分类号: | G10L15/10;G10L15/18;G06K9/62 |
代理公司: | 江苏舜点律师事务所 32319 | 代理人: | 孙丹 |
地址: | 210012 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 意图识别 文本相似度 相似度算法 用户语音 准确率 文本 技术方案要点 错误问题 错误转换 网络训练 算法 语音 失败 学习 | ||
本发明公开了一种基于文本相似度的意图识别方法,解决了ASR转为文本出现错误时产生的意图识别的错误问题,其技术方案要点是通过文本相似度算法来对用户语音进行识别,避免ASR在语音转为文本的过程中出现错误转换的问题。采用相似度算法来进行意图识别,从而提高意图识别的准确率。同时,若通过相似度算法识别失败,则将用户语音输入到深度学习网络训练的意图识别模型进行识别,进一步提高意图识别的准确率。
技术领域
本公开涉及智能识别领域,尤其涉及一种基于文本相似度的意图识别方法。
背景技术
目前,在智能对话领域,意图识别一般是单一的将语音信号通过ASR技术转成文本,而ASR转为文本存在一定的错误率,再对错误的文本进行单纯的文本识别会使意图识别的错误率大大提高。现有技术中,使用深度学习网络训练的模型来识别意图的方法非常之多,但这种意图识别方法略为单一,识别的准确率有待进一步提高。
发明内容
本公开的目的是提供一种基于文本相似度的意图识别方法,解决通过ASR转为文本存在错误而导致的意图识别错误的问题。
本公开的上述技术目的是通过以下技术方案得以实现的:
一种基于文本相似度的意图识别方法,包括:
预定义意图类别,获取话术文本数据,将所述话术文本数据与所述意图类别进行相似度计算得到意图识别知识库;
将用户语音转成用户问题文本,将所述用户问题文本与所述意图识别知识库进行相似度计算,得到意图识别结果;
其中,所述相似度计算方法包括基于字符的相似度算法和基于词向量的相似度算法。
进一步地,所述基于字符的相似度算法为基于编辑距离的相似度算法,包括:
,其中q为所述用户问题文本,S为所述意图识别知识库中的句子,为q与S之间的最小编辑距离,len(q)为所述用户问题文本的文本长度,len(S)为所述意图识别知识库中句子的字符长度。
进一步地,所述基于字符的相似度算法为基于相同词典的相似度算法,包括:
,其中,为所述用户问题文本q分词之后的序列,为所述意图识别知识库中的句子S分词之后的序列,为序列qw中词的个数,len(Su)为序列Su中词的个数,为序列qw中与序列Su中词义相同的词的个数。
进一步地,所述相似度计算结果为:
;
当时,得到所述意图识别结果,其中。
进一步地,当且时,转到所述基于词向量的相似度算法进行意图识别,否则转到意图识别模型进行意图识别。
进一步地,所述基于词向量的相似度算法为:
为所述用户问题文本q分词之后的序列,为所述意图识别知识库中的句子S分词之后的序列,;
所述q的向量Vq为:;其中,lq为所述q中词的个数,Wi为所述q中的词,Vqwi为所述Wi的向量值,W为权重,所述qwi的词性为动词或名词时,;所述qwi的词性为时间或方位时,;
所述S的向量Vs为:;其中,ls为所述S中词的个数,ui为所述S中的词,Vsui为所述ui的向量值,u为权重,所述Sui的词性为动词或名词时,;所述Sui的词性为时间或方位时,;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京硅基智能科技有限公司,未经南京硅基智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910617459.9/2.html,转载请声明来源钻瓜专利网。