[发明专利]一种用户意图识别方法及系统在审
申请号: | 201710537736.6 | 申请日: | 2017-07-04 |
公开(公告)号: | CN107346340A | 公开(公告)日: | 2017-11-14 |
发明(设计)人: | 吴友政 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06K9/62;G06N3/04 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 王宝筠 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 意图 识别 方法 系统 | ||
技术领域
本发明涉及数据交互技术领域,特别是涉及一种用户意图识别方法及系统。
背景技术
近年随着语音识别、人机对话、自然语言处理等技术迅猛发展。用户意图识别是对这一类助手型对话产品来说极为重要,且又极具挑战的一项任务。用户意图识别是从用户的输入(语音识别结果)中理解用户的需求,例如:用户1:北京明天的天气如何?意图1:查询天气;用户2:明天上午10:00有个会,请在9:50的时候提醒我一下,多谢!意图2:设置闹钟;用户3:请帮忙播放琅琊榜,意图2:播放视频。
传统的方法首先获取用户输入的对话文本;然后对文本进行分词;再分别计算文本中每个词的词向量;最后将词向量输入预先训练好的传统模型,例如:朴素贝叶斯、逻辑回归模型、支持向量机等,或神经网络模型,例如:前向神经网络、循环神经网络、卷积神经网络等来判断当前的用户意图。为节省内存和模型的训练速度,传统的基于词的方法通常预先定义一个大小合适的词典(即词频大于某个阈值的词集合),因此一旦输入中包括不在词典中词(有可能是语音识别的误识别、或者分词错误造成的),系统即有可能不能正确地识别用户意图。例如:训练数据为:帮忙搜索美剧(语音识别结果:帮忙搜索美剧;分词结果:帮忙搜索美剧);测试数据1为:请打开英剧(语音识别结果:请你打开英剧;分词结果:请打开英剧);测试数据2为:请搜索没剧(语音识别结果:请搜索没剧;分词结果:请搜索没剧),对于测试数据1,如果训练数据中没有出现过“英剧”这个词,用户对话意图系统可能就无法正确判断用户意图;而测试数据2是由于语音识别的错误,可能无法正确判断用户意图。因此,使用传统的词向量进行语音识别容易造成误识别,由于低频次、新词和俚语等的词或分词错误均对用户意图识别系统对用户意图的识别精度的影响,从而降低用户意图系统的成功率和用户体验。
发明内容
本发明的目的在于提出一种用户意图识别方法及系统,以解决现有技术中传统的分词方法来识别用户对话意图,由于低频次、新词和俚语等的词或分词错误均对用户对话意图系统对对话文本的识别精度的影响,从而降低用户意图系统的成功率和用户体验的问题。
为达到上述目的,本发明提供了以下技术方案:
一种用户意图识别方法,包括:
获取用户输入的对话文本;
将所述对话文本进行分字处理,得到所述对话文本的汉字串;
将所述汉字串输入至双向循环神经网络模型来确定用户意图,所述双向循环神经网络模型包括:前向循环神经网络模型和后向循环神经网络模型。
其中,所述获取用户输入的对话文本,具体为:
获取用户输入的语音会话;
采用语音转文字引擎将所述语音会话转换为对话文本。
优选的,在所述将所述汉字串输入至双向循环神经网络模型来确定用户意图步骤之前,还包括:
采用由多条不同对话文本及其对应的用户意图组成的对话样本进行训练,获得预先训练的所述双向循环神经网络模型。
其中,所述将所述汉字串输入至双向循环神经网络模型来确定用户意图,具体为:
接收所述分字处理后得到的所述对话文本中的汉字串;
对所述汉字串中的多个汉字进行字向量的计算,得到多个字向量;
针对所述多个字向量,通过所述前向循环神经网络模型计算所述对话文本的前向表示,以及通过所述后向循环神经网络模型计算所述对话文本的后向表示;
根据所述前向表示和所述后向表示进行全连接计算,得到所述对话文本的句子表示;
根据所述句子表示采用softmax分类器预测所述对话文本的用户意图。
其中,所述根据所述句子表示采用softmax分类器预测所述对话文本的用户意图,具体为:
采用softmax分类器计算所述对话文本在所有用户意图上的分布函数;
根据所述分布函数计算所述所有用户意图对应的用户意图概率;
将所述用户意图概率最大的用户意图作为所述对话文本的用户意图输出。
一种用户意图识别系统,包括:
获取模块,用于获取用户输入的对话文本;
分字处理模块,用于将所述对话文本进行分字处理,得到所述对话文本的汉字串;
意图确定模块,用于将所述汉字串输入至双向循环神经网络模型来确定用户意图,所述双向循环神经网络模型包括:前向循环神经网络模型和后向循环神经网络模型。
其中,所述获取模块包括:
获取单元,用于获取用户输入的语音会话;
转换单元,用于采用语音转文字引擎将所述语音会话转换为对话文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710537736.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高性能数据处理系统
- 下一篇:一种大数据的管理方法