[发明专利]一种语句意图预测方法及系统在审
申请号: | 201711378005.8 | 申请日: | 2017-12-19 |
公开(公告)号: | CN108268442A | 公开(公告)日: | 2018-07-10 |
发明(设计)人: | 沈磊;陈见耸;朱鹏程 | 申请(专利权)人: | 芋头科技(杭州)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06N3/04;G06N3/08 |
代理公司: | 上海申新律师事务所 31272 | 代理人: | 俞涤炯 |
地址: | 310000 浙江省杭州市余杭区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 中间向量 语句 送入 句子向量 意图预测 指令语句 分类单元 分类结果 分类模型 输出指令 用户指令 语义识别 预测 准确率 整合 抽取 标签 关联 分割 分类 转换 纠正 转化 优化 | ||
本发明公开了一种语句意图预测方法及系统,属于语义识别技术领域;具体包括:以字为单位对由用户指令转化成的指令语句进行分割;随后将字送入对应的第一识别单元中进行处理,得到对应的中间向量;根据所有中间向量转换形成关联于指令语句的句子向量;最后将句子向量送入一第二识别单元中,以处理得到并输出指令语句的意图分类结果,同时将中间向量送入对应的第一分类单元中进行处理得到槽标签;训练意图分类模型的方法与上述过程相同。上述技术方案的有益效果是:将槽抽取与意图分类整合至一个整体的识别模型中,使得两者在训练时可以相互纠正,共同影响并且共同进行优化,从而提升实际预测的准确率,并且能够加快预测的处理速度。
技术领域
本发明涉及语义识别技术领域,尤其涉及一种语句意图预测方法及系统。
背景技术
随着人工智能(Artificial Intelligence)概念的普及,以及相关科学技术的不断发展,越来越多的电子设备开始朝向人工智能的方向发展。人工智能的一大特点是智能设备可以与用户进行智能的人机交互,例如通过语音进行交互或者输入文字进行交互等,这种交互过程中,用户输入的指令不再具有固定的格式,而是按照用户自己的意愿,以用户习惯的方式输入的指令,例如用户以口语化的语言说出的语音指令等。在这类交互过程中,在领域确定的前提下,智能设备需要理解用户的意图,并将用户的输入中有用的信息抽取出来以便进行后续处理,也就是将用户输入的句子进行意图分类并且将其中的槽(即定义的有用信息)抽取出来,这是处理用户输入指令的关键一步。
在现有技术中,针对槽抽取和针对意图分类分别进行的是独立的处理,即在处理用户指令的过程中是分别采用相互独立的识别模型进行处理。这种处理方式的缺陷在于,在训练意图分类模型并采用这两个模型对指令进行处理的过程中,意图分类模型得到的错误预测就不能再返回到槽抽取模型中再对其进行纠正,这样就不能很好地对意图分类模型和槽抽取模型进行优化。并且在这种方式中,在进行预测的过程中需要首先进行槽抽取,再根据槽抽取的预测结果进行意图分类,因此输入的句子需要进行两次分类预测,处理速度比较慢。
发明内容
根据现有技术中存在的上述问题,现提供一种语句意图预测方法及系统的技术方案,旨在将槽抽取与意图分类整合至一个整体的识别模型中,在训练时两者可以相互纠正,共同影响并且共同进行优化,从而提升实际预测的准确率,并且能够加快处理速度。
上述技术方案具体包括:
一种语句意图预测方法,适用于人机交互过程中;其中,预先训练形成一意图预测模型,并将所述意图预测模型适用到人机交互过程中,以对用户指令进行语义的意图分类;
采用所述意图预测模型对所述用户指令进行意图分类的方法具体包括:
步骤S1,以字为单位对依据所述用户指令转换的文字形式的指令语句进行分割;
步骤S2,将分割得到的每个字分别送入对应的第一识别单元中,经过处理后分别输出每个字所对应的中间向量,随后分别执行步骤S3a和步骤S3b;
步骤S3a,将每个字所对应的所述中间向量分别送入对应的第一分类单元中,经过处理后分别输出每个字所对应的槽标签,以作为所述指令语句的槽预测结果,随后退出;
步骤S3b,根据关联于所述指令语句的所有所述中间向量转换形成关联于所述指令语句的句子向量,随后转向步骤S4;
步骤S4,将所述句子向量送入一第二识别单元中,以得到并输出所述指令语句的意图分类结果;
预先训练形成所述意图预测模型的过程中,同样执行所述步骤S1-S4,并依据预先设置的大量的训练语句训练形成;
所述意图预测模型中包括用于对所述用户指令进行预测并输出所述意图分类结果的意图分类模型,以及用于对所述用户指令进行预测并输出所述槽预测结果的槽抽取模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于芋头科技(杭州)有限公司,未经芋头科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711378005.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种未登录词识别方法
- 下一篇:确定话题点转移以及获取回复文本的方法、装置