[发明专利]基于双模型识别的语音领域命令理解方法在审
申请号: | 201811076254.6 | 申请日: | 2018-09-14 |
公开(公告)号: | CN109192201A | 公开(公告)日: | 2019-01-11 |
发明(设计)人: | 段礼强;李贤;乐雨泉 | 申请(专利权)人: | 苏州亭云智能科技有限公司 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/08;G10L15/22 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 谈杰 |
地址: | 215000 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音领域 条件随机场模型 循环神经网络 模型识别 语音 话语 后处理单元 控制指令 模型处理 目标序列 判断结果 出错率 试题 标签 输出 外部 | ||
本发明涉及一种基于双模型识别的语音领域命令理解方法,外部输入话语先经循环神经网络模型处理并进行语音意图的判断,在得出判断结果后再经条件随机场模型生成目标序列标签,从而提取出语音实体,所述条件随机场模型再向后处理单元输出所提取到的语音试题的数据,生成最终的控制指令。本发明中的循环神经网络模型的目标是为判断用户的话语是否表达了一个语音领域的意图,如此能够提高识别准确性,降低识别出错率。
技术领域
本发明涉及人机交互领域中的语言识别技术领域,特别是涉及一张基于双模型识别的语音领域命令理解方法
背景技术
对话系统是人机交互的一种相当重要的形式,也是自然语言处理过程中的一个关键的研究方向。在语音领域,能否正确解析出用户话语命令是完成用户指定任务的基础,在很多地方比如语音助手、语音平台都有很丰富的应用场景。
对于用户某条话语,目前常使用的条件随机场(CRF)模型并不能很好的区分其是否表达了一个语音领域内的意图。CRF一般在序列标注、命名实体识别过程表现较好,但在识别语音实体之前,需要判断此用户话语是否表达语音意图,否则可能识别出错,甚至无法识别。
如能够先进行语音意图的识别,可带来两个好处,一是若判断用户话语没有表达语音意图,则不需要进行后续实体提取操作,因为此时已经完成无语音意图解析操作,二是若对用户话语的语音意图不做判断的话,则很有可能一段用户话语没有表现语音意图,但是被错误的提取出了语音实体,比如“刘德华的老婆是谁”这句用户话语,若不先进行语音意图判断操作,则很有可能将“刘德华”识别成歌手实体,从而这句话也被解析成语音意图,而实际上这句话并没有表达语音领域的相关意图。
发明内容
本发明的目的是要提供一种基于双模型识别的语音领域命令理解方法,其中循环神经网络模型的目标是为判断用户的话语是否表达了一个语音领域的意图,如此能够提高识别准确性,降低识别出错率。
为达到上述目的,本发明采用的技术方案是:
本发明提供了一种基于双模型识别的语音领域命令理解方法,外部输入话语先经循环神经网络模型处理并进行语音意图的判断,在得出判断结果后再经条件随机场模型生成目标序列标签,从而提取出语音实体,所述条件随机场模型再向后处理单元输出所提取到的语音试题的数据,生成最终的控制指令。
对于上述技术方案,申请人还有进一步的实施方案。
进一步地,外部输入话语先经分子处理单元对其进行按字切分后形成初始训练集,再将初始训练集输入所述循环神经网络模型进行处理。
更进一步地,在循环神经网络模型中进行处理的具体步骤如下:
步骤A1:计算第t时刻的隐藏状态ht,ht由上一层的隐藏状态和本层的输入共同决定,
ht=f(Uxt+Wht-1)其中,xt是第t时刻的输入,f为非线性的激活函数,U、W为变换矩阵;
步骤A2:计算预测标签值S,
S=sigmod(VhT),其中,V为变换矩阵,hT为序列最后一个时刻的隐藏状态;
步骤A3:确定分类类型,
根据预测标签值S确定分类,如S为正值则分类为正类,确认外部输入话语为语音意图,继续进入条件随机场模型进行处理,如S为负值则分类为负类,确认外部输入话语为非语音意图,退出此次处理。
进一步地,在条件随机场模型中进行处理时,外部输入为句子序列,输出目标为句子标注序列标签,然后根据标注序列标签提取对应的语音实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州亭云智能科技有限公司,未经苏州亭云智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811076254.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音识别方法
- 下一篇:语音安全识别方法、装置、计算机设备及存储介质