[发明专利]一种语音识别方法、设备及计算机可读存储介质有效
申请号: | 201911389657.0 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111048091B | 公开(公告)日: | 2022-11-18 |
发明(设计)人: | 温亚 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/06 |
代理公司: | 北京乐知新创知识产权代理事务所(普通合伙) 11734 | 代理人: | 江宇 |
地址: | 215024 江苏省苏州市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 设备 计算机 可读 存储 介质 | ||
本发明公开了一种语音识别方法、设备及计算机可读存储介质,所述方法包括:获得对应引导指令的响应信息;基于对应所述引导指令的识别资源对所述响应信息进行语音识别,获得语音识别结果;基于所述语音识别结果确定目标意图;应用本发明实施例提供的语音识别方法在对话场景里,可以结合对话逻辑,动态去配置请求识别的识别资源,进而实现整个语音交互系统的更细粒度的动态资源配置切换,从而实现更深度的识别性能优化。
技术领域
本发明涉及语音处理技术领域,尤其涉及一种语音识别方法、设备及计算机可读存储介质。
背景技术
智能语音交互,主要基于语音识别、语义理解、对话管理、语音合成几个部分,在多种实际应用场景下,赋予设备“听、懂、说”的智能人机交互体验。市场上的智能语音交互设备,也逐渐的从单轮交互变为更为灵活的多轮交互。在整个交互过程中,语音识别的能力,直接影响到了语义理解的精准度,语义理解的准确度,又直接影响到了对话逻辑。所以,整个语音交互系统是一个多模块环环相扣的智能系统。而语音识别性能高低在整个过程中起到了至关重要的作用。
当前对于多轮语音交互系统,在语音识别性能层面的优化,主要集中在系统架构层面,针对于语音识别模块,结合通用领域和业务定制领域,对语音交互过程进行整体优化。
采用通用领域和业务定制领域的语音识别设备,通常只是整体的语音交互性能优化,语音识别能力仍然有所欠缺。
发明内容
本发明实施例提供了一种语音识别方法、设备及计算机可读存储介质,提升语音识别性能,使得整个语音交互体验更佳。
本发明一方面提供一种语音识别方法,所述方法包括:获得对应引导指令的响应信息;基于对应所述引导指令的识别资源对所述响应信息进行语音识别,获得语音识别结果;基于所述语音识别结果确定目标意图。
在一可实施方式中,所述识别资源包括如下至少之一:用于对应简单问答第一识别资源、用于对应姓名称呼识的第二识别资源、用于对应业务内容的第三识别资源、用于对应地址信息的第四识别资源、用于对应电话号码的第五识别资源、用于对应通用业务的第六识别资源。
在一可实施方式中,所述识别资源为自适应语言模型;所述基于对应所述引导指令的识别资源对所述响应信息进行语音识别,获得语音识别结果,包括:通过自适应语言模型和声学模型对所述响应信息进行识别,获得对应通用领域的第一识别内容、对应业务定制领域的第二识别内容和对应场景定制的第三识别内容;通过解码器对所述第一识别内容、第二识别内容和第三识别内容进行解码融合,获得所述语音识别结果。
在一可实施方式中,所述方法还包括:当无法确定所述语音识别结果的目标意图时,获取执行所述确定目标意图的累计次数;确定所述累计次数是否超出次数阈值;当确定为所述累计次数未超出次数阈值时,执行对应所述引导指令的补充指令。
在一可实施方式中,所述方法还包括:当确定为所述累计次数超出次数阈值时,将所述响应信息发送至指定端。
本发明另一方面提供一种语音识别设备,所述设备包括:获得模块,用于获得对应引导指令的响应信息;识别模块,用于基于对应所述引导指令的识别资源对所述响应信息进行语音识别,获得语音识别结果;第一确定模块,用于基于所述语音识别结果确定目标意图。
在一可实施方式中,所述识别资源包括如下至少之一:用于对应简单问答第一识别资源、用于对应姓名称呼识的第二识别资源、用于对应业务内容的第三识别资源、用于对应地址信息的第四识别资源、用于对应电话号码的第五识别资源、用于对应通用业务的第六识别资源。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911389657.0/2.html,转载请声明来源钻瓜专利网。