[发明专利]用于移动设备的语音识别系统和方法有效

申请号：	201110424181.7	申请日：	2011-12-16
公开（公告）号：	CN102543071A	公开（公告）日：	2012-07-04
发明（设计）人：	王海坤;何婷婷;王智国;胡国平;胡郁;刘庆峰	申请（专利权）人：	安徽科大讯飞信息科技股份有限公司
主分类号：	G10L15/00	分类号：	G10L15/00;G10L15/28
代理公司：	中科专利商标代理有限责任公司 11021	代理人：	朱进桂
地址：	230088 安徽省***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于移动设备语音识别系统方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明一般地涉及语音信号处理领域，特别地涉及一种用于移动设备的对用户语音输入执行识别的方法和装置。

背景技术

实现人机之间人性化、智能化的有效交互，构建高效自然的人机交流环境，已经成为当前信息技术应用和发展的迫切需求。特别是近年来随着无线通讯网络的普及，各种智能化的便携式移动设备在人们生活中发挥了越来越重要的作用，日益增多的人机交互要求一种新的针对小屏幕设备的更为高效自然的交互手段。语音作为最自然人性的交互手段正发挥了越来越重要的作用。例如用户在开车等不方便拨打电话时希望可以通过语音输入如“打电话给王治国”来操控移动设备，又或者在短消息编辑等需要文字输入时希望直接通过语音输入和语音识别来实现。

目前已经提出了多种语音识别技术。例如，在S.J.Young等人的“Token Passing：A Simple Conceptual Model for Connected Speech Recognition Systems”，Technical Report CUED/F-INFENG/TR38，Cambridge University Engineering Dept，1989，中公开了一种基于受限语法网络的语言识别系统。该系统对于简短的语音命令能够实现准确高效的识别，然而在随意说的普遍情况下，往往不能工作。

例如，在Aubert X.等人的“Large Vocabulary Continuous Speech Recognition of Wall Street Journal Corpus.″，Proc.ICASSP′94，Adelaide，Australia，Vol.II，pp.129-132，1994，中公开了基于大词汇量连续语音识别网络的语言识别系统。然而，这种语音识别系统的一个缺点在于需要在由大规模声学模型和通用语言模型构成的巨大的搜索空间中搜索最优路径，简短语音命令需要的快速准确响应往往得不到保障。

因此，需要一种新的用于移动设备的语音识别方法和系统，其能够实现在语音识别的准确度和效率之间平衡，提供对简短语音命令的快速准确响应，以及提供随意说的语音识别支持。

发明内容

为了实现上述目的，本发明的实施例提出了一种新的语音识别方法和装置，其支持对连续语音输入的智能响应及对简短语音命令的快速响应。

根据本发明的一个方面，提供了一种用于移动设备的语音识别方法，包括：获取用户语音输入；基于受限语法识别网络识别所述语音输入以获得第一识别结果；响应于第一识别结果不满足识别可接受条件，在本地端或通过向服务器端传输语音信号执行基于大词汇量连续语音识别网络识别所述语音输入以获得第二识别结果；以及选择所述第一和第二识别结果中的优选者作为所述语音输入的最终解码结果。

根据本发明的另一个方面，提供了一种用于移动设备的语音识别系统，包括：获取装置，用于获取用户语音输入；第一识别装置，用于基于受限语法识别网络识别所述语音输入以获得第一识别结果；第二识别装置，用于响应于第一识别结果不满足识别可接受条件，基于大词汇量连续语音识别网络识别所述语音输入以获得第二识别结果；以及解码确定装置，用于选择所述第一和第二识别结果中的优选者作为所述语音输入的最终解码结果。

根据本发明的方案具有如下特点：

用户可以在统一系统界面下实现对各类语音输入命令的识别，

可以响应用户自由随意说的语音识别，

可以快速准确响应简短语音命令识别，

对本地移动设备关联的特定信息能实现准确识别。

附图说明

通过结合附图参考下面对本发明的实施方式的详细描述，本发明的上述以及其他特征将更加明显。在附图中，

图1示意性地示出了根据本发明一个实施例的用于移动设备的语音识别的方法的流程图；

图2示出了根据本发明的一个实施例的示例受限语法识别网络；

图3示出了根据本发明的一个实施例的判断语音输入的识别结果是否满足识别可接受条件的判断流程图；

图4示出了根据本发明的一个优选实施例的用于基于大词汇量连续语音识别网络的连续语音识别的改进的Viterbi搜索方法的流程图；

图5示意性地示出了根据本发明的一个实施例的综合评判识别结果确定语音输入的最终解码结果的流程图；