[发明专利]嵌入式平台大词汇量语音命令词的识别方法无效
| 申请号: | 200910242404.0 | 申请日: | 2009-12-10 |
| 公开(公告)号: | CN101751924A | 公开(公告)日: | 2010-06-23 |
| 发明(设计)人: | 刘加;钱彦旻 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/12 |
| 代理公司: | 北京众合诚成知识产权代理有限公司 11246 | 代理人: | 童晓琳 |
| 地址: | 100084 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 嵌入式 平台 词汇量 语音 命令 识别 方法 | ||
技术领域
本发明属于语音识别技术领域,尤其涉及一种嵌入式平台大词汇量语音命令词的识别方法。
背景技术
语音识别技术是指使用机器从一段语音信号中识别出语音的具体内容,广泛地应用于各种人机交互系统。随着语音技术,特别是语音识别技术的飞速发展,语音识别的应用已经越来越普遍,尤其是一些简单的命令词识别系统更是因为其识别率高,性能稳定,人机交互便捷等有利条件而获得了越来越大的应用和市场前景。比如声控服务机器人、语音识别玩具、电话转接系统、简易旅游服务导航系统等。
近些年,国外一些语音技术和半导体公司都投入大量人力和物力开发语音识别专用芯片,并对自己的语音识别算法进行专利保护。这些专用芯片的语音识别算法过程通常如图1所示,输入的语音信号首先经过A/D进行采样,频谱整形加窗预加重处理,提高高频成分,进行实时特征参数提取,提取的参数为Mel频标倒谱系数(MFCC,Mel Frequency Cepstrum Coefficient),同时进行语音识别模型训练和语音识别模板匹配。
传统的基于PC计算机上大词汇量语音命令词识别系统如图2所示,采用完全树状解码网络,该网络结构复杂,虽然可以减少剪枝路径数量,但是网络结构的实现上需要大量的链表和指针,造成存储量空间迅速增长;当识别任务是中小词表语音识别系统时,一般都采用并行的解码网络结构,如图3所示。这种识别网络实现容易,比较适合中小词表的嵌入式识别系统。在解码识别策略方面,一般采用一阶段的最优维特比束搜索剪枝方法。
然而,由于嵌入式系统存储器资源和CPU计算资源都很有限,这种传统的方法不适应于嵌入式平台上语音命令词识别的实现,当识别任务到达万级词汇量甚至几十万时,上述介绍的传统语音网络建模和剪枝方法根本无法承受庞大的词表所带来的存储和计算资源的负担。
发明内容
针对上述背景技术中提出的使用传统语音命令词识别的方法,不适于嵌入式平台的问题,本发明提出了一种嵌入式平台大词汇量语音命令词的识别方法。
本发明的技术方案是,一种嵌入式平台大词汇量语音命令词的识别方法,包括步骤:语音信号的预处理和语音识别参数的提取、建立语音声学模型并进行语音模型训练、构建树形识别网络、应用快速识别搜索算法,其特征在于,所述语音声学模型,采用基于声母右相关的词内双音子模型;
所述构建树形识别网络具体是,构建基于相同父音节的树形识别网络,合并有相同父音节的结点;
所述快速识别搜索算法,根据所述基于相同父音节的树形识别网络,采用动态调整窗宽的状态级剪枝策略以及帧同步词级剪枝策略。
所述动态调整窗宽的状态级剪枝策略采用公式:Br=max{-n·fa+BMAX,BMIN}调整窗宽;其中,其中n是帧序号,fa是窗宽调整因子,BMAX,BMIN,和Br分别代表窗宽的上限、下限以及实际所用的窗宽。
所述帧同步词级剪枝策略采用公式:Wr=max{-fi·(n-Ni)+Wi,WMIN},i=1,2,3,...控制词级剪枝速度,其中n是帧序号,WMIN和Wr分别是词级剪枝的下界和实际剪枝后的候选词条数量,Ni是剪枝速度发生改变的帧序号,fi是词级剪枝的速度因子。
本发明的有益效果是,通过改进传统的嵌入式语音识别方法,到达内存和CPU资源的高效利用的目的;在保证高识别率的基础上,既减少了识别系统所需要的存储空间,又大幅的缩减了CPU的计算资源需求,提高了大词汇量语音命令词识别的速度。
附图说明
图1是常用的语音识别的过程示意图;
图2是PC计算机上采用的完全树状的解码网络示意图;
图3是传统的嵌入式平台并行解码网络示意图;
图4是本发明中使用的基于相同父音节的树形结构识别网络示意图;
图5是本发明中使用的帧同步词级剪枝策略的示意图。
具体实施方式
下面结合附图,对优选实施例作详细说明。应该强调的是,下述说明仅仅是示例性的,而不是为了限制本发明的范围及其应用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910242404.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:具自发光电路板的键盘
- 下一篇:车辆查询系统





