[发明专利]一种提高语音辨识效率的方法及其语音辨识装置无效
| 申请号: | 200810232600.5 | 申请日: | 2008-12-05 |
| 公开(公告)号: | CN101419797A | 公开(公告)日: | 2009-04-29 |
| 发明(设计)人: | 赵仁宏 | 申请(专利权)人: | 无敌科技(西安)有限公司 |
| 主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/20 |
| 代理公司: | 西安智邦专利商标代理有限公司 | 代理人: | 商宇科 |
| 地址: | 710075陕西省*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 提高 语音 辨识 效率 方法 及其 装置 | ||
技术领域
本发明涉及一种提高语音辨识效率的方法及其语音辨识装置,尤其涉及一种通过删除非语音区来提升语音辨识准确率的方法及装置。
背景技术
语音辨识最基本的定义,即“计算机能听懂人类说话的语句或命,而做出相对应的工作”。也就是,如果计算机配备有“语音辨识”的功能,当声音通过一个转换装置转换为一种语音信号输入到一个电子装置内部,并加以储存后,语音辨识程序便开始以你输入的声音样本与事先储存好的声音样本进行比对的工作。语音信号比对工作完成的后,电子装置就会输入一个它认为最“像”的声音样本序号,即可辨识刚才发出的声音是什么含意,进而执行此命。但要真正建立辨识率高的语音辨识程序组,其难度十分高。举例而言,如要辨识十个词汇,那就是先把这十个字汇的声音念入计算机中,存成十个参考样本,辨识时,只需将接收到的语音讯号与事先记录的十个参考样本一一比对,找出与测试样本最像的样本,即可把测试样本辨识出來。但每个使用者念入计算机的语音长度、音调、频率都不一样,甚至同一位使用者,尽管每次都念相同的声音,但波形也会不尽相同,如果在一个有杂音的环境中,那情况将更糟。因此,许多人都在研究如何解决这个难题。
对于此种问题,有人尝试用如傅立叶转换、倒频谱参数等,但是结果还是不理想。
此外,准确率越高的语音辨识程序组所需要的运算量也就越大,所以就无法在以往低运算量处理器的便携式装置上实现高准确率的语音辨识。然而,目前便携式装置已经十分普遍,几乎是人人每天都会使用。鉴于以上问题本发明提出了一种运算量低并且辨识准确率高的方法以及语音辨识装置。
发明内容
为了解决现有技术中所提到的辨识准确率低,需要处理器运算率高而现有都是可携式装置的缺点,本发明提供了一种运算量低并且辨识准确率高的语音辨识方法及其语音辨识装置。
本发明的技术解决方案:本发明为一种提高语言辨识效率的方法,其特殊之处在于:该方法包括以下步骤:
1)提供至少一辨识数据并在其中设置一第一特征参数;
2)接收一语音信号;
3)利用语音活动检测程序,侦测该语音信号的开始和结束的位置,从而取得第一语音波段;
4)判别第一语音波段中的语音区及非语音区,并在该第一语音波段的语音区设置一第二特征参数,所述第二特征参数与第一特征参数相对应;
5)利用语音活动检测程序,删除第一语音波段中的非语音区从而产生第二语音波段;
6)将辨识数据中的第一特征参数与第二语音波段中的第二特征参数进行比对,以判断第二语音波段是否符合该辨识数据,以完成语音辨识。
上述辨识数据是已利用语音活动检测程序经过删除非语音区处理的辨识数据。
上述非语音区是指静音或噪音。
上述辨识数据、第二语音波段均是数字信号。
上述辨识数据是为使用者预先录制的语音数据或是厂商预先储存于电子装置内的语音数据。
上述语音数据是语音指令。
上述语音信号是一语音指令。
一种使用上述的提高语言辨识效率的方法的语音辨识装置,其特殊之处在于:该装置包含用于储存至少一个已经过非语音区删除处理的辨识数据的储存单元,用于接收声音并将声音转化为语音信号的接收单元,用于侦测语音信号开始及结束的位置以取得第一语音波段、并删除第一语音波段中的非语音区以产生第二语音波段,继而比对辨识数据与第二语音波段,以判断第二语音波段是否符合辨识数据的处理单元,以及用于判别第一语音波段中语音区和非语音区的判别单元;接收单元接入处理单元,处理单元分别与判别单元和储存单元相连。
本发明具有以下优点:
(1)本发明运用了语音活动侦测程序以决定进行语音辨识时语音讯号开始和结束的位置,取得进行语音辨识的第一语音波段后,例如:语音段落,再进行二次处理,将第一语音波段段落中的非语音区(静音或噪声)消除后以产生一不具非语音区的第二语音波段,并利用多个辨识数据辨识此第二语音波段,依此提高辨识的效率。
(2)本发明的方法中仅需处理语音的部分,这样就可以减少系统的负荷程度或是不需要较高效能的微处理器(CPU)。
附图说明
图1为本发明提高语音辨识效率的方法的步骤流程图;
图2为本发明的语音辨识装置的实施例方块图;
图3为本发明的实施例示意图一;
图4为本发明的实施例示意图二。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无敌科技(西安)有限公司,未经无敌科技(西安)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810232600.5/2.html,转载请声明来源钻瓜专利网。





