[发明专利]语音辨识方法及其电子装置有效
| 申请号: | 201310489578.3 | 申请日: | 2013-10-18 |
| 公开(公告)号: | CN103578471A | 公开(公告)日: | 2014-02-12 |
| 发明(设计)人: | 张国峰;朱逸斐 | 申请(专利权)人: | 威盛电子股份有限公司 |
| 主分类号: | G10L15/183 | 分类号: | G10L15/183;G10L15/28 |
| 代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
| 地址: | 中国台湾新北*** | 国省代码: | 中国台湾;71 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 辨识 方法 及其 电子 装置 | ||
1.一种语音辨识方法,用于一电子装置,其特征在于,该语音辨识方法包括:
自一语音信号获得一特征向量;
输入该特征向量至多个语音辨识模块,并自所述语音辨识模块分别获得多个字串概率及多个候选字串,其中所述语音辨识模块分别对应至多种语言;以及
选择所述字串概率中最大者所对应的候选字串,以作为该语音信号的辨识结果。
2.根据权利要求1所述的语音辨识方法,其特征在于,输入该特征向量至所述语音辨识模块,并自所述语音辨识模块分别获得所述字串概率与所述候选字串的步骤包括:
输入该特征向量至每一个所述语音辨识模块的声学模型,并基于对应的声学词典,获得相对于每一种语言的候选词;以及
输入所述候选词至每一个所述语音辨识模块的语言模型,以获得所述语言对应的所述候选字串以及所述字串概率。
3.根据权利要求2所述的语音辨识方法,其特征在于,还包括:
基于所述语言各自对应的语音数据库,经由训练而获得上述声学模型与上述声学词典;以及
基于所述语言各自对应的语料库,经由训练而获得上述语言模型。
4.根据权利要求1所述的语音辨识方法,其特征在于,还包括:
通过一输入单元接收该语音信号。
5.根据权利要求1所述的语音辨识方法,其特征在于,自该语音信号获得该特征向量的步骤包括:
将该语音信号切割为多个音框;以及
自每一所述音框取得多个特征参数,借以获得该特征向量。
6.一种电子装置,其特征在于,包括:
一处理单元;
一储存单元,耦接至该处理单元,且储存多个程序码片段,以供该处理单元执行;以及
一输入单元,耦接至该处理单元,且接收一语音信号;
其中,该处理单元通过所述程序码片段来驱动多种语言所对应的多个语音辨识模块,并执行:自该语音信号获得一特征向量,并且输入该特征向量至所述语音辨识模块,而自所述语音辨识模块分别获得多个字串概率及多个候选字串;以及选出所述字串概率中最大者所对应的候选字串。
7.根据权利要求6所述的电子装置,其特征在于,该处理单元输入该特征向量至每一所述语音辨识模块的声学模型,并基于对应的声学词典,获得相对于每一所述语言的候选词,并且输入所述候选词至每一所述语音辨识模块的语言模型,以获得所述语言对应的所述候选字串以及所述字串概率。
8.根据权利要求7所述的电子装置,其特征在于,该处理单元基于所述语言各自对应的语音数据库,经由训练而获得上述声学模型与上述声学词典,并且基于所述语言各自对应的语料库,经由训练而获得上述语言模型。
9.根据权利要求6所述的电子装置,其特征在于,该处理单元通过所述程序码片段来驱动一特征撷取模块,以执行:切割该语音信号为多个音框,并自每一所述音框取得多个特征参数,借以获得该特征向量。
10.根据权利要求6所述的电子装置,其特征在于,还包括:
一输出单元,输出所述字串概率中最大者所对应的候选字串。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于威盛电子股份有限公司,未经威盛电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310489578.3/1.html,转载请声明来源钻瓜专利网。





