[发明专利]语音识别的方法及系统有效
| 申请号: | 201510562502.8 | 申请日: | 2015-09-07 |
| 公开(公告)号: | CN105118501B | 公开(公告)日: | 2019-05-21 |
| 发明(设计)人: | 徐洋;胡方超;陈鹏;张玲;董雪;李源源 | 申请(专利权)人: | 徐洋 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/28 |
| 代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 尹丽云 |
| 地址: | 400065 重庆*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 识别 方法 系统 | ||
本发明适用于语音识别技术,涉及一种语音识别的方法及系统,所述方法包括:获取语音信号;将所述语音信号进行模数转换,生成相应的语音数字信号;对所述语音数字信号进行预处理,根据预处理后相应的结果提取语音特征参数,以提取所述语音特征参数的时间顺序构建相应的特征序列;将所述语音特征参数与模板库中语音模型进行匹配,根据搜索算法对所述特征序列进行解码,以生成相应的识别结果。本发明通过提取时域GFCC特征替代频域上的MFCC特征,以及采用DCT变换,减少了计算量,同时,提高了计算速度和增加了鲁棒性;通过采用加权有限状态转换的机理构建解码模型,增加了模型的平滑和压缩处理,从而提高了解码速度。
技术领域
本发明属于语音识别技术领域,特别是涉及一种嵌入式语音识别的方法及系统。
背景技术
语音识别是通过用机器识别用户声音命令来实现人机交互的关键技术,其可以显著改进人机交互的方式以使得用户可以在说出命令的同时完成更多任务。语音识别是通过在线或离线训练得到的语音识别引擎来实现的。语音识别过程通常可以分为训练阶段和识别阶段。在训练阶段中,根据语音识别引擎所基于的数学模型,从训练数据中统计地得到声学模型(acoustic model,AM)和词汇表(lexicon)。在识别阶段中,语音识别引擎使用声学模型和词汇表对输入的语音进行处理,得到语音识别结果。例如,从输入声音的声波图进行特征提取以获得特征向量,然后根据声学模型得到音素(如[i],[o]等)序列,最后从词汇表中定位与音素序列匹配度较高的单词,甚至是句子。
然而,现有的语音识别技术在识别过程中,由于语音识别系统的适应性差,且对环境依赖性强,要求测试条件和训练条件必须保持一直,否则系统性能会会大大下降;或者,高噪声环境下识别困难,特别是车载条件下,人的发音变化大,像发音失真、发音速度和音调的改变因,导致语音识别的效率低下;或者,端点检测不确定性,即使在安静环境下,语音识别系统一般以上的识别错误来自错误的端点检测,造成转化存在大量的问题。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种语音识别的方法及系统,用于解决现有语音识别的方法适应性差、对环境依赖性强和端点检测不确定性,导致解码效率低的问题。
为实现上述目的及其他相关目的,本发明提供一种语音识别的方法,包括:
获取语音信号;
将所述语音信号进行模数转换,生成相应的语音数字信号;
对所述语音数字信号进行预处理,根据预处理后相应的结果提取语音特征参数,以提取所述语音特征参数的时间顺序构建相应的特征序列;
将所述语音特征参数与模板库中语音模型进行匹配,根据搜索算法对所述特征序列进行解码,以生成相应的识别结果。
发明的另一目的还在于提供一种语音识别的系统,所述系统包括:
获取单元,适用于获取语音信号;
转换单元,适用于将所述语音信号进行模数转换,生成相应的语音数字信号;
处理单元,适用于对所述语音数字信号进行预处理,根据预处理后相应的结果提取语音特征参数,以提取所述语音特征参数的时间顺序构建相应的特征序列;
识别单元,适用于将所述语音特征参数与模板库中语音模型进行匹配,根据搜索算法对所述特征序列进行解码,以生成相应的识别结果。
如上所述,本发明为一种语音识别的方法及系统,具有以下有益效果:
首先,该语音系统从信号层、特征层和模型层方面,根据实际情况选择合适的处理方法,提高了语音识别的噪声鲁棒性和语音增加的技术;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于徐洋,未经徐洋许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510562502.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种纸尿裤、尿不湿用切料装置
- 下一篇:一种模切机用模具





