[发明专利]一种语音识别系统解码方法、系统及存储介质在审
申请号: | 202211597437.9 | 申请日: | 2022-12-12 |
公开(公告)号: | CN116343794A | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 邱自成;黄高测;熊茜;韩琦;周保平;邬欢欢;吐尔洪江·马木提;王成敏;王双明 | 申请(专利权)人: | 重庆科技学院 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/02;G10L15/16;G10L15/28 |
代理公司: | 重庆信航知识产权代理有限公司 50218 | 代理人: | 穆祥维 |
地址: | 401331 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 系统 解码 方法 存储 介质 | ||
本发明提供一种语音识别系统解码方法、系统及存储介质,方法包括将待识别的语音数据进行预处理操作,得到语音特征帧序列;将语音特征帧序列送入已训练好的深度神经网络中,使用Dropout策略将深度神经网络在除输出层外的每一层随机执行Dropout,重复该操作N次,得到N个不同的深度神经网络,实现对同一个深度神经网络的充分采样;基于Dropout策略N个不同的深度神经网络对输入的语音特征帧序列进行前向传播过程,得到N路不同的深度神经网络的前向计算结果;将前向计算结果送入解码器中,使用本发明提出的同步合并无偏解码算法进行合并,得到无偏解码词图。本申请能消除语音识别系统解码结果的有偏性,得到高质量的无偏解码结果,提升了语音识别系统的性能。
技术领域
本发明涉及语音识别技术领域,具体涉及一种语音识别系统解码方法、系统及存储介质。
背景技术
随着深度学习技术的不断深入应用,语音识别系统的性能得到大幅度提升。在目前使用深度神经网络建模的语音识别系统中,不管是使用单向循环神经网络,还是使用双向循环神经网络,或者是使用卷积神经网络等,训练后均会得到一个单一的模型,然而,单个模型可视为对众多可能的候选模型所形成分布的点估计,故单个模型会带来系统性的偏差,影响语音识别系统的性能。
在采用深度神经网络进行建模的语音识别系统中,不论是在模型训练阶段还是在测试推理阶段,采用Dropout策略,就相当于是对深度神经网络构建的模型集合进行采样。而本申请的发明人经过研究发现,如果只取一种Dropout策略获得单一的深度神经网络模型,就相当于对模型集进行有偏的点估计,在解码阶段将造成无法挽回的系统误差,劣化语音识别系统的性能。
发明内容
针对现有采用深度神经网络进行建模的语音识别系统中,只取一种Dropout策略获得单一的深度神经网络模型进行采样,而单个模型可视为对众多可能的候选模型所形成分布的点估计,在解码阶段将造成无法挽回的系统误差,故单个模型会带来系统性的偏差,劣化语音识别系统性能的技术问题,本发明提供一种语音识别系统解码方法。
为了解决上述技术问题,本发明采用了如下的技术方案:
一种语音识别系统解码方法,包括以下步骤:
S1、将待识别的语音数据进行预处理操作,得到语音特征帧序列;
S2、将语音特征帧序列送入已训练好的深度神经网络中,使用基于Dropout策略的蒙特卡洛采样方法,将深度神经网络在除输出层外的每一层随机执行Dropout,重复该操作N次,得到N个不同的深度神经网络,实现对同一个深度神经网络的充分采样;
S3、基于Dropout策略的蒙特卡洛采样方法,N个不同的深度神经网络对输入的语音特征帧序列进行前向传播过程,得到N路不同的深度神经网络的前向计算结果;
S4、将得到的N路不同的深度神经网络的前向计算结果送入解码器中,使用基于多路Dropout前向计算的同步合并无偏解码算法将N路不同的深度神经网络的前向计算结果在现有解码的集束搜索步骤中进行合并,得到无偏解码词图,其中合并的基本思想是:分别利用N路前向计算结果按照现有解码算法执行N路解码过程,N路解码过程同步、独立执行,且根据N路解码过程按照合并规则创建第N+1路虚拟的解码过程,第N+1路解码过程是前N路解码过程融合、合并的结果,第N+1路解码过程输出最终的解码结果。
进一步,所述步骤S1中将待识别的语音数据顺序进行预加重、分帧加窗、离散傅里叶变换以及梅尔滤波器组预处理操作,得到语音特征帧序列。
进一步,所述步骤S2中已训练好的深度神经网络,选自CNN、LSTM、RNN、TDNN、Transformer神经网络结构中的至少一种。
进一步,所述步骤S4中N路解码过程的第1路、第2路、……、第N路解码过程同步、独立执行,均包括如下相同的搜索和剪枝步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆科技学院,未经重庆科技学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211597437.9/2.html,转载请声明来源钻瓜专利网。