[发明专利]一种语音识别方法、装置、设备以及存储介质在审
申请号: | 202011054844.6 | 申请日: | 2020-09-28 |
公开(公告)号: | CN112349289A | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 吴帅;李健;武卫东;陈明 | 申请(专利权)人: | 北京捷通华声科技股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/02;G10L15/06;G10L15/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 设备 以及 存储 介质 | ||
1.一种语音识别方法,其特征在于,所述方法包括:
获取待识别语音音频的声学特征,并将所述声学特征输入解码器;其中,所述解码器包括声学模型和语言模型;
获取所述解码器生成的候选文本,并计算所述候选文本的识别分数;
根据所述声学特征、所述候选文本、所述识别分数以及所述待识别语音音频的类别特征,生成特征矩阵;
将所述特征矩阵输入权重调整模型;
将所述权重调整模型输出的最佳权重返回所述解码器;
根据所述最佳权重更新所述解码器中所述声学模型与所述语言模型的第一结合权重;
获取更新所述第一结合权重后的解码器输出的翻译文本。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取语音音频样本以及对应所述语音音频样本的文本数据;
提取所述语音音频样本的声学特征样本,并将所述声学特征样本输入预设解码器;其中,所述预设解码器包括预设声学模型和预设语言模型;
获取所述预设解码器生成的候选文本样本,并计算所述候选文本样本的识别分数样本;
根据所述声学特征样本、所述候选文本样本、所述识别分数样本以及所述语音音频样本的类别特征样本,生成特征矩阵样本;
将所述特征矩阵样本输入所述预设模型;
将所述预设模型输出的最佳权重区间返回所述预设解码器;
根据所述最佳权重区间更新所述预设解码器中所述预设声学模型与所述预设语言模型的第二结合权重,并获取所述预设解码器基于更新后的第二结合权重输出的预测文本;
根据所述预测文本相较于所述文本数据的相差程度,对所述预设模型的参数进行至少一次更新,得到所述权重调整模型。
3.根据权利要求1所述的方法,其特征在于,在获取更新所述第一结合权重后的解码器输出的翻译文本之前,所述方法还包括:
根据所述声学模型、所述语言模型和所述最佳权重,设置文本筛选分数计算公式;
获取更新所述第一结合权重后的解码器输出的翻译文本,包括:
将所述待识别语音音频的声学特征输入更新所述第一结合权重后的解码器;
获取所述解码器生成的多个识别文本;
利用所述文本筛选分数计算公式,对所述多个识别文本分别计算得分;
将得分最高的识别文本确定为所述翻译文本。
4.根据权利要求2所述的方法,其特征在于,根据所述最佳权重区间更新所述预设解码器中所述预设声学模型与所述预设语言模型的第二结合权重,包括:
依次利用所述最佳权重区间的每一个权重取值更新所述第二结合权重;
获取所述预设解码器基于更新后的第二结合权重输出的预测文本,包括:
在每一次利用所述最佳权重区间的权重取值更新第二结合权重后,获取所述预设解码器输出的预测文本;
根据所述预测文本相较于所述文本数据的相差程度,对所述预设模型的参数进行至少一次更新,得到所述权重调整模型,包括:
依次计算每一次获取的预测文本相较于所述文本数据的错误率;
将最小错误率对应的预测文本确定为目标预测文本;
将输出所述目标预测文本时所述预设解码器使用的权重取值确定为最佳权重参考值;
根据所述最佳权重参考值,对所述预设模型的参数进行至少一次更新,得到所述权重调整模型。
5.根据权利要求4所述的方法,其特征在于,在将所述预设模型输出的最佳权重区间返回所述预设解码器之前,所述方法还包括:
利用牛顿迭代法根据所述特征矩阵样本,搜索得到所述最佳权重区间;
根据所述最佳权重参考值,对所述预设模型的参数进行至少一次更新,得到所述权重调整模型,包括:
计算所述最佳权重参考值与所述最佳权重区间的损失值;
根据所述损失值,更新所述预设模型中用于执行牛顿迭代法使用的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声科技股份有限公司,未经北京捷通华声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011054844.6/1.html,转载请声明来源钻瓜专利网。