[发明专利]语音识别模型构建方法、装置、介质及电子设备有效

专利信息
申请号: 202010032715.0 申请日: 2020-01-13
公开(公告)号: CN111243599B 公开(公告)日: 2022-12-20
发明(设计)人: 邱硕;郭燕芳;段亦涛;孙艳庆 申请(专利权)人: 网易有道信息技术(北京)有限公司
主分类号: G10L15/26 分类号: G10L15/26;G10L15/06;G10L15/02;G10L15/16
代理公司: 北京维昊知识产权代理事务所(普通合伙) 11804 代理人: 张素红
地址: 100193 北京市海淀区西北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 识别 模型 构建 方法 装置 介质 电子设备
【权利要求书】:

1.一种语音识别模型构建方法,其特征在于,包括:

根据预构建的词典模型网络L和预构建的语言模型网络G构建第一网络LG;其中,所述词典模型网络包含多个输出边;

检测包含词级别状态序列的目标输出边对应的起始状态以及终止状态;通过空字符转写所述目标输出边中所述词级别状态序列对应的字符以将所述词级别状态序列拆解转换为字级别状态序列,以生成包含字级别状态序列的目标路径;其中所述目标路径起始于所述目标输出边对应的所述起始状态,终止于所述目标输出边对应的所述终止状态;所述目标路径包括所述词级别状态序列对应的字级别状态序列;

通过所述目标路径替换所述第一网络LG中的所述目标输出边,以根据替换处理后的所述第一网络LG以及预训练的第二网络构建语音识别模型。

2.根据权利要求1所述的语音识别模型构建方法,其特征在于,根据预构建的词典模型网络L和预构建的语言模型网络G构建第一网络LG,包括:

获取预构建的词典模型网络L和预构建的语言模型网络G;

通过组合构图算法将所述词典模型网络L以及所述语言模型网络G进行组合,构建第一网络LG。

3.根据权利要求2所述的语音识别模型构建方法,其特征在于,在构建第一网络LG之后,所述方法还包括:

对所述第一网络LG进行优化处理以得到优化后的所述第一网络LG;其中,所述优化处理包括确定化操作处理、最小化操作处理、空转移处理和权重推移处理中的一种或者多种。

4.根据权利要求3所述的语音识别模型构建方法,其特征在于,所述第二网络包括预训练的声学模型网络H和预训练的发音模型网络C,所述根据替换处理后的所述第一网络LG以及预训练的第二网络构建语音识别模型,包括:

通过所述组合构图算法将优化后的所述第一网络LG与所述发音模型网络C进行组合生成第三网络CLG,并对所述第三网络CLG进行优化处理得到优化后的所述第三网络CLG;

通过所述组合构图算法将优化后的所述第三网络CLG与所述声学模型网络H进行组合生成第四网络HCLG,并对所述第四网络HCLG进行优化处理以根据优化后的所述第四网络HCLG构建语音识别模型。

5.一种语音识别方法,其特征在于,包括:

获取待识别的语音数据,并提取所述语音数据对应的声学特征;

将所述声学特征输入到权利要求1至4任一方法中所构建的语音识别模型,以获取将所述声学特征转换为字级别状态序列的各输出路径对应的概率数据;

获取所述概率数据最大的目标输出路径中字级别状态序列对应的词语数据;

将得到的多个所述词语数据按照输出顺序进行组合以生成所述语音数据对应的文本数据。

6.根据权利要求5所述的语音识别方法,其特征在于,将所述声学特征输入到权利要求1至4任一方法中所构建的语音识别模型,以获取将所述声学特征转换为字级别状态序列的各输出路径对应的概率数据,包括:

将所述声学特征输入到所述语音识别模型中的声学模型网络H,以获取将所述声学特征转换为发音属性的各输出路径对应的第一概率;

将所述声学特征转换为发音属性的各输出路径输出的发音属性作为发音模型网络C的输入,以获取将所述发音属性转换为音素的各输出路径对应的第二概率;

将所述发音属性转换为音素的各输出路径输出的音素作为第一网络LG的输入,以获取将所述音素转换为字级别状态序列的各输出路径的第三概率;

将通过所述第一概率、所述第二概率以及所述第三概率计算得到的总概率作为将所述声学特征转换为字状态序列的各输出路径对应的概率数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易有道信息技术(北京)有限公司,未经网易有道信息技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010032715.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top