[发明专利]语音识别模型生成方法、装置、设备以及存储介质在审
申请号: | 202111095442.5 | 申请日: | 2021-09-17 |
公开(公告)号: | CN113744729A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 朱文涛;陆顺;孔天龙;李吉祥;张大威;邓峰;王晓瑞;杨森;刘霁 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/16 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 模型 生成 方法 装置 设备 以及 存储 介质 | ||
本公开提供一种语音识别模型生成方法、装置、设备以及存储介质,涉及网络信息处理技术领域,以得到更优的语音识别模型。该方法包括:获取语音样本数据;构建第一语音识别超网络,第一语音识别超网络包括多层网络结构,每层网络结构对应搜索特征取值的多个不同组合,搜索特征包括分支个数、网络层维度和通道选择维度;搜索特征包括分支个数、网络层维度和通道选择维度;基于语音样本和语音样本标签,对第一语音识别超网络执行训练操作,得到第二语音识别超网络;语音样本标签作为语音样本对应的期望识别值;对第二语音识别超网络进行网络搜索,以得到目标语音识别子网络;对目标语音识别子网络进行重训练,得到语音识别模型。
技术领域
本公开涉及网络信息处理技术领域,尤其涉及一种语音识别模型生成方法、装置、设备以及存储介质。
背景技术
相较于其它生物识别技术,如:人脸识别,指纹识别和虹膜识别,语音信息更容易被被采集,同时,对于语音信息识别的应用,也逐步延伸到各个领域。
目前的语音识别技术可通过基于深度学习的时延神经网络(Time-Delay NeuralNetwork,TDNN)模型,以及延伸时延神经网络(extended Time-Delay Neural Network,E-TDNN)模型等等进行语音识别,然而,现有的语音识别的错误率较高,从而影响最终语音识别效果。
发明内容
本公开提供一种语音识别模型生成方法、装置、设备以及存储介质,以提供一种更优的语音识别模型。本公开的技术方案如下:
根据本公开的第一方面,提供一种语音识别模型生成方法,该语音识别模型生成方法包括:电子设备获取语音样本数据;语音样本数据包括语音样本和语音样本标签;构建第一语音识别超网络,第一语音识别超网络包括多层网络结构,每层网络结构对应搜索特征取值的多个不同组合,搜索特征包括分支个数、网络层维度和通道选择维度;基于语音样本和语音样本标签,对第一语音识别超网络执行训练操作,得到第二语音识别超网络;语音样本标签作为语音样本对应的期望识别值;对第二语音识别超网络进行网络搜索,以得到目标语音识别子网络;目标语音识别子网络包括多层网络结构,每层网络结构对应搜索特征取值的一个组合;对目标语音识别子网络进行重训练,得到语音识别模型。
可选的,方法还包括:确定第一语音识别超网络中每层网络结构的多个分支个数,并根据每个分支个数,构建每层网络结构的分支模块;对每层网络结构的分支模块的特征进行第一数据处理,得到每层网络结构的多个网络层维度,第一数据处理包括合并处理、多阶处理或拼接处理中的至少一个。
可选的,方法还包括:确定第一语音识别超网络中每层网络结构的多个分支个数,并根据每个分支个数,构建每层网络结构的多个分支模块;对每层网络结构的分支模块的通道选择层进行第二数据处理,得到每层网络结构的多个通道选择维度,第二数据处理包括全连接处理和/或矩阵处理。
可选的,基于语音样本和语音样本标签,对第一语音识别超网络执行训练操作,得到第二语音识别超网络,包括:步骤A:对第一语音识别超网络中每层网络结构对应搜索特征取值的多个不同组合进行随机采样,得到每层网络结构对应搜索特征取值的一个组合;基于每层网络结构对应搜索特征取值的一个组合,得到第一语音识别子网络;步骤B:根据语音样本和语音样本标签训练第一语音识别子网络,得到第二语音识别子网络;步骤C:将第二语音识别子网络中的参数同步至第一语音识别超网络中;迭代执行步骤A-步骤C,得到第二语音识别超网络。
可选的,语音样本包括多组语音子样本,步骤B,包括:根据语音样本和语音样本标签,多批次训练第一语音识别子网络,得到多个第二语音识别子网络;其中,每批次训练采用一组语音子样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111095442.5/2.html,转载请声明来源钻瓜专利网。