[发明专利]语音识别方法、模型训练方法、装置、介质、电子设备在审
申请号: | 202211033301.5 | 申请日: | 2022-08-26 |
公开(公告)号: | CN115376498A | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 周立峰;朱浩齐;杨卫强;李雨珂;魏凯峰 | 申请(专利权)人: | 杭州网易智企科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/02;G10L17/04;G10L17/06;G10L25/51;G10L25/03 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 孙宝海 |
地址: | 310052 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 模型 训练 装置 介质 电子设备 | ||
本公开的实施方式涉及计算机技术领域,更具体地,本公开的实施方式涉及语音识别方法、模型训练方法、装置、介质、电子设备。方法包括:将待识别音频数据输入至第一语音特征提取子模型,得到待识别音频数据的初始特征数据;将初始特征数据输入第二语音特征提取子模型中,第二语音特征提取子模型包括频域分支以及时域分支,频域分支用于输出待识别音频数据的频域特征数据,时域分支用于输出的待识别音频数据的时域特征数据;将频域特征数据和时域特征数据输入语音鉴伪子模型中,得到待识别音频数据的分类结果,分类结果用以指示待识别音频数据是否为真实语音。本公开的技术方案能够提高语音识别的效率。
技术领域
本公开的实施方式涉及计算机技术领域,更具体地,本公开的实施方式涉及语音识别方法、模型训练方法、装置、介质、电子设备。
背景技术
本部分旨在为权利要求中陈述的本公开的实施方式提供背景或上下文,此处的描述不因为包括在本部分中就承认是现有技术。
随着语音技术的发展,已经有诸如语音合成(text to speech)、语音转换(voiceconversion)等技术,进行语音处理。例如,通过语音合成技术,可以将输入的文字信息转变为可播放的语音数据;通过语音转换技术,可以将输入的第一人的语音数据(对应内容A)和第二人的语音数据(对应内容B)转换输出第一人的对应内容B的语音数据(和/或第二人的对应内容A的语音数据)。而这些通过语音处理获得的伪造语音可能被用于诸如诈骗、声纹解锁等场景,从而造成财产安全问题,由此,如何对伪造语音进行识别是本领域亟待解决的技术问题。
发明内容
目前,伪造语音常常通过人工审核来识别,即通过人工听语音的方式判断语音数据为真实语音还是伪造语音。然而,由于大数据时代,待识别的语音数据的数量非常庞大,人工审核的方式,无论是人力成本还是识别所需时长,皆无法满足语音识别的需求。
为此,非常需要一种语音识别方法、模型训练方法、装置、介质、电子设备,提高语音识别的效率。
在本上下文中,本公开的实施方式期望提供一种语音识别方法、模型训练方法、装置、介质、电子设备。
根据本公开的一个方面,提供一种语音识别方法,包括:
将待识别音频数据输入至第一语音特征提取子模型,得到所述待识别音频数据的初始特征数据,所述第一语音特征提取子模型为预先训练的语音识别模型的子模型,所述语音识别模型还包括第二语音特征提取子模型和语音鉴伪子模型;
将所述初始特征数据输入所述第二语音特征提取子模型中,所述第二语音特征提取子模型包括频域分支以及时域分支,所述频域分支用于输出所述待识别音频数据的频域特征数据,所述时域分支用于输出的所述待识别音频数据的时域特征数据;
将所述频域特征数据和所述时域特征数据输入所述语音鉴伪子模型中,得到所述待识别音频数据的分类结果,所述分类结果用以指示所述待识别音频数据是否为真实语音。
根据本公开的一个方面,提供语音识别模型训练方法,包括:
将样本音频数据输入至第一语音特征提取子模型,得到所述样本音频数据的初始特征数据,所述第一语音特征提取子模型为预先训练的语音识别模型的子模型,所述语音识别模型还包括第二语音特征提取子模型和语音鉴伪子模型;
将所述初始特征数据输入所述第二语音特征提取子模型中,所述第二语音特征提取子模型包括频域分支以及时域分支,所述频域分支用于输出所述样本音频数据的频域特征数据,所述时域分支用于输出所述样本音频数据的时域特征数据;
将所述频域特征数据和所述时域特征数据输入所述语音鉴伪子模型中,得到所述样本音频数据的预测分类结果,所述预测分类结果用以预测所述样本音频数据是否为真实语音;
根据所述预测分类结果以及所述样本音频数据的类别标签训练所述语音识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州网易智企科技有限公司,未经杭州网易智企科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211033301.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电机铁芯、涡旋压缩机及制冷设备
- 下一篇:一种合成气生物发酵系统