[发明专利]语音特征提取、识别、训练方法及相关装置在审
申请号: | 202111672796.1 | 申请日: | 2021-12-31 |
公开(公告)号: | CN116416972A | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 齐欣 | 申请(专利权)人: | 顺丰科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06 |
代理公司: | 深圳紫藤知识产权代理有限公司 44570 | 代理人: | 杨婉秋 |
地址: | 518000 广东省深圳市南山区学府路(以南)*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 特征 提取 识别 训练 方法 相关 装置 | ||
本申请的实施例提供了一种语音特征提取方法、训练方法及相关装置。该语音特征训练包括:将原始语音音频样本输入特征提取器进行特征提取处理,得到目标语音特征;将所述目标语音特征输入音素标签分类器进行音素标记,得到目标语音特征的预测音素标签;根据所述预测音素标签,对所述特征提取器进行参数修正;将所述原始语音音频样本再次输入特征提取器进行特征提取处理,得到新的目标语音特征;将所述新的目标语音特征输入信道标签分类器进行信道分类,得到新的目标语音特征对应的预测信道标签;根据所述预测信道标签,对所述特征提取器进行参数修正。本申请的实施例可以克服目前训练采用的音频材料都带有信道特征,适用范围狭窄的问题。
背景技术
语音识别作为人工智能重要的领域分支,随着神经网络研究的越来越深入,近年来获得了长足的进展和成果。这也促使对语音识别技术的研究从偏理论场景逐渐转向各类实际的应用场景,乃至相关产品落地,比如手机助手、电话智能客服等等。
语音识别分为声学模型和语言模型建模两个主要方向,为了获得良好的识别效果,各自都需要投入大量的符合场景的音频和文本数据来进行训练。具体到声学建模,符合场景的音频既要满足当前场景语言背景和范围的需要也要匹配硬件收音的特性。满足当前场景语言背景和范围指的是音频训练数据在限定好的音素平衡的语料文本范围内通过大量说话人进行录音采集,匹配硬件收音的特性则是根据具体应用设备的不同,选取特定设备进行录音采集以符合音频的信道噪声特性和干扰特性。针对后者,实际场景中一般区分为麦克风信道和电话信道两种录制环境,实际可获得的有监督的音频数据大多是通过麦克风信道录制的,有监督电话信道音频数据源比较少,获取电话数据需要花费大量的人工和时间成本,故目前训练采用的音频材料都带有信道特征,适用范围狭窄。
发明内容
本申请的实施例提供了一种语音特征提取、识别、训练方法及相关装置,进而至少在一定程度上可以克服目前训练采用的音频材料都带有信道特征,适用范围狭窄的问题。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供了一种语音特征训练方法,所述方法包括:将原始语音音频样本输入特征提取器进行特征提取处理,得到目标语音特征;将所述目标语音特征输入音素标签分类器进行音素标记,得到目标语音特征的预测音素标签;根据所述预测音素标签,对所述特征提取器进行参数修正;将所述原始语音音频样本再次输入特征提取器进行特征提取处理,得到新的目标语音特征;将所述新的目标语音特征输入信道标签分类器进行信道分类,得到新的目标语音特征对应的预测信道标签;根据所述预测信道标签,对所述特征提取器进行参数修正。
在本申请的一些实施例中,根据所述预测音素标签,对所述特征提取器进行参数修正,具体包括:根据所述预测音素标签,计算第一损失;根据所述第一损失,对所述特征提取器进行参数修正。
在本申请的一些实施例中,根据所述第一损失,对所述特征提取器进行参数修正,具体包括:根据所述第一损失,沿梯度下降方向,对所述特征提取器和所述音素标签分类器进行参数修正。
在本申请的一些实施例中,所述根据所述预测信道标签,对所述特征提取器进行参数修正,具体包括:根据所述预测信道标签,计算第二损失;根据所述第二损失,对所述特征提取器进行参数修正。
在本申请的一些实施例中,所述根据所述第二损失,对所述特征提取器进行参数修正,具体包括:根据所述第二损失,沿梯度上升方向,对所述特征提取器进行参数修正。
在本申请的一些实施例中,所述特征提取器进行特征提取处理的具体步骤包括:通过多层特征提取网络对各维度的语音信息进行提取,所述语音信息共同构成初始语音的特征;对所述初始语音的特征进行降维压缩处理,得到所述目标语音特征。
根据本申请实施例的一个方面,提供了一种语音特征提取方法,所述方法包括:采用如上所述的特征提取器对原始语音音频进行特征提取处理,得到被抑制信道信息的目标语音特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111672796.1/2.html,转载请声明来源钻瓜专利网。