[发明专利]一种基于电话信道的语音识别声学模型构建方法及系统在审
申请号: | 202211243374.7 | 申请日: | 2022-10-11 |
公开(公告)号: | CN115602158A | 公开(公告)日: | 2023-01-13 |
发明(设计)人: | 龚梁;胡华;周逸聪;孙涛;程俊杰 | 申请(专利权)人: | 武汉烽火普天信息技术有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/16 |
代理公司: | 武汉蓝宝石专利代理事务所(特殊普通合伙) 42242 | 代理人: | 范三霞 |
地址: | 430000 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 电话 信道 语音 识别 声学 模型 构建 方法 系统 | ||
本发明提供一种基于电话信道的语音识别声学模型构建方法及系统,方法包括:对录音语音数据进行重采样,获取采样率与电话信道采样率相同的重采样录制语音数据集;分别对重采样录音数据和电话信道语音数据进行数据增强处理,生成对应的扩展语音数据集;将重采样录制语音数据集、电话信道语音数据集、以及对应的扩展语音数据集混合,生成混合训练数据集;基于混合训练数据集,训练深度神经网络模型,构建电话信号语音识别声学模型。本发明能够充分利用数据采集成本较低的录制语音数据,避免人工标注大量电话信道语音数据需要花费巨额的时间成本和经济成本的问题,既有效地提高电话信道语音识别精度,同时具有较好的鲁棒性。
技术领域
本发明涉及人工智能语音识别领域,更具体地,涉及一种基于电话信道的语音识别声学模型构建方法及系统。
背景技术
随着社会信息化的发展,人们对信息获取的移动性的需求不断增加,信息交流与查询变得越来越重要。语音识别,是人工智能技术的重要组成部分。语音识别的作用是将人类的语音转换为对应文本内容的一种技术,这项技术让机器获得了类似人类听觉的能力。进入21世纪,得益于深度学习技术的出现,语音识别技术开始进入大规模实用化。语音识别技术的快速发展使得语音识别的准确率有了巨大的进步,在多个行业完成了落地,越来越多的语音技术产品进入了人们的生活。
电话是人们生活中应用最广泛、最快捷的通信工具,由于电话网络的普及性,电话语音识别有着广阔的前景。电话语音识别系统面临的问题一方面在于话机拾音设备及电话线路网络的复杂性所造成的训练集与测试集语音数据的失配,由于电话线路有其独特的信噪比和频率响应,因此电话语音会受到瞬时干扰和非线性畸变的影响,另外,电话机本身质量及线路和网络状况的不同,一般通过电话网传输的语音都有不同程度的变化;另一方面是语音特征的不稳定性和说话人的多样性,因为电话作为广泛普通的通信终端,用户群体广泛,话者口音、发音方式千变万化。这些问题都给电话语音识别带来了挑战。
由于自动语音识别系统是由数据驱动的,因此,训练数据的规模和领域覆盖程度对其识别性能影响很大。电话信道语音,由于训练数据少、附加噪声、发声习惯差异大等,都严重影响了电话信道语音识别准确率,但是手工标注大量的电话语音是昂贵且费时的。
发明内容
本发明针对现有技术中存在的技术问题,提供一种基于电话信道的语音识别声学模型构建方法及系统。
根据本发明的第一方面,提供了一种基于电话信道的语音识别声学模型构建方法,包括:
对录音语音数据进行重采样,获取采样率与电话信道采样率相同的重采样录制语音数据集,所述录音语音数据为通过语音采集终端采用录音的方式录制的采样率高于电话信道采样率的语音数据;
在语音文本标注不改变的基础上,分别对所述重采样录音数据和电话信道语音数据进行数据增强处理,生成第一扩展语音数据集和第二扩展语音数据集;
将所述重采样录制语音数据集、电话信道语音数据集、第一扩展语音数据集和第二扩展语音数据集混合,生成混合训练数据集;
基于所述混合训练数据集,训练深度神经网络模型,构建电话信号语音识别声学模型。
在上述技术方案的基础上,本发明还可以作出如下改进。
可选的,所述对录音语音数据进行重采样,获取采样率与电话信道采样率相同的重采样录制语音数据集,包括:
录制语音采样率为Fs,电话信道采用率为Fc,Fs>Fc,重采样因子P/Q为电话信道采样率Fc和录制语音采样率Fs之间的比例,即P/Q=Fc/Fs,且P/Q为大于0小于1的分数;
当P=1且Q为整数时,重采样过程为:
对录制语音数据进行下采样,对录制语音数据每隔(Q-1)个点抽取一个数据点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉烽火普天信息技术有限公司,未经武汉烽火普天信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211243374.7/2.html,转载请声明来源钻瓜专利网。