[发明专利]语音文件修复方法、装置、计算机设备及存储介质有效
| 申请号: | 202010990031.1 | 申请日: | 2020-09-18 |
| 公开(公告)号: | CN112071331B | 公开(公告)日: | 2023-05-30 |
| 发明(设计)人: | 罗剑;王健宗;程宁 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/30;G10L25/51;G10L19/16;G10L19/02 |
| 代理公司: | 深圳市世联合知识产权代理有限公司 44385 | 代理人: | 汪琳琳 |
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 文件 修复 方法 装置 计算机 设备 存储 介质 | ||
1.一种语音文件修复方法,其特征在于,包括下述步骤:
划分语音数据为多组帧信号,根据所述帧信号提取所述语音数据的特征系数;
基于预设检测模型和所述特征系数对所述语音数据的缺失帧进行定位,并确定所述缺失帧在所述语音数据中的组位置为第一组数据;
获取所述第一组数据的前后组数据,并将所述前后组数据分别作为第二组数据和第三组数据,组合所述第一组数据、所述第二组数据和所述第三组数据为第一修复组,确定所述第一修复组的前一个修复组为第二修复组,获取所述第二修复组的隐状态参数;
输入所述隐状态参数、所述第一组数据、所述第二组数据和所述第三组数据至预设的第一音频填充网络中,计算得到所述缺失帧对应的修复频谱;
基于预设声码器对所述修复频谱进行处理,得到所述语音数据的修复语音。
2.根据权利要求1所述的语音文件修复方法,其特征在于,所述基于预设检测模型和所述特征系数对所述语音数据的缺失帧进行定位的步骤包括:
获取预设检测模型,所述预设检测模型包括检测神经网络和全连接层,输入所述特征系数至所述检测神经网络中,计算得到检测值;
输入所述检测值至所述全连接层,计算得到输出结果,根据所述输出结果对所述语音数据的缺失帧进行定位。
3.根据权利要求2所述的语音文件修复方法,其特征在于,所述获取预设检测模型的步骤包括:
获取预设语料库中的原始文件,切分所述原始文件为多个帧数据,从所有所述帧数据中随机抽取预设个数的子帧数据,将所述子帧数据中预设时间段的信号用高斯白噪声替换,得到替换后的子帧数据,组合所述替换后的子帧数据和未被替换的帧数据为训练数据集;
根据所述训练数据集对基础检测模型进行训练,得到训练成功的基础检测模型为所述语音数据的预设检测模型。
4.根据权利要求1所述的语音文件修复方法,其特征在于,所述获取所述第二修复组的隐状态参数的步骤包括:
确定所述第二修复组的前一个修复组为第三修复组,获取所述第三修复组的元胞状态;
根据所述元胞状态和预设的长短期记忆网络,计算所述第二修复组的隐状态参数。
5.根据权利要求1所述的语音文件修复方法,其特征在于,所述输入所述隐状态参数、所述第一组数据、所述第二组数据和所述第三组数据至预设的第一音频填充网络中,计算得到所述缺失帧对应的修复频谱的步骤包括:
将所述第一组数据和所述第二组数据输入至预设的第二音频填充网络中,计算得到第一中间变量,将所述第二组数据和所述第三组数据输入至所述第二音频填充网络中,计算得到第二中间变量;
输入所述隐状态参数、所述第一中间变量和所述第二中间变量至预设的第一音频填充网络中,计算得到所述缺失帧对应的修复频谱,其中,所述第一音频填充网络和所述第二音频填充网络具有相同的结构和不同的参数。
6.根据权利要求5所述的语音文件修复方法,其特征在于,第二音频填充网络包括第一卷积层、第二卷积层和残差密集网络,所述将所述第一组数据和所述第二组数据输入至预设的第二音频填充网络中,计算得到第一中间变量的步骤包括:
将所述第一组数据和所述第二组数据输入至所述第一卷积层计算得到第一参数值;
将所述第一参数值输入至所述残差密集网络,计算得到第二参数值,输入所述第二参数值至所述第二卷积层得到第一中间变量。
7.根据权利要求1所述的语音文件修复方法,其特征在于,所述划分语音数据为多组帧信号,根据所述帧信号提取所述语音数据的特征系数的步骤包括:
获取预设划分时长,按照所述预设划分时长将所述语音数据划分为多组帧信号;
计算每组所述帧信号的梅尔倒谱系数,将所述梅尔倒谱系数作为所述语音数据的特征系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010990031.1/1.html,转载请声明来源钻瓜专利网。





