[发明专利]音频信号增强方法、装置、计算机设备和存储介质在审
申请号: | 202110484196.6 | 申请日: | 2021-04-30 |
公开(公告)号: | CN113763973A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 王蒙;黄庆博;肖玮 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0232 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 李文渊 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 信号 增强 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种音频信号增强方法、装置、计算机设备和存储介质。所述方法包括:当接收到语音包时,对所述语音包依序进行解码和滤波,得到音频信号;当所述音频信号为前向纠错帧信号时,从所述音频信号中提取特征参数;基于解码所述语音包所得的线性滤波参数,将所述音频信号转换为滤波器语音激励信号;根据所述特征参数以及解码所述语音包所得的长时滤波参数和线性滤波参数,对所述滤波器语音激励信号进行语音增强处理,得到增强后语音激励信号;基于所述增强后语音激励信号和所述线性滤波参数进行语音合成,得到语音增强信号。采用本方法能够提高音频信号增强的时效性。
技术领域
本申请涉及计算机技术领域,特别是涉及一种音频信号增强方法、装置、计算机设备和存储介质。
背景技术
音频信号在编解码的过程中通常会引入量化噪声,使得解码合成出的语音出现失真。传统方案中通常采用基音滤波(Pitch Filter)或基于神经网络(Neural Network)的后处理技术来增强音频信号,以减少量化噪声对语音质量的影响。
然而,传统方案信号处理的速度较低,存在较大的时延,并且所能达到的语音质量的提升效果是有限的,导致对音频信号增强的时效性较差。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高音频信号增强的时效性的音频信号增强方法、装置、计算机设备和存储介质。
一种音频信号增强方法,所述方法包括:
对接收到的语音包依序进行解码,得到残差信号、长时滤波参数和线性滤波参数;对所述残差信号进行滤波,得到音频信号;
当所述音频信号为前向纠错帧信号时,从所述音频信号中提取特征参数;
基于所述线性滤波参数,将所述音频信号转换为滤波器语音激励信号;
根据所述特征参数、所述长时滤波参数和所述线性滤波参数,对所述滤波器语音激励信号进行语音增强处理,得到增强后语音激励信号;
基于所述增强后语音激励信号和所述线性滤波参数进行语音合成,得到语音增强信号。
在一个实施例中,所述线性滤波参数包括线性滤波系数和能量增益值;所述基于所述线性滤波参数对线性预测滤波器进行参数配置,通过参数配置后的线性预测滤波器对所述增强后语音激励信号进行线性合成滤波,包括:
基于所述线性滤波系数对线性预测滤波器进行参数配置;
获取在解码所述语音包之前所解码的历史语音包对应的能量增益值;
基于所述历史语音包对应的能量增益值和所述语音包对应的能量增益值,确定能量调整参数;
通过所述能量调整参数对所述历史语音包对应的历史长时滤波激励信号进行能量调整,得到调整后历史长时滤波激励信号;
将所述调整后历史长时滤波激励信号和所述增强后语音激励信号输入至参数配置后的线性预测滤波器,以使所述线性预测滤波器基于所述调整后历史长时滤波激励信号,对所述增强后语音激励信号进行线性合成滤波。
一种音频信号增强装置,所述装置包括:
语音包处理模块,用于对接收到的语音包依序进行解码,得到残差信号、长时滤波参数和线性滤波参数;对所述残差信号进行滤波,得到音频信号;
特征参数提取模块,用于当所述音频信号为前向纠错帧信号时,从所述音频信号中提取特征参数;
信号转换模块,用于基于所述线性滤波参数,将所述音频信号转换为滤波器语音激励信号;
语音增强模块,用于根据所述特征参数、所述长时滤波参数和所述线性滤波参数,对所述滤波器语音激励信号进行语音增强处理,得到增强后语音激励信号;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110484196.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法、装置、计算机设备和存储介质
- 下一篇:一种网页风险发现的方法