[发明专利]信噪比估计方法、装置、介质和计算设备在审
申请号: | 202111300889.1 | 申请日: | 2021-11-04 |
公开(公告)号: | CN114038477A | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 郝一亚;阮良;陈功;马建立;王志强 | 申请(专利权)人: | 杭州网易智企科技有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L21/0224 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 李威 |
地址: | 310052 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 估计 方法 装置 介质 计算 设备 | ||
本公开的实施方式提供了一种信噪比估计方法、装置、介质和计算设备。所述方法包括:将目标音频划分为音频帧序列,所述目标音频由参考语音和参考瞬态噪声在时域中叠加得到;按照所述参考语音和所述参考瞬态噪声的时序信息确定所述音频帧序列中的语音帧和叠加帧;根据所述语音帧和叠加帧各自的音频能量,分别确定所述叠加帧中的语音能量和噪声能量;基于所述叠加帧中的语音能量和噪声能量计算所述目标音频的信噪比。应用该方法对包含瞬态噪声信号的音频进行有源信噪比估计,估计结果具有较高的准确度。
技术领域
本公开的实施方式涉及信号处理技术领域,更具体地,本公开的实施方式涉及一种信噪比估计方法、装置、介质和计算设备。
背景技术
本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
在音频处理领域,常使用信噪比(SNR,Signal-to-Noise Ratio)衡量待测音频中有用信号和噪声的相对大小。确定待测音频的信噪比的过程,通常被称为信噪比估计。信噪比估计的方法可以分为有源估计和无源估计两类,其中,有源估计通常用于对合成音频进行信噪比估计。
在相关技术中,有源估计通常以统计能量平均值的方式实现。例如,分别在待检测音频的语音段和噪声段内进行能量统计,并基于统计出的能量平均值计算待测音频的信噪比。
发明内容
需要一种改进的信噪比估计方法,以提升对包含瞬态噪声的音频进行有源信噪比估计时的准确度。
在本上下文中,本公开的实施方式期望提供一种信噪比估计方法、装置、介质和计算设备。
在本公开实施方式的第一方面中,提供了一种信噪比估计方法,所述方法包括:
将目标音频划分为音频帧序列,所述目标音频由参考语音和参考瞬态噪声在时域中叠加得到;
按照所述参考语音和所述参考瞬态噪声的时序信息确定所述音频帧序列中的语音帧和叠加帧;所述语音帧包含语音信号,所述叠加帧包含语音信号和瞬态噪声信号,所述瞬态噪声信号的持续时长小于时长阈值;
根据所述语音帧和叠加帧各自的音频能量,分别确定所述叠加帧中的语音能量和噪声能量;所述叠加帧的音频能量为所述叠加帧中的语音能量和噪声能量之和;
基于所述叠加帧中的语音能量和噪声能量计算所述目标音频的信噪比。
可选地,所述根据所述语音帧和叠加帧各自的音频能量,确定所述叠加帧中的语音能量,包括:
确定所述音频帧序列中所述语音帧的语音能量,并根据所述语音帧的语音帧数量确定语音帧平均能量;
根据所述语音帧平均能量与所述叠加帧的叠加帧数量确定所述叠加帧中的语音能量。
可选地,所述根据所述语音帧和叠加帧各自的音频能量,确定所述叠加帧中的噪声能量,包括:
确定所述叠加帧的音频能量;
将所述叠加帧的音频能量与所述叠加帧中的语音能量之间的差值,作为所述叠加帧中的噪声能量。
可选地,确定任一音频帧的音频能量,包括:
在所述任一音频帧中的多个样本点处分别采集相应音频信号的信号能量;
将采集到的多个信号能量的累加值作为所述任一音频帧的音频能量。
可选地,所述将所述目标音频划分为音频帧序列,包括:
按照预设时长将所述目标音频的时间轴切分为多个时间区间,各个时间区间分别对应的音频帧按照在所述时间轴中的先后顺序构成所述音频帧序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州网易智企科技有限公司,未经杭州网易智企科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111300889.1/2.html,转载请声明来源钻瓜专利网。