[发明专利]在音频信号的不连续传输中具有高频谱时间分辨率的舒缓噪声的生成有效
| 申请号: | 201380067152.7 | 申请日: | 2013-12-19 |
| 公开(公告)号: | CN104871242A | 公开(公告)日: | 2015-08-26 |
| 发明(设计)人: | 安东尼·隆巴尔多;马丁·迪茨;斯特凡·维尔德;埃曼努埃尔·拉维利;潘基·塞蒂亚万;马库斯·穆赖特鲁斯 | 申请(专利权)人: | 弗兰霍菲尔运输应用研究公司 |
| 主分类号: | G10L19/012 | 分类号: | G10L19/012 |
| 代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 田喜庆;吴孟秋 |
| 地址: | 德国*** | 国省代码: | 德国;DE |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 信号 连续 传输 具有 频谱 时间分辨率 舒缓 噪声 生成 | ||
技术领域
本发明涉及音频信号处理,并且更具体地,涉及添加舒缓噪声至音频信号。
背景技术
舒缓噪声生成器通常用于音频信号的不连续传输(DTX)中,特别含语音的音频信号。于此种模式中,该音频信号首先由语音活动检测器(VAD)分类为活动帧及不活动帧。根据该VAD结果,只有该活动语音帧被编码及以标称比特率传输。于长期暂停期间,于该处只存在有背景噪声,比特率降低或归零,及该背景噪声使用静默插入描述符帧(SID帧)偶发地且参数地编码。然后,平均比特率显著降低。
该噪声在该不活动帧期间于该解码器端由舒缓噪声生成器(CNG)生成。实际上SID帧的大小极有限。因此,描述该背景噪声之参数数目须保持尽可能地小。为了达成此项目的,噪声估计不直接地施加于该频谱变换的输出。反而是通过求频带群组中的该输入功率频谱的平均,例如遵照巴克(Bark)尺标而以较低频谱分辨率施用。求平均可通过算术或几何手段达成。不幸地,于该等SID帧中传输的有限参数数目不允许捕捉该背景噪声的精密频谱结构。因此只有噪声的平滑频谱包络可通过CNG再生。当该VAD触发CNG帧时,该重建舒缓噪声之平滑频谱与该实际背景噪声之频谱间的不一致变成在活动帧(涉及该信号的吵杂语音部分的常规编码及解码)与CNG帧间过渡时极为可听闻。
发明内容
本发明的目的是提出一种音频信号处理的改良构思。更明确言之,本发明的目的是提出一种舒缓噪声添加至音频信号的改良构思。本发明的该目的通过根据权利要求1的音频解码器,通过权利要求17的系统,通过权利要求18的方法及通过权利要求19的计算机程序达成。
在一个方面中,本发明提出一种被配置用于解码位串流以从其中产生音频输出信号的音频解码器,该位串流包含接着至少一个不活动阶段的至少一个活动阶段,其中该位串流已经于其中编码描述一背景噪声的一频谱的至少一个静默插入描述符帧,该音频解码器包含:
一静默插入描述符解码器,被配置为解码该静默插入描述符帧以重建该背景噪声的该频谱;
一解码装置,被配置为在该活动阶段期间从该位串流重建该音频输出信号;
一频谱转换器,被配置为确定该音频输出信号之一频谱;
一噪声估计器装置,被配置为根据由该频谱转换器所提供的该音频输出信号之该频谱而确定该音频输出信号之该噪声的一第一频谱,其中该音频输出信号之该噪声的该第一频谱具有比如由该静默插入描述符解码器所提供的该背景噪声的该频谱更高的频谱分辨率;
一分辨率转换器,被配置为根据该音频输出信号之该噪声的该第一频谱而建立该音频输出信号之该噪声的一第二频谱,其中该音频输出信号之该噪声的该第二频谱具有与如由该静默插入描述符解码器所提供的该背景噪声的该频谱相同的频谱分辨率;
一舒缓噪声频谱估计装置,具有一定标因子计算装置,该定标因子计算装置被配置为根据如由该静默插入描述符解码器所提供的该背景噪声的该频谱,及根据如由该分辨率转换器所提供的该音频输出信号之该噪声的该第二频谱,针对一舒缓噪声的一频谱计算定标因子,及具有舒缓噪声频谱生成器,该舒缓噪声频谱生成器被配置为根据该等定标因子计算针对一舒缓噪声的该频谱;及
一舒缓噪声生成器,被配置为根据针对该舒缓噪声的该频谱在该不活动阶段期间产生该舒缓噪声。
该位串流含有活动阶段及不活动阶段,其中活动阶段为含有该音频信息的期望成分诸如语音或乐音的一阶段,而一不活动阶段为不含有该音频信息的任何期望成分的一阶段。不活动阶段通常出现在暂停期间,于该处不存在有期望成分,诸如乐音或语音。因此,不活动阶段通常只含有背景噪声。于含有编码音频信号的该位串流中的信息被嵌置于所谓的帧内,其中此等帧各自含有指称某个时间的音频信息。于活动阶段期间,包含音频信息包括有关该期望信号的音频信息的活动帧可在该位串流内部传输。相反地,于不活动阶段期间,包含噪声信息的静默插入描述符帧可以比该等活动阶段的平均比特率更低的一平均比特率而在该位串流内部传输。
静默插入描述符解码器被配置为解码该静默插入描述符帧,因而重建该背景噪声的频谱。但此背景噪声的频谱,因在该静默插入描述符帧中传输的参数数目有限之故,不允许捕捉该背景噪声的精密频谱结构。
解码装置可为于活动阶段期间,能够解码位串流(其为含音频信息的一数字数据串流)的装置或计算机程序。该解码过程可获得一数字解码音频输出信号,其可馈送至一D/A转换器以产生一模拟音频信号,其然后可馈送至一扬声器以产生一可听闻信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗兰霍菲尔运输应用研究公司,未经弗兰霍菲尔运输应用研究公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380067152.7/2.html,转载请声明来源钻瓜专利网。





