[发明专利]用于通过使用频谱模式有效合成正弦曲线和扫描的设备及方法有效
申请号: | 201380064128.8 | 申请日: | 2013-09-20 |
公开(公告)号: | CN104903956B | 公开(公告)日: | 2018-11-16 |
发明(设计)人: | 萨沙·迪施;本亚明·舒伯特;拉尔夫·热日尔;贝恩德·埃德勒;马丁·迪策尔 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
主分类号: | G10L19/032 | 分类号: | G10L19/032 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 唐京桥;陈炜 |
地址: | 德国*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 通过 使用 频谱 模式 有效 合成 正弦曲线 扫描 设备 方法 | ||
提供了一种基于编码音频信号频谱生成音频输出信号的设备。该设备包括处理单元(115),其用于对编码音频信号频谱进行处理,以获得包括多个频谱系数的解码音频信号频谱,其中,每个频谱系数具有频谱值和在编码音频信号频谱内的频谱位置,其中,频谱系数根据其在编码音频信号频谱内的频谱位置被依次排序,使得频谱系数形成频谱系数序列。此外,该设备包括伪系数确定器(125),其用于确定解码音频信号频谱的一个或更多个伪系数,每个伪系数具有频谱值。此外,该设备包括替换单元(135),其用于用确定的频谱模式替换至少一个或更多个伪系数,以获得修改的音频信号频谱,其中,确定的频谱模式包括至少两个模式系数,其中,该至少两个模式系数中的每一个具有频谱值。此外,该设备包括频谱时间转换单元(145),其用于将修改的音频信号频谱转换至时域,以获得音频输出信号。
本发明涉及音频信号编码、解码和处理,并且具体地涉及通过使用频谱模式有效合成正弦曲线和扫描。
音频信号处理变得越来越重要。由于现代感知音频编解码器被要求以越来越低的比特率来传送满意的音频质量,所以出现了挑战。另外,例如对于双向通信应用或分布式游戏等而言,可允许的延迟通常也很低。
现代波形保留变换音频编码器通常伴随着参数化编码增强如噪声替换或带宽扩展。除了这些熟知的参数化工具以外,可能还期望在这样的解码器中根据参数化边信息来合成正弦音调。计算复杂度始终是编解码器发展中的重要标准,原因在于:对于编解码器的广泛接受和部署而言,低复杂度是必要的。因此,需要的是生成这些音调的有效方式。
例如,虽然MPEG-D USAC(MPEG-D=运动图像专家组-D;USAC=统一语音和音频编码)音频编解码器通常在时域预测编码和变换域编码之间进行切换,然而音乐内容仍然主要在变换域中进行编码。在低比特率如<14kbit/s时,音乐项目中的音调成分在通过变换编码器进行编码时通常不好听,这使得以足够的质量对音频进行编码的任务甚至更具有挑战性。
另外,低延迟约束一般引起变换编码器的滤波器组的次优频率响应(原因是低延迟优化窗口形状和/或变换长度),并且因此进一步损害这样的编解码器的感知质量。
根据传统心理声学模型,对关于量化噪声的透明度的先决条件进行了定义。在高比特率的情况下,这与遵守人类听觉掩蔽等级的量化噪声的感知适配最佳时间/频率分布有关。然而,在低比特率的情况下,无法实现透明度。因此,在低比特率的情况下,可以使用掩蔽等级要求降低策略。
已经针对音乐内容提供了一流的编解码器,具体地为基于改进的离散余弦变换(MDCT)的变换编码器,其在频域中量化并传输频谱系数。然而,在数据速率非常低的情况下,每个时间帧中的仅很少的频谱线可以通过该帧的可用的比特进行编码。因此,时间调制伪声和所谓的颤音伪声不可避免地被引入编码信号中。
最显著地,在拟稳态音调成分中可以感知到这些类型的伪声。如果由于延迟约束而必须选择由于公知的泄露效应会在相邻频谱系数(频谱展宽)之间引入显著串扰的变换窗口形状,则尤其出现该情形。然而,尽管如此,通常这些相邻频谱系数中的仅一个或几个在由低比特率编码器进行粗量化之后,仍然保持为非零。
如上所述,根据现有技术中的一种方法,使用变换编码器。非常适合于对音乐内容进行编码的现代高压缩率音频编解码器全部依靠于变换编码。最突出的示例是MPEG2/4高级音频编码(AAC)和MPEG-D统一语音和音频编码(USAC)。USAC具有切换式核心,该切换式核心与主要意图用于语音编码的代数码激发线性预测(ACELP)模块加上变换编码激励(TCX)模块(参见[5])一致,并且替代地,与主要意图用于对音乐进行编码的AAC一致。如同AAC一样,TCX也是基于变换的编码方法。在低比特率设置的情况下,这些编码方案容易展现出颤音伪声,尤其在基本编码方案基于改进的离散余弦变换(MDCT)(参见[1])的情况下。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380064128.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电容器级钽铌合金丝及其制造方法
- 下一篇:文件共享系统和方法