[发明专利]使用频谱域噪声整形的基于线性预测的编码方案有效

申请号：	201280018265.3	申请日：	2012-02-14
公开（公告）号：	CN103477387A	公开（公告）日：	2013-12-25
发明（设计）人：	戈兰·马尔科维奇;纪尧姆·福奇斯;尼古劳斯·雷特尔巴赫;克里斯蒂安·赫尔姆里希;本杰明·苏伯特	申请（专利权）人：	弗兰霍菲尔运输应用研究公司
主分类号：	G10L19/012	分类号：	G10L19/012
代理公司：	北京康信知识产权代理有限责任公司 11240	代理人：	余刚;吴孟秋
地址：	德国***	国省代码：	德国;DE
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	使用频谱噪声整形基于线性预测编码方案
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及使用诸如从USAC所知的TCX模式这样的频域噪声整形的基于线性预测的音频编译码器。

背景技术

作为相对较新的音频编译码器，USAC最近已经完成。USAC是一种支持在多个编码模式间切换的编译码器，这些编码模式诸如AAC式编码模式、使用线性预测编码的时域编码模式，即ACELP、以及形成中间编码模式的变换编码激励编码，频谱域整形依据该中间编码模式利用经由数据流所发送的线性预测系数被控制。在WO2011147950中，提出通过排除AAC式编码模式的可用性并且将编码模式仅局限于ACELP及TCX而使USAC编码方案更适于低延迟应用。而且，还建议减少帧长度。

然而，最好是能够在减少使用频谱域整形的基于线性预测的编码方案的复杂度的同时，实现近似的编码效率，例如就比率/失真比而言。

发明内容

因此，本发明的目的是提供这样一种使用频谱域整形的基于线性预测的编码方案，允许在类似或甚至增加的编码效率下降低复杂性。

该目的通过审查中的独立权利要求中的主题的来实现。

本发明的基本概念是如果将音频输入信号分解成包括频谱序列的谱图的频谱分解被用于线性预测系数计算以及基于线性预测系数的频谱域整形的输入这两者，则基于线性预测且使用频谱域噪声整形的编码概念在类似编码效率下，例如就比率/失真比而言，得以具有较低的复杂性。

在这一方面，已发现，即使导致混叠并且需要时域混叠消除的、诸如临界取样的重叠（lapped）变换（如MDCT）这样的重叠变换用于频谱分解，编码效率也保持不变。

本发明的方面中有利实现方式是从属权利要求的主题。

附图说明

具体地，本申请的较佳实施方式相关于附图而被描述，其中：

图1示出根据比较例或实施方式的音频编码器的方块图；

图2示出根据本申请的实施方式的音频编码器；

图3示出适合于图2的音频编码器的可实行的音频译码器的方块图；以及

图4示出根据本申请的实施方式的可选音频编码器的方块图。

具体实施方式

为了便于理解在下文中进一步描述的本发明的实施方式的主要方面及优势，首先参照图1，其示出使用频谱域噪声整形的基于线性预测的音频编码器。

具体地，图1的音频编码器包括频谱分解器10，用以将输入音频信号12频谱分解成由频谱序列组成的谱图，如图1中的14所指示。如图1中所示，频谱分解器10可使用MDCT以将输入音频信号10由时域变换到频谱域。具体地，窗口化器16在频谱分解器10的MDCT模块18之前，以窗口化输入音频信号12的互相重叠部分，其窗口化部分在MDCT模块18中单独接受各自的变换以获得谱图14的频谱序列的频谱。然而，频谱分解器10可选地使用任何其他导致混叠的重叠变换，诸如任何其他临界取样的重叠变换。

而且，图1的音频编码器包括线性预测分析器20，用以分析输入音频信号12以由此导出线性预测系数。图1的音频编码器的频谱域整形器22被配置为基于由线性预测分析器20所提供的线性预测系数来对谱图14的频谱序列的当前频谱频谱整形。具体地，频谱域整形器22被配置成通过将来自分析器20的线性预测系数变换成频谱加权值并应用该加权值作为除数以频谱形成或整形该当前频谱，来根据对应于线性预测分析滤波器传送函数的传送函数对进入频谱域整形器22的当前频谱进行频谱整形。整形后的频谱在图1的音频编码器的量化器24中量化。由于频谱域整形器22中的整形，在译码器端对量化频谱进行去整形时所产生的量化噪声被移位而被隐藏，即编码尽可能的是感知透明（perceptually transparent）的。

仅为了完整起见，应指出的是，时间噪声整形模块26可以选择性地使从频谱分解器10转发至频谱域整形器22的频谱接受时间噪声整形，并且低频加重（emphasis）模块28可以在量化24之前适应性地滤波由频谱域整形器22所输出的每个整形后频谱。

量化并频谱整形后的频谱连同关于频谱整形中所使用的线性预测系数的信息被插入到数据流30中，使得在译码端，去整形及去量化可被执行。

除TNS模块26的外，图1中所示的音频编译码器的绝大部分在例如新音频编译码器USAC中、特别是在其TCX模式内被实现及描述。因此，详情请参照示范性的USAC标准，例如[1]。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于弗兰霍菲尔运输应用研究公司，未经弗兰霍菲尔运输应用研究公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201280018265.3/2.html，转载请声明来源钻瓜专利网。

上一篇：一种治疗甲状腺相关眼病急性期的中药
下一篇：检测材料加工机器中的连续式或循环式材料带的参数的方法和装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]使用频谱域噪声整形的基于线性预测的编码方案有效

专利文献下载