[发明专利]用于编码和解码激励模式的方法和装置有效
| 申请号: | 201110071448.9 | 申请日: | 2011-03-24 |
| 公开(公告)号: | CN102201238A | 公开(公告)日: | 2011-09-28 |
| 发明(设计)人: | 弗洛里安.基勒;奥利弗.沃博尔特;约翰尼斯.贝姆 | 申请(专利权)人: | 汤姆森特许公司 |
| 主分类号: | G10L19/08 | 分类号: | G10L19/08 |
| 代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 吕晓章 |
| 地址: | 法国伊西*** | 国省代码: | 法国;FR |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 编码 解码 激励 模式 方法 装置 | ||
技术领域
本发明涉及一种用于编码和解码激励模式的方法和装置,根据该激励模式确定音频信号变换编解码的掩蔽等级。
背景技术
对于音频变换编码器中的谱数据的量化,需要心理声学的信息,即,真正的掩蔽阈值的近似值(approximation)。在对应的音频变换解码器中,相同的近似值用于重构量化后的数据。在编码器侧,使用窗口函数对源信号的重叠部分进行窗口化。在解码器侧,为解码信号窗口执行重叠+添加。
为了限制要传送的辅助信息数据量,正在使用像mp3和AAC的已知的变换编解码器作为关键频带的掩蔽信息缩放因子(也被表示为“缩放因子频带”),这意味着在量化处理之前对于一组相邻频率窗口(frequency bin)或者系数使用相同的缩放因子。Cf.K.Brandenburg,M.Bosi的“ISO/IEC MPEG-2Advanced Audio Coding:Overview and Applications”,第103届AES大会(103rd AES Convention),1997年9月26-29日,纽约,预印版本No.4641。
然而,缩放因子仅仅代表掩蔽阈值的粗略的(步进的)近似值。掩蔽阈值的这种表示的精度是非常有限的,这是因为(些许)不同的幅值频率窗口的各组将得到相同的缩放因子,并且因此所应用的掩蔽阈值对于显著数目的频率窗口不是最优的。
为了改进编码/解码质量,可以如以下所示来计算掩蔽等级:
S.van de Par,A.Kohlrausch,G.Charestan,R.Heusdens的“A newpsychoacoustical masking model for audio coding applications”,ProceedingsICAS SP’02,IEEE International Conference on Acoustics,Speech and SignalProcessing,2002,Orlando,vol.2,pp.1805-1808;
S.van de Par,A.Kohlrausch,R.Heusdens,J.Jensen,S.H.Jen-sen的“APerceptual Model for Sinusoidal Audio Coding Based on Spectral Integration”,EURASIP Journal on Applied Signal Processing,vol.2005:9,pp.1292-1304,
其中,从要编码的音频信号的功率谱中导出的“激励模式”中导出掩蔽阈值。
在2005年5月28-31日巴塞罗那的第118届AES大会O.Niemeyer,B.Edler的“Efficient Coding of Excitation Patterns Combined with a TransformAudio Coder”的第6466页中描述了应用这种用于掩蔽目的的激励模式的音频编解码器。对于要编码的每个谱的音频数据块,计算激励模式,其中该激励模式代表人耳的(真正的)依赖于频率的心理声学属性。
为了避免与基于缩放因子的掩蔽相比较而显著增加作为结果的数据率,在每个情形下组合了16个连续的激励模式以便高效地编码这些激励模式。如在2004年11月的IEEE Transactions on Circuits and Systems for VideoTechnology,vol.14,no.11,pp.1219-1235的W.A.Pearlman,A.Islam,N.Nagaraj,A.Said的“Efficient,Low-Complexity Image Coding With a Set-PartitioningEmbedded Block Coder”中所描述的对于图像编码应用将激励模式矩阵值进行SPECK(Set Partitioning Embedded bloCK,集合分裂嵌入块)编码。在利用激励模式值建立频率和时间上的2维矩阵和对数尺度矩阵值的2维DCT变换之后执行实际的激励模式编码。对作为结果的变换系数从最高有效的那个开始在比特平面上进行量化和熵编码,由此将SPECK编码的位置和系数的符号传递到音频解码器作为比特流辅助信息。在编码器和解码器侧,为计算要在音频信号编码和解码中应用的掩蔽阈值,对应地解码编码的激励模式,使得计算后的掩蔽阈值在编码器和解码器二者中相同。音频信号量化由作为结果的改进的掩蔽阈值来控制。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汤姆森特许公司,未经汤姆森特许公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110071448.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:手术系统以及控制方法
- 下一篇:自愈弹性防水涂料及其制备工艺





