[发明专利]音频压缩有效
申请号: | 200580051976.0 | 申请日: | 2005-11-04 |
公开(公告)号: | CN101297356A | 公开(公告)日: | 2008-10-29 |
发明(设计)人: | M·塔米 | 申请(专利权)人: | 诺基亚公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02 |
代理公司: | 北京市金杜律师事务所 | 代理人: | 王茂华;赵林琳 |
地址: | 芬兰*** | 国省代码: | 芬兰;FI |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 压缩 | ||
技术领域
本申请总体上涉及音频压缩。
背景技术
音频压缩通常在用于存储或传输数字音频信号的现代消费者设备中使用。消费者设备可以是电信设备、视频设备、音频播放器、无线电设备和其它消费型设备。较高的压缩比能够支持更好的存储能力,或者经由通信信道的更高效传输,其中通信信道即无线通信信道或者有线通信信道。但是同时,对应于压缩比,还应当将压缩信号的质量保持在较高的水平。音频编码的目标通常在于,将涉及给定压缩比即比特率的音频质量最大化。
在过去几十年中,已经研发出了众多音频编码技术。高级音频编码系统有效地利用了人耳的性质。主要思想在于,可以将编码噪声置于对感官质量影响最小的信号区域中,使得可以在未引入听觉失真的前提下减小数据速率。因此,心理声学理论是现代音频编码的重要部分。
在公知的音频编码器中,输入信号被分为有限数量的子频带。每个子频带信号都可以量化。根据心理声学理论,公知的是:频谱中的最高频率在感知上没有低频重要。通过将与低频子频带相比而言较少的比特分配给高频子频带的量化,这可以在某种程度上在编码器中加以考虑。
更复杂的音频编码利用了这样的事实,即,在大部分情况下,音频信号的低频区域和高频区域之间存在很大的相关性,即频谱较高的那半部分通常与其较低的那半部分相当类似。低频区域可以被认为是声谱的低半部分,而高频可以被认为是声谱的高半部分。应 当理解,低频和高频的边界并不固定,而是可以在2kHz到15kHz之间,甚至可以超越这些边界。
频带复制编码(SBR)是当前公知的对高频区域进行编码的方法。此技术在以下文章中进行了描述:2002年5月在德国慕尼黑举行的第112届AES大会上M.Dietz,L.Liljeryd、K. 和O.Kunz的″Spectral Band Replication,a novel approach in audio coding″,以及2002年11月在比利时鲁汶举行的第一届IEEE Benelux Workshop on Model Based Processing and Coding of Audio上P.Ekstrand的″Bandwidth extension of audio signals by spectral band replication″。所描述的方法可以应用到普通音频编码器中,诸如,例如AAC或MPEG-1层III(MP3)编码器,以及其它多种代表本领域技术发展水平的编码器。
根据现有技术的方法的缺点在于:仅仅将低频带调换到高频带可能导致原始高频带与利用被调换的低频对其的重建之间不相似。另一缺点在于,需要使用公知方法将噪声和正弦波添加到频谱中。
因此,本申请的目标在于提供一种改进的音频编码技术。本申请的进一步目的在于提供一种编码技术,其更正确地表示输入信号,同时具有合理低的比特速率。
发明内容
为了克服上述缺点,根据一个方面,本申请提供了一种用于编码音频信号的方法,包括:接收输入音频信号,将该音频信号至少划分为低频带和高频带,将该高频带至少划分为两个高频子频带信号,在该低频带信号部分内确定哪个与高频子频带信号最匹配,以及产生至少涉及与高频带子频带信号最匹配的低频带信号部分的参数。
本申请提供了一种对输入信号的高频区域进行编码的新方法。输入信号可以被划分为时间上连续的帧。每个帧都表示输入信号的时间实例。在每个帧中,输入信号都可以由其频谱成分来表示。频 谱成分或者采样表示输入信号内的频率。
本申请不是盲目地将低频区域调换到高频,而是将原始高频频谱成分与编码后的高频频谱成分之间的相似性最大化。根据本申请,高频区域是使用信号已经编码过的低频区域来形成的。
通过比较低频信号采样与所接收信号的高频子频带,可以在低频中找到与实际高频子频带最匹配的信号部分。本申请提供了在整个低频频谱中一个采样接着一个采样地搜索与高频子频带最相似的信号部分。换言之,由于信号部分与采样序列对应,所以本申请提供了找到与高频子频带最匹配的采样序列。此采样序列可以在低频带中的任何位置开始,除了低频带中最后被考虑的起点应该是低频带中的最后采样减去将被匹配的高频子频带的长度。
与实际高频子频带最匹配的低频信号部分的索引或者链接可以用来对高频子频带进行建模。仅需要对索引或者链接进行编码并且存储或者传输,以便允许在接收端还原对相应高频子频带的表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于诺基亚公司,未经诺基亚公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200580051976.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:包含氟代烯烃的组合物
- 下一篇:一种对牙科贵金属烤瓷修复体底冠喷砂的方法