[发明专利]音频编码器和音频编码方法有效
| 申请号: | 201210212498.9 | 申请日: | 2012-06-21 |
| 公开(公告)号: | CN102855876B | 公开(公告)日: | 2017-04-12 |
| 发明(设计)人: | 户栗康裕;前田祐儿;松本淳;铃木志朗;松村祐树 | 申请(专利权)人: | 索尼公司 |
| 主分类号: | G10L19/008 | 分类号: | G10L19/008 |
| 代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 朱胜,李春晖 |
| 地址: | 日本*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 编码器 编码 方法 程序 | ||
技术领域
本技术涉及一种音频编码器、音频编码方法以及程序,更具体地,涉及能够在高效地对多个声道的音频信号进行编码时防止由于编码而导致声音质量劣化的音频编码器、音频编码方法和程序。
背景技术
在用于对由多个声道的音频信号构成的立体声音频信号进行编码的公知技术当中,存在通过利用声道之间的关系来提高编码效率的M/S立体声编码技术、强度立体声编码技术等。在下文中,为了便于说明,立体声音频信号的声道数量是两个,即左声道和右声道,但是该说明同样可以适用于数量是三个或更多个的情况。
M/S立体声编码生成构成立体声音频信号的右声道的音频信号和左声道的音频信号之间的和分量以及差分量作为编码结果。因此,由于当右声道的音频信号和左声道的音频信号彼此类似时差分量较小,因此编码效率较高。然而,由于当右声道的音频信号和左声道的音频信号彼此显著不同时差分量较大,因此难以获得高编码效率。这会在编码之后的量化时引起量化噪声,从而在解码时引起人工噪声。
在强度立体声编码中,基于如下原理执行编码:人类听觉在高频域对相位迟钝,并且主要基于频谱之间的水平比(level ratio)来感测位置(例如,参见ISO/IEC 13818-7 Information technologyGeneric coding of moving pictures and associated audio information Part 7,Advanced Audio Coding(AAC))。具体地,对于低于预定频率FIS的频率,强度立体声编码按原样提供右声道和左声道的频谱作为编码结果。另一方面,对于等于或大于预定频率FIS的频率,强度立体声编码生成通过混合右声道和左声道的频谱而获得的共同谱以及各个声道的频谱的水平作为编码结果。
因此,对于低于频率FIS的频率,解码器将作为编码结果的右声道和左声道的频谱按原样提供作为解码结果。另一方面,对于等于或大于频率FIS的频率,解码器将各个声道的频谱的水平应用于作为编码结果的共同谱,以生成解码结果。
另外,对于这样的强度立体声编码,假定与M/S立体声编码的情况类似,右声道的音频信号和左声道的音频信号彼此类似。因此,当右声道的音频信号和左声道的音频信号彼此完全不同时,例如,当左声道的音频信号是钹(cymbals)的音频信号而右声道的音频信号是小号(trumpet)的音频信号时,由于共同谱不同于右声道和左声道的频谱,因此在解码时会出现人工噪声。
因此,提出了计算右声道的音频信号的频谱与左声道的音频信号的频谱之间的距离的尺度,并且当该尺度等于或小于阈值时,执行诸如M/S立体声编码的共同编码,并且当该尺度等于或大于阈值时,单独地执行编码(例如,参见日本专利第3421726号,在下文中将其称为专利文献1)。
此外,还提出了针对预定频带将立体声音频信号的频谱划分成段(piece),并且对于每个频带,使用特定的哈夫曼码本号来传送被应用了强度立体声编码的索引(例如,参见日本专利第3622982号,这在下文中被称为专利文献2)。因而,可以针对每个预定频带而在开与关之间切换强度立体声编码。
然而,在专利文献1和2的技术的情况下,当在开与关之间频繁切换共同编码或强度立体声编码时,感测位置会变得不稳定或者会出现异常声音。
另外,存在对于编码期望高压缩率的情形。即使在右声道的音频信号和左声道的音频信号彼此显著不同时,该情形也可能强制要求采用强度立体声编码以提高编码效率。在该情况下,在解码时肯定会出现可感测的人工噪声。
同时,认为针对带而被划分成段的立体声音频信号基于编码的失真系数、以混合比率混合从而将其编码(例如,参见日本专利第3951690号)。在该情况下,由于基于失真系数连续地控制右边和左边的编码对象的分离(立体声感觉),因此可以防止感测位置不稳定或者可以防止异常声音的出现。
图1是示出执行这样的编码的音频编码器的配置的一个示例的框图。
图1中的音频编码器10被配置成包括滤波器组11、滤波器组12、自适应混合部13、T/F变换部14、T/F变换部15、编码控制部16、编码部17、多路复用器18以及失真系数检测部19。
作为左声道的时间信号的音频信号xL和作为右声道的时间信号的音频信号xR作为编码对象的立体声音频信号被输入到图1中的音频编码器10。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210212498.9/2.html,转载请声明来源钻瓜专利网。





