[发明专利]一种基于正交解相关技术的参数立体声编码、解码方法有效

专利信息
申请号: 201310745761.5 申请日: 2013-12-30
公开(公告)号: CN103700372A 公开(公告)日: 2014-04-02
发明(设计)人: 曲天书;吴玺宏;黄益超;黄庆博 申请(专利权)人: 北京大学
主分类号: G10L19/008 分类号: G10L19/008
代理公司: 北京君尚知识产权代理事务所(普通合伙) 11200 代理人: 邵可声
地址: 100871 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 正交 相关 技术 参数 立体声 编码 解码 方法
【说明书】:

技术领域

发明属于音频压缩领域,涉及一种参数立体声编码、解码方法,尤其涉及一种基于正交解相关技术的参数立体声编码、解码方法。

背景技术

多媒体技术兴起于80年代末期,是近年来计算机领域中热门的技术之一。数字音频编解码技术采用计算机的数字记录和传输传送方式,对各种媒体进行处理,具有广泛的用途。但受限于网络带宽和存储空间,如何在保证高质量听感下将原始数据压缩为尽量少的比特数成为研究热点。

音频文件之所以可以压缩,是因为存在冗余,传统压缩算法主要考虑消除声道内冗余,在不考虑声道间冗余时,由于多声道音频文件的码率与声道数是线性关系,声道数的增加会导致码率成倍增加。从1993年MP3开始,人们逐渐发现声道间也是存在冗余并且开始尝试消除声道间冗余,逐步解决了在保持较高主观听感的条件下实现超低码率的问题。现有的消除声道间冗余的方法主要有如下3种:

1>联合立体声是MPEG-1、MEPG-2/4AAC等音频编解码国际标准中的重要组成部分,包括和差变换编码与强度立体声两种立体声编解码技术。

(1)和差变换编码

也被称为MS编码,是Middle-Side编码的简称。编码端将原始左右声道信号转换为和差信号,解码端做相应逆变换。该方法利用声道间相关性,将信号能量集中在和声道上,以此去除声道间冗余。但该方法压缩效率严重依赖信号本身特性,只有在原始左右声道相关性很强的情况下才能得到较高的压缩率。

(2)强度立体声

强度立体声基本思想是通过将原始信号空间的坐标轴进行旋转,得到主轴的强度信号和与之正交的残差信号。在编码端,丢弃与主轴正交的残差信号而只对强度信号和坐标轴旋转角度α进行量化编码。在解码端,根据角度α和强度信号,对坐标轴作逆旋转,重构出左右声道的立体声信号。这样重构得到的左右声道信号只是幅度不同,而相位信息一致。但是通过乘以相应的幅度比例因子,可以较好地保存原信号能量—时间包络。这样的处理方式符合人耳听觉系统对各声道信号高频成分的相位差异及其精细结构不敏感,而随时间变化的能量包络相对重要的感知特点,因此不会明显降低重构立体声信号的主观质量。

2>双耳线索编码

2002年C.Faller提出了名为双耳线索编码(Binaural Cue Coding,BCC)的编解码技术,其出发点和传统立体声编码技术不同,是一种基于空间听觉理论的参数编码技术。立体声或者多声道输入信号下混成单声道信号,同时根据空间听觉特性,对各个声道在变换域进行分析,提取三种空间参数:声道间强度差(Inter-channel Intensity Difference,IID)、声道间时间差(Inter-channel Time Difference,ITD)及声道间相关性(Inter-Channel Coherence,ICC)。在这里IID及ITD与传统的空间听觉线索缩写相同但含义不同,相应缩写都是指声道间参数而非听觉线索。下混信号可以使用传统的音频编码器来进行编码,参数经过量化编码后作为辅助部分嵌入到比特流中。在解码端,解码后的下混信号利用相应的空间参数来重构立体声或多声道音频信号。

双耳线索编码最大的特点就是能够提供极高的压缩率和任意声道形式的压缩编码,可看作是一种对强度立体声的发展,但是其克服了强度立体声编码的缺陷,具有以下几个明显优点:强度立体声编码实际只利用IID进行重构,因此仅对高频范围有效,若将强度立体声拓展到低频则会引入严重的噪声,而双耳线索编码利用IID及ITD进行重构,在全频谱范围内进行处理也不会产生严重噪声;另外强度立体声编码不能重构具有宽度立体声声像的音频信号,而双耳线索编码则可以利用ICC对其进行很好的重构。

3>参数立体声

飞利浦公司的J.Breebaart等人于2004年提出了名为参数立体声(Parametric Stereo,PS)的编解码技术。基本思路是在编码端输出一个单声道信号和若干空间参数,在解码端利用单声道信号和空间参数重构双声道立体声信号,是目前消除声道间冗余最优秀的方法之一。已经被MPEG-4及3GPP(3rd Generation Partnership Project)采纳为相应音频编码国际标准中的组成部分。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310745761.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top