[发明专利]多声道信号的编码方法和编码器有效

申请号：	201610305243.5	申请日：	2016-05-10
公开（公告）号：	CN107358961B	公开（公告）日：	2021-09-17
发明（设计）人：	张兴涛;刘泽新;苗磊	申请（专利权）人：	华为技术有限公司
主分类号：	G10L19/008	分类号：	G10L19/008
代理公司：	北京龙双利达知识产权代理有限公司 11329	代理人：	王君;张欣
地址：	518129 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	多声道信号编码方法编码器
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提供一种多声道信号的编码方法和编码器，该方法包括：根据多声道信号构建目标频域信号，使得该目标频域信号的相位与第一声道和第二声道的IPD线性相关，再将目标频域信号变换为目标时域信号，并基于目标时域信号提取ITD参数。

技术领域

本发明实施例涉及音频编码领域，并且更为具体地，涉及一种多声道信号的编码方法和编码器。

背景技术

随着生活质量的提高，人们对高质量音频的需求不断增大。相对于单声道音频，立体声音频具有各声源的方位感和分布感，能够提高声音的清晰度、可懂度及临场感，因而备受人们青睐。

立体声处理技术主要有和差(Mid/Sid，MS)编码、强度立体声(Intensity Stereo，IS)编码以及参数立体声(Parametric Stereo，PS)编码。

MS编码基于声道间相关性将两路信号作和、差变换，各声道能量主要集中在和声道，使声道间冗余得以去除。在MS编码技术中，码率的节省依赖于输入信号的相关性，当左右声道信号的相关性差时，需分别传输左声道信号和右声道信号。IS编码基于人耳听觉系统对声道的高频成分(例如，大于2kHz的成分)的相位差异精细结果不敏感的特性，将左右两路信号的高频分量进行简化处理。但该IS编码技术仅对高频成分有效，如将IS编码处理扩展到低频，将会引起严重的人为噪声。PS编码基于双耳听觉模型，在编码端将立体声转换成单声道信号和少量描述空间声场的空间参数(或空间感知参数)，如图1所示(图1中的x_L为左声道时域信号，x_R为右声道时域信号)。解码端得到单声道信号后进一步结合空间参数恢复立体声，如图2所示。相对于MS编码，PS编码压缩比高，在保持较好音质的前提下，能够获得更高的编码增益，且可以工作在全音频带宽中，能够很好地还原立体声的空间感知效果。

PS编码中，空间参数包括声道间相关性(Inter-channel Coherent，IC)、声道间电平差(Inter-channel Level Difference，ILD)、声道间时间差(Inter-channel TimeDifference，ITD)以及声道间相位差(Inter-channel Phase Difference，IPD)。IC描述了声道间的互相关或相干性，该参数决定了声场范围的感知，可以提高音频信号空间感和声响稳定性。ILD用于分辨立体声源的水平方向角度，描述了声道间的强度差别，该参数将影响整个频谱的频率成分。ITD和IPD为表示声源水平方位的空间参数，描述了声道间的时间和相位的差别，该参数主要影响2kHz以下的频率成分。ILD、ITD和IPD能够决定人耳对声源位置的感知，可以有效确定声场位置，对立体声信号的恢复具有重要作用。

ITD参数的编码流程如图3所示。从图3可以看出，在现有技术中，ITD参数的提取是基于频域信号实现的。ITD参数的编码的主要步骤包括：

步骤1、对左右声道时域信号分别进行时频变换，得到左右声道的频域信号。

具体地，可以采用如下公式进行时频变换：

其中，x_L(n)和x_R(n)分别为左右声道的时域信号，Length为帧长或子帧长，L为时频变换的长度。

步骤2、基于左右声道的频域信号提取ITD参数。

具体地，可以将步骤2细分为如下步骤：

步骤2.1、基于公式(3)，在预设的范围[k1,k2]内逐频点计算IPD参数：

IPD(k)＝∠L(k)*R^*(k),k₁≤k≤k₂ (3)

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华为技术有限公司，未经华为技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201610305243.5/2.html，转载请声明来源钻瓜专利网。