[发明专利]多声道声音信号编码方法、解码方法及装置有效
申请号: | 201410404895.5 | 申请日: | 2014-08-15 |
公开(公告)号: | CN105336334B | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 潘兴德;吴超刚 | 申请(专利权)人: | 北京天籁传音数字技术有限公司 |
主分类号: | G10L19/008 | 分类号: | G10L19/008 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁 |
地址: | 100029 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多声道 声音 信号 编码 方法 解码 装置 | ||
1.一种多声道声音信号编码方法,其特征在于,所述方法包括:
A)采用修正离散余弦变换MDCT或修正离散正弦变换MDST,将第一多声道声音信号映射为第一频域信号;
B)根据所述第一频域信号中序号的奇偶,将所述第一频域信号划分为多个子频谱;针对所述多个子频谱中的每个子频谱,将所述每个子频谱作为所述第一频域信号,将所述第一频域信号划分为不同时频子带;所述不同时频子带包括奇频谱子带和偶频谱子带;
C)在所述不同时频子带中的每个时频子带内,计算所述第一多声道声音信号的第一统计特性;
D)根据所述第一统计特性,估计主成分分析PCA映射模型;
E)采用所述PCA映射模型,将所述第一多声道声音信号映射为第二多声道声音信号;
F)根据时间、频率和声道的不同,对所述第二多声道声音信号中的至少一组和所述PCA映射模型进行感知编码,并复用成编码多声道码流;其中所述感知编码包括采用奇频谱子带的映射矩阵与相邻偶频谱子带的映射矩阵进行联合矢量编码。
2.如权利要求1所述的方法,其特征在于,在所述不同时频子带中的每个时频子带内,计算所述第一多声道声音信号的第一统计特性之前,还包括:
在所述不同时频子带中的每个时频子带内,计算所述第一多声道声音信号的第二统计特性;根据所述第二统计特性,将所述第一多声道声音信号划分为多个分组声音信号;
针对每个分组声音信号,将所述每个分组声音信号作为所述第一多声道声音信号执行步骤C)至F);
所述步骤F)具体包括:根据时间、频率和声道的不同,对第二多声道声音信号中的至少一组、声道分组信息和PCA映射模型进行感知编码,并复用成编码多声道码流。
3.如权利要求1所述的方法,其特征在于,所述采用修正离散余弦变换MDCT或修正离散正弦变换MDST,将第一多声道声音信号映射为第一频域信号之前,还包括:
计算所述第一多声道声音信号的第三统计特性;根据所述第三统计特性,将所述第一多声道声音信号划分为多个分组声音信号,对声道分组信息进行编码并复用到编码多声道码流中;
针对每个分组声音信号,将所述每个分组声音信号作为所述第一多声道声音信号执行步骤A)至F)。
4.一种多声道声音信号编码装置,其特征在于,所述装置包括:
时频映射单元,用于采用修正离散余弦变换MDCT或修正离散正弦变换MDST,将第一多声道声音信号映射为第一频域信号;将所述第一频域信号划分为不同时频子带;所述不同时频子带包括奇频谱子带和偶频谱子带;
自适应子空间映射单元,用于在所述时频映射单元划分的不同时频子带中的每个时频子带内,计算所述第一多声道声音信号的第一统计特性;根据所述第一统计特性,估计主成分分析PCA映射模型;采用所述PCA映射模型,将所述第一多声道声音信号映射为第二多声道声音信号;
感知编码单元,用于根据时间、频率和声道的不同,对所述自适应子空间映射单元映射的第二多声道声音信号中的至少一组和所述PCA映射模型进行感知编码,并复用成编码多声道码流;其中所述感知编码单元采用奇频谱子带的映射矩阵与相邻偶频谱子带的映射矩阵进行联合矢量编码;
子频谱划分单元,用于在所述时频映射单元将所述第一频域信号划分为不同时频子带之前,根据所述第一频域信号中序号的奇偶,将所述第一频域信号划分为多个子频谱;
所述自适应子空间映射单元和所述感知编码单元还用于,针对所述子频谱划分单元划分的多个子频谱中的每个子频谱,将所述每个子频谱作为所述第一频域信号进行处理。
5.如权利要求4所述的装置,其特征在于,还包括:
第一声道分组单元,用于在所述自适应子空间映射单元在不同时频子带中的每个时频子带内,计算所述第一多声道声音信号的第一统计特性之前,在所述时频映射单元划分的不同时频子带中的每个时频子带内,计算所述第一多声道声音信号的第二统计特性;根据所述第二统计特性,将所述第一多声道声音信号划分为多个分组声音信号;
所述自适应子空间映射单元和所述感知编码单元具体用于,针对所述第一声道分组单元划分的每个分组声音信号,将所述每个分组声音信号作为所述第一多声道声音信号进行处理,所述感知编码单元还用于对声道分组信息进行感知编码。
6.如权利要求4所述的装置,其特征在于,还包括:
第二声道分组单元,用于在所述时频映射单元采用修正离散余弦变换MDCT或修正离散正弦变换MDST,将第一多声道声音信号映射为第一频域信号之前,计算所述第一多声道声音信号的第三统计特性;根据所述第三统计特性,将所述第一多声道声音信号划分为多个分组声音信号,并对声道分组信息进行感知编码;
所述时频映射单元、所述自适应子空间映射单元和所述感知编码单元具体用于,针对所述第二声道分组单元划分的每个分组声音信号,将所述每个分组声音信号作为所述第一多声道声音信号进行处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京天籁传音数字技术有限公司,未经北京天籁传音数字技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410404895.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种非交叠四相位时钟产生电路
- 下一篇:分解音频信号