[发明专利]音频信号的线性预测编码无效
| 申请号: | 200780020345.1 | 申请日: | 2007-05-15 |
| 公开(公告)号: | CN101460998A | 公开(公告)日: | 2009-06-17 |
| 发明(设计)人: | A·C·登布林克 | 申请(专利权)人: | 皇家飞利浦电子股份有限公司 |
| 主分类号: | G10L19/06 | 分类号: | G10L19/06 |
| 代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 李静岚;谭祐祥 |
| 地址: | 荷兰艾*** | 国省代码: | 荷兰;NL |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 信号 线性 预测 编码 | ||
技术领域
本发明涉及音频信号的线性预测编码。
背景技术
各种源信号的数字编码在过去几十年来已经变得越来越重要了,因为数字信号的表示和通信已经逐渐替换了模拟的表示和通信。例如,诸如全球移动通信系统之类的移动电话系统基于数字语音编码。此外,诸如视频和音乐之类的媒体内容的分发也更多地基于数字内容编码。
在内容编码中以及特别地在音频和语音编码中,线性预测编码是一种经常采用的工具,因为它针对低数据率提供了高质量。线性预测编码过去主要应用于单独的信号,但是也可以用于多通道信号,例如立体音频信号。
线性预测编码通过降低信号中的冗余并且在预测参数中捕获这些冗余来实现有效的数据率。这些预测参数包含在编码的信号中,并且所述冗余在解码器中通过线性预测合成滤波器来复原。
此外,线性预测还作为预处理工具而提出,以用于包括非语音编码应用的音频编码。特别地,根据建议,最佳的线性预测方案应当反映心理声学知识以便更精确地反映听众的感知。特别地,已经提出了卷曲(warped)线性预测(WLP)和纯线性预测(PLP)技术。两种技术都包括依照心理声学对频率尺度进行卷曲,从而使得建模能力集中在最关键的频带处。特别地,WLP和PLP允许以类似于基底膜上的带宽分布的方式着重于较低的频率。这也意味着在WLP和PLP中谱峰加宽可以在心理声学相关尺度上有效地实现。
此外,根据建议,预测系数可以从像响度谱或掩蔽阈值(或掩蔽误差功率)那样的感知激发的频谱中导出。因此,在所提出的系统中,将待编码的信号馈送到心理声学模型中,所述心理声学模型为特定信号段产生反映感兴趣的心理声学量的频谱(例如掩蔽阈值)。这个频谱然后用于为所述线性预测滤波器产生预测系数。
然而,尽管该方法允许将线性预测用于考虑了心理声学掩蔽效应的音频编码,但是它也具有许多缺点。特别地,该方法要求为每个信号段执行心理声学模型,这是复杂且计算昂贵的。此外,该方法倾向于不灵活,并且特别地要求预测滤波器是卷曲的或拉盖尔(Laguerre)滤波器以便工作于心理声学相关频率尺度上。
因此,改进的线性预测编码将是有利的,特别地,允许灵活性增加、复杂度降低、实现方式易化、编码质量和/或性能提高的方法将是有利的。
发明内容
相应地,本发明寻求优选地单独或以任意组合缓解、减轻或消除上述缺点中的一个或多个。
依照本发明的一个方面,提供了用于音频信号的线性预测编码的设备,该设备包括:用于为该音频信号产生信号段的装置;用于为每个信号段产生第一自相关序列的装置;用于通过响应于至少一个心理声学特性而修改第一自相关序列来为每个信号段产生第二自相关序列的修改装置;以及用于响应于第二自相关序列而为每个信号段确定线性预测编码系数的确定装置。
本发明允许实现改进的线性预测编码,其反映了听众的感知,从而针对给定编码率提供了改进的编码质量。本发明可以允许获得降低的复杂度、降低的计算资源要求和/或易化的实现方式。此外,本发明还可以允许将心理声学因素与各种不同的线性预测编码方法一起使用。
特别地,本发明可以允许计算根据第一自相关序列确定的心理声学加权自相关序列。该计算可能复杂度较低,但是提供了对于心理声学性质的有效适应。
所述设备此外还可以包括用于产生包含线性预测编码系数的编码数据流的装置。该设备还可以包括用于将编码的数据流例如作为数据文件来发送的装置。此外,该设备还可以包括采用线性预测编码系数的线性预测滤波器以及用于产生误差信号的装置。该设备还可以包括用于编码误差信号并且用于将其包含于编码的数据流中的装置。
依照本发明的一个可选特征,修改装置被设置成执行对第一自相关序列的加窗。
这可以允许获得改进的性能、更高的质量、降低的复杂度和/或易化的实现方式。特别地,所述加窗可以允许实现与心理声学知识一致的频谱扩展。所述加窗可以通过将第一自相关序列与时域窗序列相乘来实现。
依照本发明的一个可选特征,所述加窗相应于与巴克(Bark)带宽相应的心理声学带宽。
这可以允许获得改进的性能和/或更高的质量。
依照本发明的一个可选特征,所述加窗相应于与等效矩形带宽(ERB)相应的心理声学带宽。
这可以允许获得改进的性能和/或更高的质量。
依照本发明的一个可选特征,修改装置被设置成通过最小值自相关序列来界定第二自相关序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦电子股份有限公司,未经皇家飞利浦电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780020345.1/2.html,转载请声明来源钻瓜专利网。





