[发明专利]用于产生频率增强音频信号的译码器、译码方法、用于产生编码信号的编码器以及使用紧密选择边信息的编码方法有效
| 申请号: | 201480006567.8 | 申请日: | 2014-01-28 |
| 公开(公告)号: | CN105103229B | 公开(公告)日: | 2019-07-23 |
| 发明(设计)人: | 弗雷德里克·纳格尔;萨沙·迪施;安德烈娅斯·尼德迈尔 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
| 主分类号: | G10L21/0388 | 分类号: | G10L21/0388 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;尹莹莹 |
| 地址: | 德国*** | 国省代码: | 德国;DE |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 产生 频率 增强 音频 信号 译码器 译码 方法 编码 编码器 以及 使用 紧密 选择 信息 | ||
一种用于生成频率增强音频信号(120)的译码器,包括:特征提取器(104),用于自核心信号(100)提取特征;边信息提取器(110),用于提取与该核心信号相关联的选择边信息;参数生成器(108),用于产生用于估计未由所述核心信号(100)限定的所述频率增强音频信号(120)的频谱范围的参数表示,其中所述参数生成器(108)被配置成响应于所述特征(112)提供数个参数表示替代例(702,704,706,708),且其中所述参数生成器(108)被配置成响应于所述选择边信息(712‑718)选择所述参数表示替代例中的一者作为所述参数表示;以及信号估计器(118),用于使用选择的所述参数表示来估计所述频率增强音频信号(120)。
说明书
本发明涉及音频编码,且特别涉及在频率增强(即,译码器输出信号相比于编码信号具有较多数目个频带)的上下文中的音频编码。该过程包含带宽扩展、频谱复制或智能间隙填充。
当前的语音编码系统能够在低至6千位/秒的位速率下对宽带(wideband,WB)数字音频内容(亦即,具有高达7kHz至8kHz的频率的信号)编码。经最广泛论述的实例为ITU-T建议G.722.2[1],以及经新近开发的G.718[4、10]及MPEG-D统一语音与音频编码(UnifiedSpeech and Audio Coding,USAC)[8]。G.722.2(亦被称为AMR-WB)及G.718两者使用介于6.4kHz与7kHz间的带宽扩展(BWE)技术以允许基础ACELP核心编码器“集中”于感知上较相关的较低频率(特别是人类听觉系统为相位灵敏处的频率),且由此尤其在极低位速率下实现足够质量。在USAC扩展高效率进阶音频编码(eXtended High Efficiency AdvancedAudio Coding,xHE-AAC)规格中,使用增强频谱带复制(enhanced spectral bandreplication,eSBR)以将音频带宽扩展成超出通常在16千位/秒下低于6kHz的核心编码器带宽。当前现有技术BWE处理通常可被划分成两种概念性方式:
·盲或人工BWE,其中高频(high-frequency,HF)分量仅从解码低频(low-frequency,LF)核心编码器信号重新建构,亦即,无需自编码器传输的边信息。此方案由在16千位/秒及16千位/秒以下的AMR-WB及G.718以及对传统窄带电话语音[5、9、12]操作的一些向前兼容BWE后处理器使用(实例:图15)。
·导引式BWE,其不同于盲BWE之处在于:用于HF内容重新建构的参数中的一些作为边信息被传输至译码器,而非根据译码核心信号来估计。AMR-WB、G.718、xHE-AAC以及一些其它编译码器[2、7、11]使用此方式,但不在极低位速率下(图16)。
图15示出了如Bernd Geiser、Peter Jax及Peter Vary的公开物“ROBUSTWIDEBAND ENHANCEMENT OF SPEECH BY COMBINED CODING AND ARTIFICIAL BANDWIDTHEXTENSION”(国际声学回音与噪声控制工作组(International Workshop on AcousticEcho and Noise Control,IWAENC)学报,2005年)中描述的此盲或人工带宽扩展。图15所示的独立带宽扩展算法包含插值程序1500、分析滤波1600、激励扩展1700、合成滤波器1800、特征提取程序1510、包络估计程序1520及统计模型1530。在窄带信号至宽带取样率的内插之后,计算特征向量。接着,借助于经预训练的统计隐式马尔可夫模型(hidden Markovmodel,HMM),依据线性预测(linear prediction,LP)系数来判定针对宽带频谱包络的估计。将该宽带系数用于内插窄带信号的分析滤波。在所得激励的扩展之后,应用反向合成滤波器(inverse synthesis filter)。选择不会更改窄带的激励扩展对于窄带分量是明显的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480006567.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:再现装置、控制方法以及程序
- 下一篇:一种磁场耦合器





