[发明专利]数字音频信号中的有效前回声衰减有效
申请号: | 201380034828.2 | 申请日: | 2013-06-28 |
公开(公告)号: | CN104395958B | 公开(公告)日: | 2017-09-05 |
发明(设计)人: | B.科维西;S.拉戈特 | 申请(专利权)人: | 奥林奇公司 |
主分类号: | G10L21/0364 | 分类号: | G10L21/0364;G10L19/26 |
代理公司: | 北京市柳沈律师事务所11105 | 代理人: | 李芳华 |
地址: | 法国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数字音频 信号 中的 有效 回声 衰减 | ||
技术领域
本发明涉及用于在数字音频信号的解码期间处理前回声的衰减的方法和装置。
背景技术
关于数字音频信号通过传送网络(它们例如是固定或移动网络)的传输、或者关于信号的存储,利用实现基于变换的频率编码或时间编码类型的编码系统的压缩(或源编码)处理。
由此,作为本发明的主题的方法和装置的应用领域是声音信号的压缩,特别是通过频率变换所编码的数字音频信号的压缩。
图1作为图示表示了根据现有技术的通过相加/重叠的包括分析-合成的数字音频信号的基于变换的编码和解码的基本图。
某些音乐序列,诸如打击乐和比如爆破音(/k/,/t/,…)的某些语音片段,的特征在于几个样本的空间内的、信号的力度变化的非常快的转变和非常强的变化(variation)所表明的极端陡峭(abrupt)的冲击。图1中给出了样本410前面的示范转变。
对于编码/解码处理,输入信号被分离为长度L的样本块,在图1中由垂直虚线表示。输入信号被表示为x(n),其中n是样本的索引。连续块的限幅导致这些块由XN(n)=[x(N.L)…x(N.L+L-1)]=[xN(0)…xN(L-1)]定义,其中N是帧的索引,并且L是帧的长度。在图1中,我们具有L=160个样本。在修改余弦调制变换MDCT(代表“修改离散余弦变换”)的情况下,联合分析两个块XN(n)和XN+1(n),以给出与索引N的帧关联的变换系数的块。
基于变换的编码而操作的划分为块(也称为帧)完全独立于声音信号,并且转变所以能在分析窗口的任意点处出现。现在,在基于变换的解码之后,通过量化(Q)-逆量化(Q-1)操作所造成的“噪声”(或失真)混合(marred)重构的信号。该编码噪声按照相对均匀的方式在时间上分布在变换块的全部时间支持上(也就是说,样本的长度2L的窗口的全部长度上(具有L个样本 的重叠)。编码噪声的能量一般与块的能量成比例,并取决于编码/解码比特率。
对于包括冲击的块(诸如图1的块320-480),信号的能量高,并所以噪声具有高电平。
在基于变换的编码中,编码噪声的电平典型低于紧靠转变之后的高能量片段的信号的电平,但是该电平高于低能量片段的信号的电平,特别是在转变之前的部分上(图1的样本160–410)。关于前述部分,信噪比是负的,并且得到的降级在收听期间能似乎是非常烦人的。转变之前的编码噪声被称为前回声,并且转变之后的噪声被称为后回声。
在图1中可以观察到,前回声影响转变之前的帧、以及其中发生转变的帧。
心理声学的经验已示出了人耳执行声音的几毫秒等级的相当有限的时间前掩蔽(pre-masking)。当前回声的持续时间大于前掩蔽的持续时间时,冲击之前的噪声或前回声是可听见的。
当从高能量序列转换(pass)为低能量序列时,人耳也执行较长持续时间(从5到60毫秒)的后掩蔽。后回声可接受的讨厌等级或级别所以大于前回声。
块的长度在样本数目方面越大,更关键的前回声的现象越讨厌。现在,在基于变换的编码中,公知的是,对于固定信号,变换的长度增加越大,编码增益越大。按照固定采样频率和固定比特率,如果窗口的点数(所以变换的长度)增加,则每帧更多的比特将可用于对心理声学模型认为有用的频谱线进行编码,由此实现使用大长度块的优点。MPEG AAC编码(先进音频编码)例如使用包括固定数目样本(2048)的大长度的窗口(即,按照32kHz的采样频率在64ms的持续时间上);通过使得可能经由中间(转变)窗口从这些长窗口切换到8个短窗口而在这里管理前回声的问题,由此需要编码的特定延迟来检测转变的存在并改编(adapt)窗口。这些短窗口的长度所以是8 ms。按照低比特率,总是可能具有几ms的可听前回声。切换窗口使得可能衰减前回声而不是去除它。用于诸如UIT-T G.722.1、G.722.1C或G.719的对话应用的基于变换的编码器通常使用在16、32或48kHz处(分别)持续时间40ms并且帧长度20ms的窗口。可注意的是,UIT-T G.719编码器集成用于利用瞬变(transient)检测切换窗口的机制,然而在低比特率(典型地 32 k比特/秒)处前回声没有完全降低。
带着降低前述前回声现象的讨厌效果的目的,已在编码器和/或解码器级别提出各种解决方案。
上面阐明了窗口的切换。另一解决方案在于应用自适应滤波。在冲击之前的区域中,将重构信号看作原始信号和量化噪声之和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奥林奇公司,未经奥林奇公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380034828.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种快速去除压铸品毛刺的方法
- 下一篇:包装识别系统