[发明专利]在小波音频编码中的基于感知熵的长短块切换方法无效

专利信息
申请号: 01144568.8 申请日: 2001-12-21
公开(公告)号: CN1355611A 公开(公告)日: 2002-06-26
发明(设计)人: 潘兴德;朱晓明 申请(专利权)人: 北京阜国数字技术有限公司
主分类号: H03M7/30 分类号: H03M7/30;G10L19/00
代理公司: 中科专利商标代理有限责任公司 代理人: 朱黎光,张占榜
地址: 100089 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 波音 编码 中的 基于 感知 长短 切换 方法
【说明书】:

技术领域

本发明涉及电子技术领域中的信号处理方法,特别涉及一种音频信号小波变换编码中的信号自适应小波基切换方法。

背景技术

本发明是在《一种实用的基于小波变换的声音编/解码器》(中国专利申请号:01109619.5,以下简称在先申请)基础上的技术改进。在先申请中提出了一种基于小波包变换的声音编/解码器,与mp3的32个均匀子带分解相比,该在先申请提出的小波包分解更适合人的心理声学模型,实现了低频多子带,高频宽子带的分解。具体的分解过程参见在先申请。

在变换编码中,时域帧长(即时域窗长度)的选择受两个互相矛盾的因素制约:帧长越大,则编码增益越高;而过大的帧长将会使时域分辨率降低,而产生严重的“预回声”。因此,选择一个合适的帧长,使编码增益和“预回声”的抑制都达到一个最佳的平衡点,是很重要的。实验证明,当帧长缩短到2ms~5ms时,由于前向掩蔽效应,“预回声”会被其后面的冲击响应所掩蔽。例如,在48kHz采样时,窗长为256时,其时域分辨率为2.7ms,由于前掩蔽效应,人耳察觉不到“预回声”。

在在先申请中,如果对于所有的数字音频信号源,都采用同样的小波基,那么,对于快变的音频信号源,由于帧长较大,时域分辨率较低,将产生严重的“预回声”现象。

本发明的技术内容

本发明的目的是为了消除上述产生严重的“预回声”现象,解决的技术方案是在快变的部分,采用较短的小波基,提高时域分辨率,从而达到减弱和消除“预回声”的现象。基于这种想法,提出了长短块切换的技术,即对平稳部分采用较长的小波基(对应的采用长块),对快变部分采用较短小波基(对应的采用短块)。并在长-短或短-长小波基的接驳处,采用过渡块,实现完全重构。

在基于在先申请的小波变换声音算法中,采用了长短块切换技术后,“预回声”现象基本上得到了消除,这说明在根据信号性质决定小波基选择的长短块切策略是有成效的。

长短块的切换是在心理声学模型中感知熵计算的基础上进行的。感知熵定义为是一段信号变化快慢的度量,根据心理声学模型计算信号的感知熵,当一段信号的感知熵大于某一个事先给定的阈值时,表明该段信号是快变信号,于是将长块的变换方式转换为短块方式,采用短的小波基,直到下一段信号的感知熵小于阈值时,再将短块的变换方式转换为长块方式;当一段信号的感知熵小于某一个事先给定的阈值时,表明该段信号是慢变信号,于是将短块的变换方式转换为长块方式,采用长的小波基,直到下一段信号的感知熵大于阈值时,再将长块的变换方式转换为短块方式;为了实现完全重构,在长-短或短-长块的接驳处,采用过渡块。

这里,小波基的长短取决于“预回声”的抑制和编码效率之间的平衡。例如,一般情况下,在48kHz采样时,窗长为256时,其时域分辨率为2.7ms,由于前掩蔽效应,人耳察觉不到“预回声”,短小波基的冲击响应长度可限定小于256。而为了提高编码效率,长小波基可较长的冲击响应,如接近2048。当长短小波基确定下来以后,就可以相应确定长短块的大小。如在长短小波基的冲击响应长度分别不大于2048和256的情况下,长短块的长度可分别为2048和256个时域样本长度。

附图说明

图1为本发明的16个子带的长延迟结构用于长块的示意图。

图2为本发明的13个子带的低延迟结构用于短块的示意图。

本发明具体实现方式

下面结合附图示意进一步阐明本发明:

以每个长块为2048时域个样本长度为例,心理声学模型根据当前2048样本长的时域信号计算出该段的感知熵,若感知熵小于事先给定的阈值,则对该段信号采取长度为2048的长块小波包变换方式;若感知熵大于阈值,则对该段信号采取8个长度为256的短块小波包变换方式。若上一段信号采取了长块方式,而当前段由感知熵确定为必须取短块方式时,当前段实际上采取了长短块的过渡块方式;反之,若上一段信号采取了短块方式,而由感知熵确定的当前块的变换方式为长块,那么,当前块实际采取的变换方式是短长块的过渡块方式。

以下是以长块为2048样本长为例,具体描述长块、短块、长短块和短长块四种块变换的实现。

采用两个小波包结构:

参见图1为16个子带的长延迟结构用于长块。

参见图2为13个子带的低延迟结构用于短块。

四种块变换分解的实现:

(1)长块:输入2048个时域样本,输出16个子带样本系数,共2048个。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京阜国数字技术有限公司,未经北京阜国数字技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/01144568.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top