[发明专利]基于高斯混合模型的感知域音频编码方法及系统有效
| 申请号: | 201410057260.2 | 申请日: | 2014-02-20 |
| 公开(公告)号: | CN103761969A | 公开(公告)日: | 2014-04-30 |
| 发明(设计)人: | 高戈;陈怡;吕亚平;张康;杨玉红 | 申请(专利权)人: | 武汉大学 |
| 主分类号: | G10L19/04 | 分类号: | G10L19/04 |
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 张火春 |
| 地址: | 430072 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 混合 模型 感知 音频 编码 方法 系统 | ||
技术领域
本发明涉及感知域音频编码领域,尤其涉及一种基于高斯混合模型的感知域音频编码方法及系统。
背景技术
随着计算机技术、网络技术和通信技术的飞速发展,人类社会已经进入了数字化时代。一些重要信号,如语音、音乐、影视的数字化版本,数据量巨大,传输和存储成本较高。而且,随着新技术和新应用的不断出现,还有可能出现数码率更高的信源。这些数据的传输和存储便是一个很大的难题,而编码技术正是针对这一问题而提出的解决办法。在这些应用中,音频编码技术作为其中的关键技术之一起到了极大的推动作用。人类听觉系统存在局限性,不能感知所接收到的声音中的所有信号成分。传统的感知域音频编码方法将音频信号变换到感知域后,会产生大量的冗余脉冲信号,编码效率不高。
发明内容
本发明的目的是提供一种基于高斯混合模型的感知域音频编码方法及系统,使得编码后的音频信号码率更低。
为达到上述目的,本发明提出了一种基于高斯混合模型的感知域音频编码方法,包括步骤:
步骤1,采用听觉滤波器对输入音频信号进行滤波,获得子带信号;
步骤2,提取子带信号的希尔伯特包络,对希尔伯特包络进行平滑滤波,获得子带信号谱包络;
步骤3,采用心理声学模型获得子带信号谱包络的绝对掩蔽阈值,根据绝对掩蔽阈值对子带信号谱包络进行听觉阈值判别,去除小于绝对掩蔽阈值的子带信号谱包络,保留不小于掩蔽阈值的子带信号谱包络,以便有效减少子带信号脉冲数量;
步骤4,采用多路复用掩蔽模型替换步骤3所得子带信号谱包络,使用多路复用掩蔽模型的目的主要有两个:一方面为了进一步减少子带信号脉冲数量从而有利于编码的实施,另一方面为了更好重构音频信号;
步骤5,采用高斯混合模型参数分别表示各子带信号谱包络,基于步骤4所得子带信号谱包络构建高斯混合模型,并采用高斯-牛顿算法拟合高斯混合模型参数;
步骤6,对步骤5所得高斯混合模型参数进行量化和编码。
步骤4进一步包括子步骤:
4.1针对当前原始子带信号样本,找出子带信号谱包络的最大值,计算最大值所在的子带信号谱包络产生的掩蔽效应图形,所述的当前原始子带信号样本初始值为步骤3所得子带信号谱包络;
4.2将当前原始子带信号样本与掩蔽效应图形中对应的样本点值进行比较,并根据比较结果获得替换后的子带信号谱包络:
若当前原始子带信号样本点值大于掩蔽效应图形中相应样本点值,则保留该当前原始子带信号样本点;若当前原始子带信号样本点值不大于掩蔽效应图形中相应样本点值,则将该当前原始子带信号样本点值替换为掩蔽效应图形中相应样本点值;所述的样本点值指样本点处谱包络的幅度值;
4.3以替换后的子带信号谱包络为当前原始子带信号样本,然后执行步骤4.1~4.2,直至当前原始子带信号样本中所有样本点值均被掩蔽效应图形中相应样本点值替换过、或均进行过至少两次样本点值比较,即完成子带信号谱包络替换。
步骤5进一步包括子步骤:
5.1定义拟合算式其中,F(i)为子带信号在样本点i处谱包络的幅度值;f(i)为高斯混合模型中样本点i处的概率密度,根据高斯混合模型参数可获得样本点的概率密度;L为子带信号的样本点总数量;X表示待找寻的极值点;
5.2根据当前高斯混合模型参数获得当前高斯混合模型样本点的概率密度,从而计算高斯混合模型参数的搜索方向Sk=Pk-1-▽f(Pk-1)((Hf(Pk-1))-1)',其中,当前高斯混合模型样本点Pk-1为高斯混合模型中第k个样本点值,其初始值为子带信号谱包络中第一个样本点值;为黑森矩阵;当前高斯混合模型参数初始值根据经验积累确定;
5.3针对各高斯混合模型参数,根据搜索方向Sk在区间[0,L]上对Φ(γ)=f(Pk-1+γSk)进行单变量极小化,得到Φ(γ)的极小值对应的样本点hmin,从而获得高斯混合模型参数的变化值;
5.4构造下一个极小值点Pk=Pk-1+hminSk,并根据高斯混合模型参数变化值更新高斯混合模型参数,以Pk为当前高斯混合模型样本点,以更新的高斯混合模型参数为当前高斯混合模型参数,重复步骤5.2~5.3;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410057260.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种物料计量罐
- 下一篇:一种凹凸棒土酸化改性方法





