[发明专利]基于压缩感知和稀疏表示的语音编码方法有效
申请号: | 201410026207.6 | 申请日: | 2014-01-21 |
公开(公告)号: | CN103778919A | 公开(公告)日: | 2014-05-07 |
发明(设计)人: | 杨震;李尚靖 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G10L19/04 | 分类号: | G10L19/04;G10L19/18 |
代理公司: | 江苏爱信律师事务所 32241 | 代理人: | 刘琦 |
地址: | 210023 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 压缩 感知 稀疏 表示 语音 编码 方法 | ||
技术领域
本发明属于语音信号处理技术领域,涉及一种压缩感知框架下的语音编码方法。
背景技术
压缩感知(Compressed sensing)是近几年来出现的一种新颖的理论,它与传统奈奎斯特采样定理完全不同,不需要信号带宽两倍以上的采样速率,只要信号在某个变换域是稀疏的或可压缩的,那么就可以远低于奈奎斯特采样速率的采样率对信号进行采样,并从少量的观测投影中以高概率重构出原信号。在该理论框架下,采样速率不取决于信号带宽,而决定于信息在信号中的结构和内容。压缩感知理论主要包含三部分:信号的稀疏分解、观测矩阵的设计和信号重构算法。压缩感知一经提出,立刻引起了国内外学者的广泛重视,应用研究已涉及到众多领域:如传感器网络、医学图像处理、雷达扫描、生物传感、语音信号处理等。
近年来,稀疏表示(Sparse representation)已经成为信号处理及其应用领域中处于第一位的概念之一。稀疏表示的核心思想,即对于一类别的信号,在一个足够大的样本训练空间或变换域内,可以大致的由训练样本中同类的样本子空间或变换域原子线性表示,原子即为样本子空间或变换域矩阵里的列向量。因此当该信号由整个样本空间表示时,其表示的系数是稀疏的,这是稀疏表示思想最重要的一个假设,当然也是之后进一步分析的基础。稀疏表示充分利用了某一类信号之间的相关性,对于信号处理中的压缩、消噪、建模和编码等都带来了巨大研究价值。对于由一类信号训练得到的字典来说,训练的成功与否直接决定了下一步稀疏表示的性能,因此国内外学者提出了一系列的字典训练方法,包括优化方向方法算法(MOD),K奇异值分解算法(K-SVD),在线字典学习算法(Online Dictionary Learning)等。
语音编码是语音传输和通信的前提和基础,良好的语音编码方法可在较低的数码率情况下得到较好的恢复语音听觉质量。近二十年来,随着计算机、通信、信号处理等相关技术的发展,语音编码技术得到了迅速发展和应用。语音编码按照传统的分类方法通常分为三类:波形编码、参数编码和混合编码。波形编码是将时间域或频率域或变换域信号直接编码为数字信号,力求使重构语音波形保持原始语音信号的波形形状,主要有脉冲调制编码(PCM)和自适应差分脉冲调制编码(ADPCM)。参数编码又称声源编码或声码器,它使将信源信号在频域或其他变换域提取特征参数,然后对这些特征参数进行编码和传输,在解码端再将收到的数字信号译成特征参数,根据这些特征参数重建语音信号。线性预测系数(Linear prediction coefficient)是目前应用最为广泛的参数编码技术。混合编码将波形编码和参数编码结合起来,克服了波形编码和参数编码的缺点,吸收了他们的长处,在4~16kbps速率上能够得到高质量的合成语音。
发明内容
技术问题:本发明的目的是提供一种可以有效的压缩语音编码所需的数码率,并且保证良好合成语音人耳听觉性能的基于压缩感知和稀疏表示的语音编码方法。
技术方案:本发明基于压缩感知和稀疏表示的语音编码方法,包括以下步骤:
a)通过K奇异值分解算法训练得到一个适合语音信号观测序列的字典D;
b)获得观测序列:在编码端对进入编码器的语音首先进行帧长为20~40ms的分帧处理,然后利用行阶梯矩阵作为投影矩阵,按照1:2或1:4的压缩比对每帧语音进行投影,得到每帧语音的观测序列y;
c)利用稀疏表示对观测序列y进行数学建模,即利用正交匹配追踪算法,得到观测序列y在字典D中的稀疏表示,具体步骤如下:
1)初始化:候选集合I初始化为空集,即I=()空集,残差r=y,稀疏系数γ=0,设置迭代初始次数i=1,迭代终止次数为K;
2)根据下式求残差与字典D中的原子相关度最高的索引k:
,其中dk为字典D内第k个原子,Argmin表示使目标函数取最小值时的变量值;
然后将所选原子索引k放入候选集合I内,;
3)根据下式更新稀疏系数:
,其中为仅利用候选集合I内索引原子的字典,为的伪逆矩阵,为仅利用候选集合I内原子的稀疏表示向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410026207.6/2.html,转载请声明来源钻瓜专利网。