[发明专利]线性预测语音编码方法及语音合成方法无效
申请号: | 201210592909.1 | 申请日: | 2012-12-31 |
公开(公告)号: | CN103050121A | 公开(公告)日: | 2013-04-17 |
发明(设计)人: | 洪小斌 | 申请(专利权)人: | 北京迅光达通信技术有限公司 |
主分类号: | G10L19/04 | 分类号: | G10L19/04 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹 |
地址: | 100081 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 线性 预测 语音 编码 方法 合成 | ||
技术领域
本发明涉及语音编码技术,特别涉及一种线性预测语音编码方法及一种语音合成方法。
背景技术
随着信息社会和通信技术的高速发展,频率资源显得愈加宝贵。在数字移动通信和语音存储领域中,为了有效利用通信带宽或存储空间,使用语音编码装置压缩语音信号的传输带宽或降低电话通道的传输码率,提高效率进行编码,一直是人们追求的目标。随着通信网络用户数量的增加、网络业务综合化与多样化,网络带宽与系统容量、服务质量的矛盾日益突出,传统的语音压缩编码技术已不能满足不断变得拥挤的传输信道要求。因此,如何在不牺牲语音通话质量的前提下尽可能降低其传输的比特速率是重要的研究课题。近十年来,中比特率(4.8kbps~16kbps)语音编码算法研究已取得了长足的进步并有了广泛应用,同时低比特率特别是2.4kbps以下语音编码算法逐渐成为研究焦点。随着运行编码算法的处理芯片运算速度的迅速提高,基于线性预测混合编码技术的算法渐渐成为了低比特率语音编码算法的主流。
线性预测编码(Linear Prediction Coding,LPC)的基础是假设声音信号(浊音)是音管末端的蜂鸣器产生的,偶尔伴随有嘶嘶声与爆破声(齿擦音与爆破音),声带之间的声门产生不同强度(音量)与频率(音调)的声音,喉咙与嘴组成共鸣声道。嘶嘶声与爆破声通过舌头、嘴唇以及喉咙的作用产生出来。线性预测编码通过估计共振峰、剔除它们在语音信号中的作用、估计保留的蜂鸣音强度与频率来分析语音信号。剔除共振峰的过程称为逆滤波,经过这个过程剩余的信号称为残差信号。描述共振峰、残差信号的参数以及线性预测系数可以保存、发送到接收方。接收方通过逆向的过程合成语音信号,共振峰、残差信号作为激励源产生源信号,使用线性预测系数作为声道的滤波器,源信号经过滤波器的处理就得到语音信号。
根据对激励信号描述方式的不同,线性预测语音编码方法主要分为LPC-10、码激励线性预测编码(Code Excited Linear Prediction,CELP)、混合激励(Mixed Excited Linear Prediction,MELP)、正弦激励(Sinusoidal Excited Linear Prediction,SELP)和多带激励(Multi-BandExcitation)等。这些语音编码方式是将语音划分为某个帧长(20ms~50ms左右),对每个帧进行语音的线性预测,用已知码本对线性预测矢量和每帧的通过线性预测所得的预测残差(激励信号)进行编码。
图1是现有的基于线性预测的语音编码方法的基本框图,这些方法除了残差参数的提取方法不同外,其它参数的提取都基本相同。在图1中,激励信号用残差参数、原始语音的基音周期、原始语音的增益和原始语音的各子带的清浊音来表示,残差参数用来描述残差中浊音的谐波分量,清音用噪声代替。
现有的基于线性预测的声码器语音质量强烈地依赖于原始语音的噪声强度,原始语音信噪比较差时,清浊音判决错误、基音提取错误会导致严重的变调失真,使合成自然度下降。这些技术中产生激励信号的基音周期、增益和子带的清浊音都是从原始语音提取的,接收端还原激励信号时部分参数来源于原始语音,部分参数来源于残差信号,使解码的语音质量受到限制。
发明内容
(一)所要解决的技术问题
本发明的目的在于提供一种线性预测语音编码方法及一种语音合成方法,能够减小噪声对解码语音质量的影响,抑制清浊音判决错误时的音质恶化,并改善对清音语音或背景噪声的编码性能。
(二)技术方案
为了解决上述技术问题,本发明提出了一种线性预测语音编码方法,所述语音编码方法包括以下步骤:
S101、对语音进行预处理以去除直流成分和工频干扰;
S102、对预处理后的语音进行二阶反线性预测,得到残差信号;
S103、对所述残差信号进行小波分解压缩,得到小波系数,并对所述小波系数进行矢量量化,
计算所述残差信号的基音周期,并对所述基音周期进行标量量化,
计算所述残差信号的增益参数,并对所述增益参数进行标量量化,
将所述残差信号划分为若干个子带,对各子带进行清浊音判决,得到各子带的清浊音特性并进行标量量化。
可选的,步骤S102进一步包括:
对所述预处理后的语音进行线性预测分析,得到线性预测系数,然后将所述线性预测系数转换为线谱频率对,并对所述线谱频率对进行矢量量化。
可选的,步骤S102中,所述线性预测分析具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迅光达通信技术有限公司,未经北京迅光达通信技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210592909.1/2.html,转载请声明来源钻瓜专利网。