[发明专利]一种基于SILK的语音编码器编码效率提高方法在审
申请号: | 201810040152.2 | 申请日: | 2018-01-16 |
公开(公告)号: | CN108231083A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 李强;张玲;明艳;王怡曼 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L19/012;G10L19/16;G10L19/26;G10L21/0208;G10L25/78;G10L25/93 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 400065*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 编码效率 语音编码器 模拟信号 噪声整形量化器 比特流格式 加权滤波器 预测滤波器 边带信息 后置滤波 激励信号 量化索引 量化噪声 频谱区域 输入语音 重构信号 编码端 解码端 量化器 最小化 预测 长时 加权 感知 噪声 压缩 重建 联合 | ||
本发明提出一种基于SILK的语音编码器编码效率提高方法。具体实施方法包括:首先,对输入语音信号中添加特定噪声,生成模拟信号,然后对该模拟信号进行长时和短时预测,提高预测滤波器的预测增益,减少量化索引的熵,从而提高编码效率;其次,在编码端通过最小化感知加权重建误差来确定激励信号,在解码端采用后置滤波来压缩量化噪声和信号之间具有较高相关性的频谱区域,通过对噪声整形量化器的输入和重构信号添加不同的加权滤波器,使得以上两个功能在编码端的量化器中得到联合。采用本发明提出的方法,既不需要边带信息,也不用改变比特流格式,又能提高SILK的编码效率。
技术领域
本发明属于语音通信领域,特别是涉及到一种基于SILK的宽带语音编码器,广泛应用于电话会议、网络语音电话业务(Voice over Internet Protocol,VoIP)、无线通信、游戏平台等实时语音通信场景中。
背景技术
语音是人类最直接、最方便、最高效的信息传递媒介,因此语音信号的传输是大多数通信系统具有的基本功能。随着科学技术的发展,图像、文本等非语音信息在信息传递中占据着越来越大的比例,但是有效的传递语音信息仍然是众多通信系统必备的功能之一。
在数字通信系统中,原始语音信号必须经过数字化后才能进行传输,但语音信号经过模/数转换后,数据量大增,如对语音信号进行16kHz采样、16bit均匀量化后,数码率可达到256kbps。高速率的数字语音信号在通信网中传输时需要更大的带宽,这对频带资源有限的通信系统,如蜂窝移动通信等,增加了传输成本,因此,有必要对数字化的语音信号进行压缩编码。
1972年,国际电报电话咨询委员会(Consultative Committee of InternationalTelegraph and Telephone,CCITT)公布了64kbps的语音编码标准G.711,它采用脉冲编码调制(Pulse Code Modulation,PCM)技术,应用于电话通信业务中;1980年,CCITT制定了32kbps自适应差分脉冲编码调制(Adaptive Differential Pulse Code Modulation,ADPCM)语音编码标准G.721;随后,基于分析合成的语音编码算法成为主流,1992年,CCITT公布了16kbps短延时码激励线性预测(Low Delay Code Excited Linear Prediction,LD-CELP)的语音编码方案G.728;1996年制定了8kbps共轭结构代数码激励线性预测(Conjugate Structure Algebraic Code Excited Linear Prediction,CS-ACELP)的语音编码标准G.729。该标准可应用于VoIP和H.323等话音通信领域。随着网络带宽的不断增加,终端处理能力不断增强,用户对通话质量要求也在不断的提高,宽带、超宽带、全频带语音编码技术得到了广泛的研究和应用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810040152.2/2.html,转载请声明来源钻瓜专利网。