[发明专利]用于提升语音丢帧补偿性能的混合多描述正弦编码器方法有效
| 申请号: | 201811342149.2 | 申请日: | 2018-11-13 | 
| 公开(公告)号: | CN109616129B | 公开(公告)日: | 2021-07-30 | 
| 发明(设计)人: | 林志斌;刘晓峻;狄敏 | 申请(专利权)人: | 南京南大电子智慧型服务机器人研究院有限公司;南京大学;江苏南大电子信息技术股份有限公司;马鞍山艾德声电子技术有限公司 | 
| 主分类号: | G10L19/005 | 分类号: | G10L19/005;G10L19/07;G10L19/26 | 
| 代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 彭雄 | 
| 地址: | 210019 江苏省南京市建*** | 国省代码: | 江苏;32 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 用于 提升 语音 补偿 性能 混合 描述 正弦 编码器 方法 | ||
本发明公开了一种用于提升语音丢帧补偿性能的混合多描述正弦编码器方法,编码器框架结构由三个编码器组成,分别为多描述正弦编码器、参数编码器一和参数编码器二,其中多描述正弦编码器是核心编解码器,参数编码器一和参数编码器二为发送端丢包补偿用辅助编码器,引入两帧的信号延迟,增加了混合多描述正弦编码器的编解码器对网络丢包的鲁棒性。本发明通过牺牲相关冗余度提高人机交互通讯语音丢帧纠错能力,有效的提升人机交互数据丢失时的语音质量。
技术领域
本发明涉及一种混合多描述正弦编码器方法,属于音频处理技术领域。
背景技术
在过去的几年里,人机交互获得了广泛的重视,并取得了巨大的成功。但是在不可靠的分组网络上,由于分组丢失的存在,传输的语音质量还不尽如人意。传统的处理分组丢失的方法是重传。但是当分组丢失率较高时,重传会导致更加拥塞的环境,并且不能满足实时性的要求。与重传不同,多描述编码(MDC)可以显著提高传输的稳定性,而又不引入明显的时延,是一种有效的解决分组丢失的方法。早期提出的多描述波形语音编码器算法简单,可以很好地提高系统的传输稳定性,但这类编码器的压缩率不高。后续有人提出基于CELP的多描述编码器,这些编码器有足够高的压缩效率,但是它们的参数之间有很强的依赖性,描述分解方法不够灵活,稳定性的提高是以性能大幅降低为代价的,而且分组的丢失会影响到编码器状态的恢复。
发明内容
发明目的:为了克服现有技术中存在的不足,本发明提出一种混合多描述正弦编码器方法,通过牺牲相关冗余度提高人机交互通讯语音丢帧纠错能力,有效的提升人机交互数据丢失时的语音质量。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种用于提升语音丢帧补偿性能的混合多描述正弦编码器方法,编码器框架结构由三个编码器组成,分别为多描述正弦编码器、参数编码器一和参数编码器二,其中多描述正弦编码器是核心编解码器,参数编码器一和参数编码器二为发送端丢包补偿用辅助编码器,引入两帧的信号延迟,增加了混合多描述正弦编码器的编解码器对网络丢包的鲁棒性;其中多描述正弦编码器为基于多描述框架的正弦编码器,
多描述正弦编码器主要由两部分组成,其中一部分为线谱对参数冗余描述,另一部分为残差信号的匹配跟踪正弦建模模块及其交织多描述;采用线性预测求残差的方式进行混合多描述编码,其中线谱对参数量化采用感知加权分裂矢量量化方式进行,采用10阶全极点滤波器进行线性预测,转化成10个对应的LSF参数,采用分裂矢量量化方式将10维的矢量分裂成3个矢量,然后分别对这3个矢量进行矢量量化的分裂矢量量化;首先将10维LSP参数分别分组为LSF1={lsf(1),lsf(2),lsf(3)},LSF2={lsf(4),lsf(5),lsf(6)},和LSF3={lsf(7),lsf(8),lsf(9),lsf(10)};同时对LSF1码本以lsf(3)为基准进行由小到大排序,对LSF3码本以lsf(7)为基准进行由小到大排序;LSF1、LSF2和LSF3三个码本的大小分别为M1、M2和M3;先量化矢量LSF2,在量化LSF1之前,先找到LSF1码本中lsf(3)lsf(4)的码本序号Index1,仅在码本的序号1~Index1间搜索与LSF1最邻近的码字;在量化LSF3之前,先找到LSF3码本中lsf(7)lsf(6)的码本序号Index3,仅在码本的序号Index1~M3场间搜索与LSF3最邻近的码字;对分裂量化得到的矢量进行冗余描述,复制一份描述到描述2,与匹配跟踪中的正弦描述传输分组至编码器描述2码流;
多描述正弦编码器码率为B0(kbps),辅助的参数编码器一和参数编码器二编码码率为B1(kbps)和B2(kbps),三种满足以下关系:
B2=B1B0 (1)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京南大电子智慧型服务机器人研究院有限公司;南京大学;江苏南大电子信息技术股份有限公司;马鞍山艾德声电子技术有限公司,未经南京南大电子智慧型服务机器人研究院有限公司;南京大学;江苏南大电子信息技术股份有限公司;马鞍山艾德声电子技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811342149.2/2.html,转载请声明来源钻瓜专利网。





