[发明专利]语音编码器中的相位量化在审
申请号: | 201980082842.7 | 申请日: | 2019-12-10 |
公开(公告)号: | CN113196388A | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | S·S·詹森;S·斯里尼瓦桑;K·B·福斯 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G10L19/032 | 分类号: | G10L19/032;G10L19/26;G10L19/08;G10L21/038;G10L19/02;G10L19/125;G10L25/69 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 刘文灿 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 编码器 中的 相位 量化 | ||
描述了语音编码期间的相位量化和语音解码期间的相位重构的创新。例如,为了对相位值集合进行编码,语音编码器会忽略高频相位值和/或将至少一些相位值表示为基函数的加权和。或者,作为另一个示例,为了对相位值集合进行解码,语音解码器使用基函数的加权和来重构至少一些相位值和/或重构低频相位值,然后使用至少一些低频相位值来合成高频相位值。在许多情况下,即使在带宽不足或有传输质量问题的网络上传输编码数据时,这些创新也可以改善低比特率场景下语音编解码器的性能。
背景技术
随着数字无线电话网络、互联网上语音流式传输和互联网电话的出现,语音的数字处理已变得司空见惯。工程师使用压缩来高效处理语音,同时仍保持质量。语音压缩的一个目标是以一种针对给定数量的比特提供最大信号质量的方式表示语音信号。换句话说,该目标是,对于给定的质量水平,用最少的比特表示语音信号。在一些场景中,还可以应用其他目标,例如对传输错误的弹性以及限制由于编码/传输/解码导致的整体延迟。
一种类型的常规语音编码器/解码器(“编解码器”)使用线性预测(“LP”)来实现压缩。语音编码器针对预测滤波器找到并量化LP系数,所述LP系数用于将样本值预测为先前样本值的线性组合。残差信号(也称为“激励”信号)指示原始信号的未通过滤波准确预测的部分。由于不同种类的语音具有不同的特性,因此语音编码器通常对浊音段(通过声带振动表征)、清音段和无声段使用不同的压缩技术来压缩残差信号。对应的语音解码器重构残差信号,恢复在合成滤波器中使用的LP系数,并用合成滤波器处理残差信号。
考虑到压缩对在计算机系统中表示语音的重要性,语音压缩吸引了大量的研究和开发活动。尽管以前的语音编解码器在许多情况下都提供良好的性能,但是它们也有一些缺点。特别是,在非常低的比特率情况下使用以前的语音编解码器时,可能会出现问题。在这样的情况下,无线电话网络或其他网络可能没有足够的带宽(例如,由于拥塞或分组丢失)或者可能有传输质量问题(例如,由于传输噪声或间歇性延迟),这阻止了在适用于实时通信的质量约束和时间约束下的编码语音的递送。
发明内容
总之,详细描述提出了语音编码和语音解码方面的创新。一些创新涉及语音编码期间的相位量化。其他创新涉及语音解码期间的相位重构。在许多情况下,即使在带宽不足或有传输质量问题的网络上传输编码数据时,这些创新也可以提高低比特率场景中语音编解码器的性能。
根据本文中描述的第一组创新,语音编码器接收语音输入(例如,在输入缓冲器中),对语音输入进行编码以产生编码数据,并将编码数据存储(例如,在输出缓冲器中)以作为比特流的一部分输出。作为编码的一部分,语音编码器会根据线性预测(“LP”)系数对基于语音输入的输入值进行滤波,从而产生残差值。语音编码器对残差值进行编码。特别地,语音编码器确定相位值集合并对相位值集合进行编码。例如,可以通过以下方式来确定相位值:对当前帧的子帧应用频率变换,这会产生子帧的复幅度值,并基于复幅度值计算相位值(以及对应的幅度值)。为了提高性能,语音编码器在对相位值集合进行编码时可以执行各种操作。
例如,当语音编码器对相位值集合进行编码时,语音编码器使用基函数(例如,正弦函数)的加权和以及线性分量,来表示相位值集合中的至少一些相位值。语音编码器可以使用延迟决策方法或其他方法来确定对基函数加权的系数集合。系数的计数可以不同,具体取决于编码数据的目标比特率和/或其他标准。当找到合适的系数时,语音编码器可以使用基于线性相位度量的成本函数或其他成本函数,从而基函数的加权和与线性分量一起类似于所表示的相位值。语音编码器可以使用偏移值和斜率值对线性分量进行参数化,然后将其与加权和相结合。使用基函数的加权和以及线性分量,语音编码器可以以紧凑而灵活的方式准确表示相位值,这可以改善低比特率场景下的速率失真性能(即,对于给定比特率提供更好的质量,或等效地,针对给定的质量水平提供较低的比特率)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980082842.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于车辆车轮的轮胎
- 下一篇:具有前侧光控膜的液晶显示器