[发明专利]用于处理音频数据的系统和方法在审

申请号：	201880033464.9	申请日：	2018-03-08
公开（公告）号：	CN110678923A	公开（公告）日：	2020-01-10
发明（设计）人：	J·D·约翰斯顿;S·D·怀特;K·W·奥尔;B·M·基诺瓦	申请（专利权）人：	易默森网络公司
主分类号：	G10L19/00	分类号：	G10L19/00;G10L19/008;G10L19/032;G10L19/025;G10L19/16;H04B3/20;H04B3/21;H04L29/06;G10L19/02
代理公司：	11713 北京世峰知识产权代理有限公司	代理人：	卓霖;许向彤
地址：	美国华***	国省代码：	美国;US
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	数字分量误差信号量化可操作地音频信号编码器回声量化比例因子近似信号频率分量脉冲编码调制可能性确定解码比例因子处理延迟高分辨率频带分量比特流采样滤波转换
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

一种编码器，可操作地将音频信号滤波到多个频带分量中，为每个带生成量化数字分量，在生成的量化数字分量中识别预回声事件的可能性，通过使用逆脉冲编码调制对量化数字分量进行解码来生成近似信号，通过将近似信号与采样的音频信号进行比较来产生误差信号，并对误差信号和量化数字分量进行处理。该编码器可操作地通过处理延迟的音频信号和Q带值来处理误差信号，根据Q带值确定预回声事件的可能性，并为预回声事件的可能性确定比例因子和MDCT块大小。该编码器可操作地使用MDCT块大小将误差信号转换为高分辨率频率分量，量化比例因子和频率分量，并对量化后的行、块大小和量化比例因子进行编码以将其包含在比特流中。

技术领域

本公开一般涉及编解码器和数字数据格式，尤其涉及编码和解码数字音频的混合形式。

背景技术

随着基于IP的多媒体作为传统广播服务的替代品的使用变得更加突出，应用程序需要更加有活力、稳健和高质量。例如，对数字音频进行编码以进行传输或存储可能会引入不需要的伪像，对这些伪像进行解码和渲染时会影响声音质量。一种示例性伪像称为预回声。预回声是音频编解码器伪像，在解码信号中，可以在实际声音之前听到声音的回声。预回声可由量化和其他不精确性引起，这些不精确性在从时域转换到频域然后再转换回时域时发生，例如使用MDCT将时域信号转换为频域，然后使用逆MDCT将其转换回时域。这种效果是由于错误在变换块大小上的扩散，导致音频内容的前导和尾随回声。这种效果在带有尖锐脉冲和瞬态信号的音频(例如打击乐器，如响板)中尤其明显。现有的编解码器技术无法以期望的比特率有效地控制或消除这些伪像。此外，媒体分发已经开始从传统的网络广播服务(即专用、受控且昂贵的)转变为基于IP网络的分发，这种分发并非专用、受控且昂贵的，而是分布式的、有活力的、较便宜的，并且不需要固定比特率。然而，由于分布式网络固有的延迟和服务质量问题，流媒体服务还没有完全发展。但是，随着流媒体服务的发展，内容的分发和管理方式也需要发展。

发明内容

本文中的技术提供了一种计算机实现的系统和方法，通过如下方式对采样的音频信号进行编码：对采样的音频信号进行编码和解码、识别编码的音频样本中的潜在预回声事件、从采样的音频信号和解码的样本音频信号生成误差信号、并对在将潜在的预回声事件和误差信号与编码的样本音频信号处理成比特流的过程中生成的数据进行编码，以便在下游解码时可以重新创建误差信号并移除潜在的预回声事件。

在一方面，提供了用于处理音频数据的编码器。编码器包括计算机可用的非暂时存储资源和一个或多个通信地耦合到存储资源的处理器，其中处理器被配置为执行存储在存储资源中的应用程序代码指令。编码器可以将采样的音频信号滤波成多个频带分量，并通过对频带分量进行脉冲编码调制，为多个频带中的每个频带生成量化数字分量。编码器可以识别和标记所生成的量化数字分量内的预回声事件的可能性，并且通过使用逆脉冲编码调制对量化数字分量解码来进一步生成滤波音频样本的近似信号。然后，编码器可以通过将近似信号与采样的音频信号进行比较来产生误差信号，并对误差信号和量化数字分量进行处理。

在另一方面，编码器通过如下方式来处理误差信号和量化数字分量：处理延迟的音频信号和量化数字分量的Q带值、根据Q带值确定预回声事件的可能性、并使用延迟的音频信号和Q带值为误差信号确定比例因子和MDCT块大小。MDCT块大小是根据Q带值的大小和包含Q带值的波段来确定的。根据MDCT块大小和延迟的音频信号确定比例因子。利用MDCT块的大小可以将误差信号转换成更高分辨率的频率分量。对比例因子和频率分量进行量化，并且对量化后的行、块大小和量化比例因子进行编码以包含在比特流中。

在另一方面，编码器可以通过使用至少一个伪正交镜像滤波器(PQMF)将音频采样滤波到多个频带分量中来过滤采样的音频信号。编码器可以通过使用脉冲编码调制技术将多个频带分量调制成多个量化频带值来生成量化数字分量。编码器可以使用逆脉冲编码调制技术和至少一个逆伪正交镜像滤波器(IPQMF)将多个量化带值解码为近似信号。编码器可以检测多个量化频带值中与音频方位数据相邻的预回声事件。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于易默森网络公司，未经易默森网络公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201880033464.9/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于处理音频数据的系统和方法在审

专利文献下载