[发明专利]用于编码多个音频信号的方法和设备以及用于利用改进的分离解码多个音频信号的混合的方法和设备在审
| 申请号: | 201680028431.6 | 申请日: | 2016-03-10 |
| 公开(公告)号: | CN107636756A | 公开(公告)日: | 2018-01-26 |
| 发明(设计)人: | C.比伦;A.奥泽罗夫;P.佩雷斯 | 申请(专利权)人: | 汤姆逊许可公司 |
| 主分类号: | G10L19/008 | 分类号: | G10L19/008;G10L21/0272 |
| 代理公司: | 北京市柳沈律师事务所11105 | 代理人: | 叶齐峰 |
| 地址: | 法国伊西*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 编码 音频 信号 方法 设备 以及 利用 改进 分离 解码 混合 | ||
技术领域
本发明涉及用于编码多个音频信号的方法和设备以及用于利用改进的多个音频信号的分离解码多个音频信号的混合的方法和设备。
背景技术
音频源分离的问题在于从它们的混合估计各个源(例如,讲话、乐器、噪声等)。在音频的环境下,混合意味着通过单个或者多个麦克风记录多个源。只要关于源的一些信息可用,用于音频信号的通知源分离(informed source separation,ISS)可以被视为从源的混合提取各个音频源的问题。ISS也涉及音频对象(源)的压缩[6],即,编码多源音频,只要在编码和解码两个阶段这些源的混合是已知的。这些问题二者是互通的。他们对于宽范围的应用是重要的。
已知解决方案(例如,[3],[4],[5])依赖于假设在编码阶段期间原始源可用。边信息(Side-information)随着混合一起被计算和传输,并且二者在解码阶段被处理,以恢复源。虽然若干ISS方法是已知的,但是在所有这些方式中,编码阶段比解码阶段更复杂并且在计算上更昂贵。因此,在执行编码的平台不能处理编码器要求的计算复杂度的情况下,这些方式不是优选的。最后,已知的复杂编码器对于在线编码不可用,即,随着信号到达逐步编码该信号,而这对于一些应用很重要。
发明内容
鉴于以上,很期望对于两个ISS问题具有完全自动并且高效的解决方案。具体地,一个解决方案将是期望的,其中,编码器比解码器需要少得多的处理。
本发明提供将多数处理负载从编码器侧转移到解码器侧的简单编码策略。用于生成边信息的提出的简单方式使得不仅低复杂性编码而且解码器处的高效恢复成为可能。最后,与在编码期间需要完全信号是已知的一些现有的高效方法(称为批量编码)相比,提出的编码策略允许在线编码,即,信号随着其到达被逐步编码。
编码器采用来自音频源的具有随机图案的随机样本。在一个实施例中,其是预定义的伪随机图案。采样值由预定义量化器量化,并且作为结果的量化样本被级联并且由熵编码器无损地压缩,以生成边信息。混合也可以在编码侧产生,或者在解码侧通过其他方式已经可用。解码器首先从边信息恢复量化样本,并且然后在给定量化样本和混合的情况下,在概率上估计混合内的最可能的源。
在一个实施例中,本原理涉及权利要求1中公开的用于编码多个音频信号的方法。在一个实施例中,本原理涉及权利要求3中公开的用于解码多个音频信号的混合的方法。
在一个实施例中,本原理涉及编码设备,编码设备包括多个分立硬件组件,一个用于下面描述的编码方法的每个步骤。在一个实施例中,本原理涉及解码设备,解码设备包括多个分立硬件组件,一个用于下面描述的解码方法的每个步骤。在一个实施例中,本原理涉及计算机可读介质,其具有可执行指令,以使得计算机执行包括下面描述的步骤的编码方法。在一个实施例中,本原理涉及计算机可读介质,其具有可执行指令,以使得计算机执行包括下面描述的步骤的解码方法。
在一个实施例中,本原理涉及用于一种分离音频源的编码设备,包括至少一个硬件组件(例如,硬件处理器)和有形体现至少一个软件组件的非瞬时、有形、计算机可读存储介质,并且当在至少一个硬件处理器上执行时,软件组件引起下面描述的编码方法的步骤。在一个实施例中,本原理涉及用于一种分离音频源的编码设备,包括至少一个硬件组件(例如,硬件处理器)和有形体现至少一个软件组件的非瞬时、有形、计算机可读存储介质,并且当在至少一个硬件处理器上执行时,软件组件引起下面描述的解码方法的步骤。
当结合附图考虑下面的描述和所附权利要求时,本原理的另外目的、特征和优点将变得明显。
附图说明
参考附图描述示例性实施例,附图示出
图1包括编码器和解码器的传输和/或存储系统的结构;
图2示例性编码器的简化结构;
图3示例性解码器的简化结构;以及
图4CS-ISS和传统ISS之间的性能比较。
具体实施方式
图1示出包括编码器和解码器的传输和/或存储系统的结构。原始声音源s1、s2、…、sJ被输入到编码器,编码器提供混合x和边信息。解码器使用混合x和边信息以恢复声音,其中,假设一些信息已经损失,因此解码器需要估计声音源,并且提供估计出的声音源
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汤姆逊许可公司,未经汤姆逊许可公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680028431.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汽车遮挡装置
- 下一篇:一种新型防撞公交车内摆门





