[发明专利]音频源分离有效

申请号：	201780028007.6	申请日：	2017-04-06
公开（公告）号：	CN109074811B	公开（公告）日：	2023-05-02
发明（设计）人：	王珺;芦烈;宾清原	申请（专利权）人：	杜比实验室特许公司
主分类号：	G10L19/008	分类号：	G10L19/008;G10L21/0272
代理公司：	北京律盟知识产权代理有限责任公司 11287	代理人：	陈甜甜
地址：	美国加利***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	音频分离
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本文献描述一种用于从音频信道(302)提取音频源(301)的方法(100)。所述方法(100)包含基于来自源矩阵的混合矩阵并基于所述音频源(301)的幂矩阵更新(102)维纳滤波器矩阵。此外，所述方法(100)包含基于所述经更新维纳滤波器矩阵并基于所述音频信道(302)的自协方差矩阵来更新(103)所述音频信道(302)及所述音频源(301)的互协方差矩阵及所述音频信道(301)的自协方差矩阵。另外，所述方法(100)包含基于所述音频信道(302)及所述音频源(301)的所述经更新互协方差矩阵及/或基于所述音频源(301)的所述经更新自协方差矩阵来更新(104)所述混合矩阵及所述幂矩阵。

技术领域

本文献涉及一或多个音频源与多信道音频信号的分离。

背景技术

音频信号的混合，特别是例如立体声，5.1或7.1音频信号的多信道音频信号，通常通过在演播室中混合不同的音频源来创建，或通过在真实环境中同时记录声学信号来产生。多信道音频信号的不同音频信道可被描述为多个音频源的不同总和。源分离的任务是识别导致不同音频信道的混合参数，并且可能反转混合参数以获得基础音频源的估计。

当没有关于多信道音频信号中涉及的音频源的先验信息可用时，源分离的过程可被称为盲源分离(BSS)。在空间音频捕获的情况下，BSS包含以下步骤：将多信道音频信号分解成不同的源信号，并提供关于音频源的起始位置与一或多个接收麦克风之间的混合参数、空间位置及/或声学信道响应的信息。

盲源分离及/或知情源分离的问题在各种不同的应用领域中是相关的，例如具有多个麦克风的语音增强，多信道通信中的串扰消除，多径信道识别及均衡，传感器阵列中的到达方向(DOA)估计，对用于音频及被动声纳的波束形成麦克风的改进，电影音频向上混合及重新创作，音乐重新创作，转录及/或基于对象的编码。

实时在线处理针对许多上述应用通常是重要的，例如用于通信及用于重新创作的应用等。因此，所属领域需要一种用于实时分离音频源的解决方案，这提出关于针对源分离系统的低系统延迟及低分析延迟的要求。低系统延迟要求系统支持循序实时处理(剪辑入/剪辑出)，而不需要大量的先行数据。低分析延迟要求算法的复杂性足够低以允许在给定实际计算资源的情况下进行实时处理。

本文献解决提供针对源分离的实时方法的技术问题。应注意，本文献中描述的方法适用于盲源分离，以及半监督或监督源分离，其中关于源及/或关于噪声的信息是可用的。

发明内容

根据方面，描述一种用于从I个音频信道提取J个音频源的方法，其中I，J1。音频信道可例如由麦克风捕获，或可对应于多信道音频信号的信道。音频信道包含多个剪辑，每一剪辑包含N个帧，其中N1。换句话说，音频信道可被细分为剪辑，其中每一剪辑包含多个帧。音频信道的帧通常对应于音频信号的摘录(例如，对应于20ms的摘录)，并且通常包含样本序列。

I个音频信道可表示为频域中的信道矩阵，并且J个音频源可表示为频域中的源矩阵。特定来说，可使用时域到频域变换(例如短期傅立叶变换)将音频信道从时域变换为频域。

所述方法包含(针对当前剪辑的帧n，针对至少一个频率仓f，并且针对当前迭代)基于混合矩阵并且基于J个音频源的幂矩阵更新维纳滤波器矩阵，所述混合矩阵适于提供来自源矩阵的信道矩阵的估计，所述J个音频源的幂矩阵指示J个音频源的频谱幂。特定来说，所述方法可针对确定针对当前剪辑的所有帧n以及针对所有频率仓f或针对频域的所有频带的维纳滤波器矩阵。针对每一帧n及针对每一频率仓f或频带意味着针对每一时间-频率块，可使用具有多个迭代的迭代过程来确定维纳滤波器矩阵，借此迭代地细化维纳滤波器矩阵的精度。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司，未经杜比实验室特许公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201780028007.6/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]音频源分离有效

专利文献下载