[发明专利]混响环境的源分离有效
申请号: | 201780052977.X | 申请日: | 2017-08-28 |
公开(公告)号: | CN109644304B | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 王珺 | 申请(专利权)人: | 杜比实验室特许公司 |
主分类号: | H04R3/00 | 分类号: | H04R3/00;G10L21/028;H03H21/00;G10L25/18;G10L25/21;G10L25/06 |
代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 陈甜甜 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 混响 环境 分离 | ||
本发明揭示混响环境的源分离的实施例。根据方法,分别通过至少两个麦克风针对其间仅至少一个源中的个别者产生声音的时段捕获针对每一所述个别者的第一麦克风信号。通过处理器基于所述第一麦克风信号学习用于对所述至少一个源与所述至少两个麦克风之间的声路建模的混合参数。分别通过所述至少两个麦克风针对其间所述至少一个源中的全部产生声音的时段捕获第二麦克风信号。通过所述处理器基于所述混合参数及第二麦克风信号估计所述重建模型。所述处理器通过应用所述重建模型而执行所述源分离。
技术领域
本文中揭示的实例实施例涉及音频信号处理。更具体来说,实例实施例涉及从在混响环境中捕获的音频混合物的源分离。
背景技术
以多声道格式(例如,立体声、波束形成、5.1、7.1及类似者)呈现的混合音频信号是通过在演播室中混合不同音频源来创建,或从真实环境中的各种音频源的多个录音产生。源分离可用于广泛范围的音频处理应用。例如,当使用一或多个麦克风录制听觉场景时,优选地分离声源相依信息以用于各种后续音频处理任务。此类应用的实例包含重新混合/重新创作应用、空间音频编码、3D声音分析及合成,以及在扩展回放环境(而非原始的混合音频信号)中呈现源。其它应用需要源参数以实现源特定分析及后处理,例如音调校正、时间扭曲、声音效果、增强、衰减或调平某些源。
源分离包括在给定混合信号的情况下恢复源信号或其空间图像。大多数现有方法经由短时傅立叶(Fourier)变换(STFT)将信号变换到时频域,并通过复值混合矩阵或空间协方差矩阵近似表示每一频段中的混合过程。接着通过估计全部频段中的混合矩阵或空间协方差并导出源STFT系数来实现源分离。恢复源信号的实例方法是通过估计混合矩阵且随后导出源STFT系数,如A.奥泽洛夫(A.Ozerov)、C.菲沃特(C.Fevotte)的“用于音频源分离的卷积混合物中的多声道非负矩阵分解(Multichannel Nonnegative MatrixFactorization in Convolutive Mixtures for Audio Source Separation)”,IEEETrans ASLP,第18卷,第3号,2010年中描述,所述案的内容的全文以引用的方式并入本文中(此后称为“参考案1”)。恢复源的空间图像的另一实例方法是通过估计空间协方差并导出源STFT系数,如越Q.K.棠(Ngoc Q.K.Duong)、E.文森特(E.Vincent)、R.格力博瓦特(R.Gribonvoal)的“欠定混响音频源分离的空间协方差模型(Spatial Covariance Modelsfor Under-determined Reverberant Audio Source Separation)”,关于信号处理在音频及声学中的应用的IEEE研讨会,2009年中描述,所述案的内容的全文以引用的方式并入本文中(此后称为“参考案2”)。
发明内容
本文中揭示的实例实施例描述一种产生用于源分离的重建模型的方法。根据所述方法,通过处理器基于第一麦克风信号学习用于对至少一个源与至少两个麦克风之间的声路建模的混合参数。假定针对所述至少一个源中的每一个别者的所述第一麦克风信号分别由所述至少两个麦克风针对其间仅所述个别者产生声音的时段捕获。通过所述处理器基于所述混合参数及第二麦克风信号估计所述重建模型。假定所述第二麦克风信号分别由所述至少两个麦克风针对其间所述至少一个源中的全部产生声音的时段捕获。
本文中揭示的实例实施例还描述一种用于源分离的方法。根据所述方法,分别通过至少两个麦克风针对其间仅至少一个源中的个别者产生声音的时段捕获针对每一所述个别者的第一麦克风信号。通过处理器基于所述第一麦克风信号学习用于对至少一个源与所述至少两个麦克风之间的声路建模的混合参数。分别通过所述至少两个麦克风针对其间所述至少一个源中的全部产生声音的时段捕获第二麦克风信号。通过所述处理器基于所述混合参数及第二麦克风信号估计所述重建模型。所述处理器通过应用所述重建模型而执行所述源分离。
下文参考附图详细描述本文中揭示的实例实施例的进一步特征及优点以及实例实施例的结构及操作。应注意,本文中仅为了说明性目的呈现实例实施例。(若干)相关领域的技术人员基于本文中含有的教示将明白额外实施例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司,未经杜比实验室特许公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780052977.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:对发声体作出动作的机器人
- 下一篇:用于管理信号路径中的失真的设备和方法