[发明专利]用于使用声音质量的估计和控制的源分离的装置和方法在审
| 申请号: | 201980092879.8 | 申请日: | 2019-12-20 |
| 公开(公告)号: | CN113574597A | 公开(公告)日: | 2021-10-29 |
| 发明(设计)人: | 克里斯蒂安·乌勒;马特奥·托尔科利;萨沙·迪史克;约尼·鲍卢斯;于尔根·赫勒;奥利弗·赫尔穆特;哈拉尔德·福斯 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
| 主分类号: | G10L21/0308 | 分类号: | G10L21/0308;G10L25/30;G10L25/60 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋融冰 |
| 地址: | 德国*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 使用 声音 质量 估计 控制 分离 装置 方法 | ||
提供了一种用于从音频输入信号生成分离的音频信号的装置。音频输入信号包括目标音频信号部分和残差音频信号部分。残差音频信号部分指示音频输入信号与目标音频信号部分之间的残差。所述装置包括源分离器(110)、确定模块(120)和信号处理器(130)。源分离器(110)被配置为确定取决于音频输入信号的估计的目标信号,估计的目标信号是仅包括目标音频信号部分的信号的估计。确定模块(120)被配置为根据估计的目标信号的估计声音质量确定一个或多个结果值以获得一个或多个参数值,其中一个或多个参数值是一个或多个结果值、或者取决于一个或多个结果值。信号处理器(130)被配置为根据一个或多个参数值、以及根据估计的目标信号和音频输入信号和估计的残差信号中的至少一个来生成分离的音频信号,估计的残差信号是仅包括残差音频信号部分的信号的估计。
技术领域
本发明涉及音频信号的源分离,尤其涉及分离的输出信号的声音质量的信号自适应控制,以及尤其涉及一种利用声音质量的估计和控制进行源分离的装置和方法。
背景技术
在源分离中,输出信号的质量会下降,并且这种下降会随着干扰信号的衰减而单调增加。
过去已经进行了音频信号的源分离。
音频信号的源分离的目的在于在给定混合信号x(n)的情况下获得的目标信号s(n),
x(n)=s(n)+b(n) (1)
其中b(n)包括所有干扰信号并且在下文中被称为“干扰信号”。分离的输出h(·)是目标信号的估计,
并且可能额外估计干扰信号
这种处理通常会在输出信号中引入伪迹,从而降低声音质量。声音质量的这种下降随着分离量、干扰信号的衰减而单调增加。许多应用不需要完全分离而是部分增强,干扰声音被衰减但仍然存在于输出信号中。
这具有附加的好处,即声音质量高于完全分离的信号,因为引入的伪迹更少,并且干扰信号的泄漏部分掩盖了感知的伪迹。
部分掩蔽音频信号意味着其响度(例如,其感知强度)部分降低。此外可能希望和要求的是,输出的声音质量不会低于定义的声音质量级别,而不是实现大的衰减。
这种应用的例子是对话增强。电视和无线电广播以及电影声音中的音频信号通常是语音信号和背景信号的混合,例如环境声音和音乐。当这些信号混合使得语音的级别与背景的级别相比太低时,听者可能难以理解所说的内容,或者需要非常高的收听努力才能理解,这导致听者疲劳。自动降低背景的级别的方法可用于此类场景,但结果应该是高声音质量。
现有技术中存在各种用于源分离的方法。现有技术中已经讨论了从混合信号中分离目标信号。这些方法可以分为两种方法。第一类方法基于关于信号模型和/或混合模型的公式化假设。信号模型描述了输入信号的特性,这里是s(n)和b(n)。混合模型描述了如何组合输入信号以产生混合信号x(n)的特性,这里是通过加法。
基于这些假设,分析或启发式地设计方法。例如,独立分量分析的方法可以通过假设混合包括两个统计独立的源信号导出,混合已被两个麦克风捕获,并且混合是通过将两个信号相加(产生瞬时混合)来推导出来的。然后混合的逆过程在数学上导出为混合矩阵的求逆,并且根据指定的方法计算此解混合矩阵的元素。大多数分析导出的方法是通过将分离问题公式化为标准的数值优化而导出的,例如真实目标与估计目标之间的均方误差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980092879.8/2.html,转载请声明来源钻瓜专利网。





