[发明专利]一种用于端到端时域声源分离系统的参数化听觉滤波器组在审
申请号: | 202110569382.X | 申请日: | 2021-05-25 |
公开(公告)号: | CN113393850A | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 陈克安;李晗 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L19/26;G10L21/0224;G10L21/0272 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 陈星 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 端到端 时域 声源 分离 系统 参数 听觉 滤波器 | ||
本发明提出了一种用于端到端时域声源分离系统的参数化听觉滤波器组;在端到端时域分离系统中引入了参数化听觉滤波器组,建立了更具听觉合理性的分离模型,提高了网络的分离性能。相比于固定式滤波器组,参数化听觉滤波器组的参数是通过网络训练得到的,具有更好的灵活性,能够根据网络和数据的特性进行自发的调整,以获得更优的分离性能。而相比于自由式滤波器组,参数化听觉滤波器组通过给定Gammatone滤波器的形式,提供给网络听觉系统的先验信息,使得网络能够更好的模拟人耳听觉系统以提高实际场景中网络的分离能力,也使得网络具有更好的可解释性。此外,每个滤波器只有4个参数需要训练,相比所有参数都需要训练的自由式滤波器,其显著降低了网络的参数数量。
技术领域
本发明属于声源分离领域,具体涉及一种用于提高端到端时域声源分离系统性能的参数化听觉滤波器组。
背景技术
在真实声场景中,通常存在多个声源的同时发声,声源分离一直是计算听觉场景分析的重要方面。随着深度学习的飞速发展,声源分离系统已取得突破性进展。如图1所示,现阶段大多数端到端时域声源分离系统都遵循编码器-分离器-解码器的框架。编码器将时域混合声转换为中间表达,分离器用来估计声源的加权函数(掩模),然后将掩模和混合声源的中间表达相乘并通过解码器获得分离后的声源。
编码器是指对时域信号进行卷积的一组滤波器,可以是固定的(本发明中称为固定式滤波器组),例如短时傅立叶变换(STFT),恒定Q变换或具有固定值的听觉滤波器组。另一方面,滤波器组也可以是一组具有任意初始化值的一维卷积层,其参数在网络训练过程中自发学习得到,在本发明中称为自由式滤波器组。
固定式滤波器组具有直观的解释,包含先验知识,不易引起网络的过度拟合,但性能难以提高。相反,自由式滤波器组具有高自由度,性能通常更优,但在训练中容易受到含噪数据影响。
发明内容
要解决的技术问题
本发明主要针对现有声源分离系统中编码器采用固定式滤波器组性能难以提高,而自由式滤波器组训练中容易受到含噪数据影响的问题,在灵活性和先验信息之间折衷,提出了一种用于端到端时域声源分离系统的参数化听觉滤波器组,通过对编码器的改进来提升网络的分离性能。
人耳在听觉场景分析中的出色表现启发我们将具有生理和心理声学合理性的听觉滤波器组引入到声源分离系统中。对于听觉模型,耳蜗的频谱分析通常由Gammatone滤波器组进行模拟。本发明中提出的参数化听觉滤波器组是指一组具有Gammatone函数形式,且其参数是通过网络学习得到的,其相比固定式滤波器组具有更好的分离性能,而相比自由式滤波器组具有更好的听觉合理性和可解释性。
本发明的技术方案为:
所述一种用于端到端时域声源分离系统的参数化听觉滤波器组,采用Gammatone滤波器,滤波器的数量N不小于32;滤波器时域脉冲响应由Gamma分布调制的纯音:
g(t)=Atp-1e-2πbtcos(2πfct+φ)
其中p为阶数,fc为中心频率,b为带宽,φ为相位,A为幅度,通过阶数p与带宽b确定。
进一步的,幅度取值为
利用参数化听觉滤波器组构建端到端时域声源分离系统的方法为:
步骤1:依据编码器-分离器-解码器的框架创建时域分离网络;其中编码器通过一维卷积层实现,其滤波器组的形式采用参数化听觉滤波器组;分离器用于估计声源的掩模;解码器为一维反卷积层;来自分离器的每个声源的掩模估计值与来自编码器的混合声的二维表达相乘,之后能够通过解码器合成分离声源的时域信号;
步骤2:根据人耳听觉系统的先验知识对各个滤波器的参数集进行初始化,参数化听觉滤波器组中的参数集在网络训练过程中可变:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110569382.X/2.html,转载请声明来源钻瓜专利网。