[发明专利]音频信号处理方法、装置、电子设备及存储介质有效
申请号: | 202010001636.3 | 申请日: | 2020-01-02 |
公开(公告)号: | CN111179961B | 公开(公告)日: | 2022-10-25 |
发明(设计)人: | 王珺;林永业 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/0308;G10L21/0208;G10L15/26;G10L17/00 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 信号 处理 方法 装置 电子设备 存储 介质 | ||
本申请公开了一种音频信号处理方法、装置、电子设备及存储介质,属于信号处理技术领域。本申请通过将混合音频信号输入编码网络,通过编码网络对该混合音频信号进行嵌入处理,得到混合音频信号的嵌入特征,将嵌入特征输入萃取网络,通过萃取网络对嵌入特征进行泛化特征提取,能够提取得到混合音频信号中目标分量的泛化特征,基于该目标分量的泛化特征进行音频信号处理,由于目标分量的泛化特征具有较好的泛化能力和表达能力,能够良好地适用于不同的场景,因此提升了音频信号处理过程的鲁棒性和泛化性,提升了音频信号处理的准确性。
技术领域
本申请涉及信号处理技术领域,特别涉及一种音频信号处理方法、装置、电子设备及存储介质。
背景技术
在信号处理领域中,“鸡尾酒会问题”是一个热门研究课题:在给定混合音频信号(说话人为两人或两人以上)的情况下,如何分离出鸡尾酒会中同时说话的每个人的独立音频信号?针对上述鸡尾酒会问题的解决方案称为语音分离技术。目前,通常是基于有监督学习的深度模型来进行语音分离,例如,基于有监督学习的深度模型包括DPCL(DeepClustering,深度聚类网络)、DANet(Deep Attractor Network,深度吸引子网络)、ADANet(Anchored Deep Attractor Network,锚定深度吸引子网络)、ODANet(Online DeepAttractor Network,在线深度吸引子网络)等。
在上述过程中,有监督学习是指在获取标注后的训练数据之后,针对某一类特定场景训练出在对应场景下进行语音分离的深度模型,在实际应用中针对训练时没有标注过的音频信号,基于有监督学习的深度模型的鲁棒性和泛化性较差,导致在训练场景以外的情况下,基于有监督学习的深度模型在进行音频信号处理时准确性较差。
发明内容
本申请实施例提供了一种音频信号处理方法、装置、电子设备及存储介质,能够提升音频信号处理过程的准确性。该技术方案如下:
一方面,提供了一种音频信号处理方法,该方法包括:
将混合音频信号输入编码网络,通过所述编码网络对所述混合音频信号进行嵌入处理,得到所述混合音频信号的嵌入特征;
将所述嵌入特征输入萃取网络,通过所述萃取网络对所述嵌入特征进行泛化特征提取,得到所述混合音频信号中目标分量的泛化特征,所述目标分量对应于所述混合音频信号中目标对象的音频信号;
基于所述目标分量的泛化特征进行音频信号处理。
在一种可能实施方式中,所述通过所述编码网络对所述混合音频信号进行嵌入处理,得到所述混合音频信号的嵌入特征包括:
通过所述编码网络将所述混合音频信号映射至嵌入空间,得到所述嵌入特征。
在一种可能实施方式中,所述萃取网络为自回归模型,所述将所述嵌入特征输入萃取网络,通过所述萃取网络对所述嵌入特征进行泛化特征提取,得到所述混合音频信号中目标分量的泛化特征包括:
将所述嵌入特征输入所述自回归模型,通过所述自回归模型对所述嵌入特征进行递归加权处理,得到所述目标分量的泛化特征。
在一种可能实施方式中,所述方法还包括:
基于未标注的样本混合信号,对教师模型和学生模型进行协同迭代训练,得到所述编码网络以及所述萃取网络,其中,所述学生模型包括第一编码网络和第一萃取网络,所述教师模型包括第二编码网络和第二萃取网络,所述第一编码网络的输出作为所述第一萃取网络的输入,所述第二编码网络的输出作为所述第二萃取网络的输入,每次迭代过程中的教师模型由上一次迭代过程的教师模型以及本次迭代过程的学生模型进行加权所得。
在一种可能实施方式中,所述基于未标注的样本混合信号,对教师模型和学生模型进行协同迭代训练,得到所述编码网络以及所述萃取网络包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010001636.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种水性分散剂及制备方法和应用
- 下一篇:一种监督用户坐姿的方法及设备