[发明专利]一种基于深度学习的声反馈的抑制方法及系统有效
申请号: | 202210408816.2 | 申请日: | 2022-04-19 |
公开(公告)号: | CN116233697B | 公开(公告)日: | 2023-09-05 |
发明(设计)人: | 郑成诗;王梅煌;柯雨璇;李晓东 | 申请(专利权)人: | 中国科学院声学研究所 |
主分类号: | H04R3/02 | 分类号: | H04R3/02;G06N3/0464;G06N3/0442;G06N3/045;G06N3/08 |
代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 陈琳琳;武玥 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 反馈 抑制 方法 系统 | ||
1.一种基于深度学习的声反馈的抑制方法,用于抑制扩声系统中的声反馈,包括以下步骤:
步骤1)采集闭环扩声系统中的原始真实声音信号,并基于傅里叶变换,获得真实声音张量矩阵;
步骤2)将真实声音张量矩阵输入至预先训练好的第一深度学习网络模型中,通过训练好的第一深度学习网络模型提取真实声音张量矩阵中的特征向量,并基于所述特征向量进行声反馈抑制;其中,所述第一深度学习网络模型通过开环数据集进行训练;
步骤3)将所述声反馈抑制后的真实张量矩阵进行傅里叶逆变换,获得声反馈抑制后的声音信号并将其输入至闭环的扩声系统中,所述闭环的扩声系统为存在反馈通路的扩声系统;
所述开环数据集的构造过程包括:
在开环的所述扩声系统中,获取n个采样时刻的测试语音和音频信号,在每条所述测试语音和音频信号上随机叠加1至N个频率在[fL,fH]Hz的单频信号,以获得n个模拟啸叫混合信号z(n),并将其构造成所述开环数据集;其中,所述开环的扩声系统为没有反馈通路的扩声系统;
所述模拟啸叫混合信号z(n)为:
其中,fL为所述扩声系统中信号的低频下限,fH为所述扩声系统中信号的频率上限,fs为采样率,s(n)为所述语音和音频信号,M为1至N之间的随机整数,di(n)为叠加的第i个所述单频信号;其中,
叠加的第i个所述单频信号di(n)采用下式生成:
其中,αi(n)为第i个所述单频信号的幅度值,fi为第i个所述单频信号的频率值,为第i个所述单频信号的相位值;并且,具有不同频率值fi的所述单频信号具有不同的幅度值αi(n);
所述第一深度学习网络模型的训练过程包括:
将每条所述模拟啸叫混合信号z(n)进行傅里叶变换,以获得对应的模拟啸叫混合张量;将所述测试语音和音频信号进行相同形式的傅里叶变换,以获得映射目标张量;
在开环扩声系统中,所述第一深度学习网络模型将所述映射目标张量作为学习目标,利用模拟啸叫混合张量和映射目标张量进行训练,以提取模拟啸叫特征向量并获得声反馈抑制后的模拟啸叫混合张量;
将所述声反馈抑制后的模拟啸叫混合张量作为下次训练的模拟啸叫混合张量,并重新训练,直至所述声反馈抑制后的模拟啸叫混合张量与所述模拟啸叫混合张量之间的误差收敛至预设的范围,获得所述训练好的第一深度学习网络模型以及所述训练好的第一深度学习网络模型的参数集合;并将最后一次训练中提取的模拟啸叫特征向量作为特征向量。
2.根据权利要求1所述的基于深度学习的声反馈的抑制方法,其特征在于,所述第i个单频信号的幅度值αi(n)随着采样时刻n变化或者为恒定值;所述单频信号的个数N的取值为10。
3.根据权利要求1所述的基于深度学习的声反馈的抑制方法,其特征在于,步骤3)之前还包括:将所述训练好的第一深度学习网络模型进行声反馈抑制后的真实声音张量矩阵输入至预先训练好的第二深度学习网络模型,通过所述训练好的第二深度学习网络模型提取其中的优化特征向量,并基于优化特征向量进行声反馈抑制,以优化的所述声反馈抑制后的真实张量矩阵。
4.根据权利要求3所述的基于深度学习的声反馈的抑制方法,其特征在于,所述第二深度学习网络模型的训练过程包括:
在开环扩声系统中,将所述第一深度学习网络模型输出的声反馈抑制后的模拟啸叫混合张量作为输入张量,输入至所述第二深度学习网络模型中;
所述第二深度学习网络模型,以所述映射目标张量作为学习目标,利用所述输入张量进行训练,以提取特征向量并获得优化的声反馈抑制后的模拟啸叫混合张量;
将所述优化的声反馈抑制后的模拟啸叫混合张量作为下次训练的输入张量,并重新训练,直至所述优化的声反馈抑制后的模拟啸叫混合张量与所述输入张量之间的误差收敛至预设的范围,获得所述训练好的第二深度学习网络模型以及所述训练好的第二深度学习网络模型的参数集合;并将最后一次训练中提取的特征向量作为优化特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210408816.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:移动性更新的方法、终端及网络侧设备
- 下一篇:摄影模块与电子装置