[发明专利]一种基于卷积循环神经网络的主动噪声控制系统及方法在审
申请号: | 202310248622.5 | 申请日: | 2023-03-14 |
公开(公告)号: | CN116246606A | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 张军;吴泳琳;宁更新;冯义志;余华;陈芳炯;温淼文;季飞 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10K11/178 | 分类号: | G10K11/178;G10L21/0216;G10L25/30 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 黄卫萍 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 循环 神经网络 主动 噪声 控制系统 方法 | ||
本发明公开了一种基于卷积循环神经网络的主动噪声控制系统及方法,该系统由预处理模块、卷积循环神经网络、信号重构模块、网络损失模块组成。其中,预处理模块用于对参考信号、声音信号进行预处理并提取相应特征;卷积循环神经网络由2个卷积模块、循环神经网络、2个反卷积模块组成,同时采用参考信号特征和声音信号特征作为网络输入,用于预测消除信号特征;信号重构模块用于将频域的消除信号特征重构为时域的消除信号,通过扬声器播放消除信号达到噪声控制的目的;网络损失模块由心理声学模型、损失计算模块组成,通过心理声学模型获得掩蔽阈值,统计网络总损失,其梯度反向传播后用于更新网络模块的权重。
技术领域
本发明涉及语音处理技术领域,具体涉及一种基于卷积循环神经网络的主动噪声控制系统及方法。
背景技术
声音是一种重要的信息交换方式,然而各类环境噪声的存在却使得声音信息的传递过程受到干扰,从而使得交流效率下降。因此,人们尝试对噪声进行控制,其中一种控制方式就是主动噪声控制(Active Noise Control,ANC)。主动噪声控制,又称有源噪声控制,通过引入次级声源,即与环境噪声幅度相同、相位相反的声波达到抵消环境噪声的目的。ANC系统一般分为前馈式、反馈式以及混合式,前馈式系统对噪声的抑制效果明显,复杂度低,是实际中最常采用的系统。前馈式ANC系统中通常包含有参考麦克风、误差麦克风以及扬声器。参考麦克风用于采集环境噪声,也就是参考信号;误差麦克风通常设置在使用者双耳附近,用于采集误差信号,一方面该信号反映了使用者的听感,另一方面也是自适应滤波器调整的根据;扬声器主要用于播放消除信号。由于参考麦克风、误差麦克风、扬声器之间通常有一定距离,在ANC处理中仍需考虑声音传播的影响。参考麦克风和误差麦克风之间的传播路径称为主要路径,而扬声器和误差麦克风之间的称为次要路径。在实际应用中,扬声器内部电子元件会带来非线性效应,使得线性算法对次要路径的估计不准确,令消除信号的计算出现偏差,影响了噪声控制的效果。学界针对非线性效应的问题提出了采用Volterra级数、对次要路径的非线性系数进行估计、采用神经网络作为滤波器等方法,在不考虑音频播放的场景下均有较好的噪声消除效果。
在实际使用中,扬声器除了播放消除信号以外,常常还同时播放声音信号,例如主动降噪耳机、助听器等。扬声器同时播放声音信号和消除信号的系统称为音频集成主动噪声控制(Audio Integrated Active Noise Control,AIANC)系统。对于AIANC系统,通常的做法是采用ANC算法,但是自适应算法的误差信号用估计误差信号替代。估计误差信号是通过对误差信号加上经过次要路径的声音信号得到。对于线性的AIANC系统,只要次要路径估计准确,声音的干扰就能干净地从误差信号中排除。但当AIANC系统中存在非线性问题时,单纯的加性补偿无法获得排除声音信号的干扰,估计误差信号中包含了残余的声音,导致自适应滤波的过程对声音造成损伤,听感变差。另一方面,AIANC系统应当同时保证降噪的效果和声音质量,而迁移的ANC算法仅仅考虑的噪声消除的效果,不符合实际使用需求。针对保证声音质量的需求,学界中提出引入自动增益控制器、心理声学模型这两种做法以提升声音质量,但这两种方法的研究目前仍未涉及非线性问题,并且没有对处理后的声音完整性进行评估。
综上所述,目前关于AIANC系统的研究仍存在以下不足:
(1)较少考虑非线性效应对次要路径建模的影响;
(2)仅考虑了AIANC方法处理后的噪声消除效果,忽略了保证声音质量的需求,容易造成声音的失真。
发明内容
本发明的目的是针对现有AIANC系统中主动噪声控制方法的不足,提供一种基于卷积循环神经网络(Convolutional Recurrent Neural Network,CRN)的主动噪声控制系统及方法。该系统及方法针对目前非线性AIANC系统存在的次要路径估计不准、声音信号失真严重的问题,提供了一种改进的卷积循环神经网络模型,能够在考虑非线性影响的同时有效地保留声音信号,既能对噪声进行消除又能显著提高语音质量。本发明可以应用于工厂车间、车辆内部、免提通话等场合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310248622.5/2.html,转载请声明来源钻瓜专利网。