[发明专利]一种音频信号处理方法、装置及存储介质有效
申请号: | 202110263948.6 | 申请日: | 2021-03-11 |
公开(公告)号: | CN112687276B | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 马路;杨嵩 | 申请(专利权)人: | 北京世纪好未来教育科技有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L21/0208;G10L25/27 |
代理公司: | 北京开阳星知识产权代理有限公司 11710 | 代理人: | 安伟 |
地址: | 100089 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 信号 处理 方法 装置 存储 介质 | ||
本公开涉及一种音频信号处理方法、装置及存储介质,本公开通过获取第一参考音频信号和待处理的混合音频信号,其中混合音频信号包括回声信号和目标音频信号,根据待处理的混合音频信号和第一参考音频信号,利用预先训练好的深度聚类网络模型、声纹识别网络模型和多头注意力机制模型进行回声信号消除,得到目标音频信号,能够消除复杂环境中混合音频中的回声并有效的抑制残余回声,提高音频质量和音频处理的性能,增加用户体验。
技术领域
本公开涉及计算机应用技术领域,尤其涉及一种音频信号处理方法、装置及存储介质。
背景技术
回声消除最早应用在音频通话系统中,在通话的两端,一端的声音经过线路传到另一端,并通过另一端的扬声器播放出去,另一端的麦克风会接收扬声器播放的声音,与此同时由于房间内的地板、墙壁、其他物体的定向和反射,麦克风除了接收到扬声器播放的直达声之外还会接收到各种反射声,这种混合声音会传回给说话的那一端,存在回声问题。回声的存在会干扰人们的谈话,降低音频的质量,通话效果较差。而在智能语音设备中,设备自身播放的音频会被自身的麦克风接收,也存在回声问题,导致播放音频质量差,语音识别率比较低,降低了用户体验。
目前常用的方法是采用网页即时通信(WebRTC)的方法,即:首先利用时延估计算法对齐近端和远端的数据;之后采用自适应滤波器完成对回声的估计,从而消除线性回声;最后利用非线性处理完成对残余回声的抑制。这种方法可以比较好的消除线性回声,但是由于非线性回声和时延估计误差在一定程度上会引入残余回声,虽然非线性处理可以在一定程度上抑制这种残余回声,但是抑制程度有限,仍然有残余回声存在,特别是复杂环境的回声,滤波器无法快速跟踪房间冲激响应的变化,导致最终的回声消除效果不佳,回声抑制的性能一般,语音识别率低,用户的听感体验差。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种音频信号处理方法、装置及存储介质。
第一方面,本公开提供了一种音频信号处理方法,包括:
获取第一参考音频信号和待处理的混合音频信号,混合音频信号包括回声信号和目标音频信号;
将混合音频信号输入到预先训练完成的深度聚类网络模型中,得到混合音频信号对应的深度表示;
利用预先训练完成的声纹识别网络模型提取第一参考音频信号的声纹特征;
根据第一参考音频信号的声纹特征和混合音频信号对应的深度表示,利用预先训练完成的多头注意力机制模型得到混合音频信号中回声信号对应的深度表示的聚类中心;
根据回声信号对应的深度表示的聚类中心、混合音频信号对应的深度表示和混合音频信号,得到混合音频信号中的所述目标音频信号。
可选地,根据回声信号对应的深度表示的聚类中心、混合音频信号对应的深度表示和混合音频信号,得到混合音频信号中的目标音频信号,包括:
根据回声信号对应的深度表示的聚类中心和混合音频信号对应的深度表示,得到混合音频信号中每个时频点上的目标音频信号的幅度与混合音频信号的幅度的比值;
根据上述比值和混合音频信号,得到混合音频信号中的目标音频信号。
可选地,根据第一参考音频信号的声纹特征和混合音频信号对应的深度表示,利用预先训练完成的多头注意力机制模型得到混合音频信号中回声信号对应的深度表示的聚类中心,包括:
利用预先训练完成的多头注意力机制模型计算混合音频信号对应的深度表示与第一参考音频的声纹特征的第一相似度;
根据第一相似度得到混合音频信号中回声信号对应的深度表示的聚类中心。
可选地,获取第一参考音频信号和待处理的混合音频信号,包括:
利用音频采集装置获取待处理的混合音频;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110263948.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于海量位置轨迹数据时空分析方法
- 下一篇:一种铝棒加热炉