[发明专利]音频信号处理方法、训练方法及其装置、设备、存储介质在审
申请号: | 202111541269.7 | 申请日: | 2021-12-16 |
公开(公告)号: | CN114242100A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 张文凯;张策;李峥;贾磊 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216;G10L25/30;G10L15/22;G10L15/20;G06N3/04;G06N3/08 |
代理公司: | 北京易光知识产权代理有限公司 11596 | 代理人: | 武晨燕 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 信号 处理 方法 训练 及其 装置 设备 存储 介质 | ||
本公开提供了音频信号处理方法、训练方法及其装置、设备、存储介质,涉及数据处理领域,尤其涉及语音领域。具体实现方案为:从混合语音信号中消除至少部分的线性回声信号,得到中间处理信号;其中,所述混合语音信号是目标语音信号与回声信号混合后所得,所述回声信号是所述目标语音信号在所处环境下产生的,包括线性回声信号和非线性回声信号;利用目标全卷积神经网络模型去除所述中间处理信号中的非线性回声信号和残留的线性回声信号,得到近似目标语音信号,其中,所述目标全卷积神经网络模型包括至少两层卷积层。如此,最大化消除回声信号。
技术领域
本公开涉及数据处理技术领域,尤其涉及语音技术。
背景技术
声学回声消除(AEC,Acoustic Echo Cancellation)是一种消除扬声器和麦克风之间声学回声的技术。声学回声是由于扬声器的声音多次反馈到麦克风引起的。AEC作为语音识别的前端模块,在车载套件、音视频会议、智能家居等应用中是必不可少的。若缺少AEC模块,在声学回声较大的场景下,语音识别基本瘫痪。
发明内容
本公开提供了一种音频信号处理方法、训练方法及其装置、设备、存储介质。
根据本公开的一方面,提供了一种音频信号处理方法,包括:
从混合语音信号中消除至少部分的线性回声信号,得到中间处理信号;其中,所述混合语音信号是目标语音信号与回声信号混合后所得,所述回声信号是所述目标语音信号在所处环境下产生的,包括线性回声信号和非线性回声信号;
利用目标全卷积神经网络模型去除所述中间处理信号中的非线性回声信号和残留的线性回声信号,得到近似目标语音信号,其中,所述目标全卷积神经网络模型包括至少两层卷积层。
根据本公开的另一方面,提供了一种模型训练方法,包括:
获取对混合语音信号中的至少部分的线性回声信号进行消除处理后所得到的中间处理信号;其中,所述混合语音信号是总样本目标语音信号与回声信号进行混合后所得;所述回声信号包括线性回声信号和非线性回声信号;
至少将所述中间处理信号作为训练语音信号;
将所述训练语音信号输入至预设全卷积神经网络模型进行模型训练,得到目标全卷积神经网络模型,其中,所述预设全卷积神经网络模型包括至少两个卷积层;所述目标全卷积神经网络模型能够去除所述中间处理信号中的非线性回声信号和残留的线性回声信号。
根据本公开的再一方面,提供了一种音频信号处理装置,包括:
线性回声处理单元,用于从混合语音信号中消除至少部分的线性回声信号,得到中间处理信号;其中,所述混合语音信号是目标语音信号与回声信号混合后所得,所述回声信号是所述目标语音信号在所处环境下产生的,包括线性回声信号和非线性回声信号;
神经网络处理单元,用于利用目标全卷积神经网络模型去除所述中间处理信号中的非线性回声信号和残留的线性回声信号,得到近似目标语音信号,其中,所述目标全卷积神经网络模型包括至少两层卷积层。
根据本公开的再一方面,提供了一种模型训练装置,包括:
数据获取单元,用于获取对混合语音信号中的至少部分的线性回声信号进行消除处理后所得到的中间处理信号;其中,所述混合语音信号是总样本目标语音信号与回声信号进行混合后所得;所述回声信号包括线性回声信号和非线性回声信号;
训练数据确定单元,用于至少将所述中间处理信号作为训练语音信号;
模型优化单元,用于将所述训练语音信号输入至预设全卷积神经网络模型进行模型训练,得到目标全卷积神经网络模型,其中,所述预设全卷积神经网络模型包括至少两个卷积层;所述目标全卷积神经网络模型能够去除所述中间处理信号中的非线性回声信号和残留的线性回声信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111541269.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:CMOS图像传感器的制造方法
- 下一篇:一种妇产科用临盆产妇的智能训练装置