[发明专利]语音信号的增强方法、装置、电子设备和存储介质在审
申请号: | 202010610270.X | 申请日: | 2020-06-30 |
公开(公告)号: | CN111968658A | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 张国昌;魏建强;于利标;韩润强;卿睿;李峥 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0208;G10L21/0216;G06N3/04;G06N3/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 黄海艳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 信号 增强 方法 装置 电子设备 存储 介质 | ||
本申请公开了一种语音信号的增强方法、装置、电子设备和存储介质,涉及语音技术领域、深度学习领域。具体实现方案为:获取麦克风信号、远端参考信号和声学回波消除信号;提取麦克风信号的麦克风特征,并提取远端参考信号的远端参考特征;根据麦克风特征和远端参考特征生成语音信号在预设多个频带之上的存在概率;根据在预设多个频带之上的存在概率对声学回波消除信号进行增强。本申请可以解决针对目前基于信号处理的回波消除技术面临的无法很好平衡回波消除量和近讲语音失真的问题。
技术领域
本申请涉及计算机技术领域,具体涉及语音技术领域、深度学习领域,尤其涉及一种语音信号的增强方法、装置、电子设备和存储介质。
背景技术
背景噪声和远端回波是影响语音通话体验的主要因素,经典的语音通讯系统中,这两个任务分别由噪声抑制(Noise Suppression,英文简称:NS)和声学回波消除(Acoustic Echo Cancellation,英文简称:AEC)两个模块来完成。
理想情况下,声学回波是可以通过一个线性自适应滤波器完全消除的,然而由于扬声器的非线性、信号截幅、不佳的腔体设计、线性滤波器长度不足以及传递函数变化等问题。实际应用时,单一的线性自适应滤波器并不能很好满足需求。这一点在手机、笔记本电脑等小型设备上尤为明显。因此,广泛应用的声学回波消系统除往往由线性自适应滤波器和残留回波抑制(Residual Echo Suppression,英文简称:RES)器两部分组成。然而,相关技术中,基于信号处理的RES往往无法很好的平衡回波消除量和近讲语音失真。
发明内容
本申请提供了一种用于提高语音质量的语音信号的增强方法、装置、电子设备以及存储介质。
根据本申请的一方面,提供了一种语音信号的增强方法,包括:
获取麦克风信号、远端参考信号和声学回波消除信号;
提取所述麦克风信号的麦克风特征,并提取所述远端参考信号的远端参考特征;
根据所述麦克风特征和所述远端参考特征生成语音信号在预设多个频带之上的存在概率;
根据所述在预设多个频带之上的存在概率对所述声学回波消除信号进行增强。
根据本申请的第二方面,提供了一种语音信号的增强装置,包括:
信号获取模块,用于获取麦克风信号、远端参考信号和声学回波消除信号;
特征提取模块,用于提取所述麦克风信号的麦克风特征,并提取所述远端参考信号的远端参考特征;
生成模块,用于根据所述麦克风特征和所述远端参考特征生成语音信号在预设多个频带之上的存在概率;
增强模块,用于根据所述在预设多个频带之上的存在概率对所述声学回波消除信号进行增强。
根据本申请的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述的语音信号的增强方法。
根据本申请的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行前述的语音信号的增强方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010610270.X/2.html,转载请声明来源钻瓜专利网。