[发明专利]音频处理方法、装置、计算机设备及存储介质在审
| 申请号: | 202010924136.7 | 申请日: | 2020-09-04 |
| 公开(公告)号: | CN111986691A | 公开(公告)日: | 2020-11-24 |
| 发明(设计)人: | 夏咸军 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0232;G10L25/27;G10L25/30 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 徐立 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 处理 方法 装置 计算机 设备 存储 介质 | ||
本申请提供了一种音频处理方法、装置、计算机设备及存储介质,属于多媒体技术领域。该方法包括:获取待处理音频的频谱特征;根据该频谱特征,确定该待处理音频的分类概率信息和第一噪声抑制信息,该分类概率信息用于指示该待处理音频为非语音的概率,该第一噪声抑制信息用于指示以将所述待处理音频处理为纯语音为目标,对所述待处理音频中噪声的抑制程度;根据该分类概率信息,对该第一噪声抑制信息进行更新,得到第二噪声抑制信息;根据该第二噪声抑制信息,对该待处理音频进行噪声抑制处理。上述技术方案,能够对噪声进行大幅度抑制的同时,不对干净语音造成影响,并且通过调整对噪声的抑制程度,不会出现消除用户语音的风险。
技术领域
本申请涉及多媒体技术领域,特别涉及一种音频处理方法、装置、计算机设备及存储介质。
背景技术
随着智能硬件技术的发展,用户能够通过各种各样的智能硬件进行实时通信。在进行实时通信时,智能硬件能够对实时音频流信号进行处理,如噪声抑制、混响消除以及回声消除等。
目前,在对噪声进行抑制时,通常是对当前的音频流进行语音活动的判断,如果判断是语音,则正常进行噪声抑制;如果判断是非语音,则将当前信号完全消除,从而能够将纯噪声段的噪声完全消除干净。
上述方案存在的问题是,虽然能够将纯噪声片段消除的更加干净,但存在误消除用户的语音的风险,导致用户的语音信息丢失。
发明内容
本申请实施例提供了一种音频处理方法、装置、计算机设备及存储介质,能够对噪声进行大幅度抑制的同时,不对干净语音造成影响,并且通过调整对噪声的抑制程度,不会出现消除用户语音的风险。所述技术方案如下:
一方面,提供了一种音频处理方法,所述方法包括:
获取待处理音频的频谱特征;
根据所述频谱特征,确定所述待处理音频的分类概率信息和第一噪声抑制信息,所述分类概率信息用于指示所述待处理音频为非语音的概率,所述第一噪声抑制信息用于指示以将所述待处理音频处理为纯语音为目标,对所述待处理音频中噪声的抑制程度;
根据所述分类概率信息,对所述第一噪声抑制信息进行更新,得到第二噪声抑制信息;
根据所述第二噪声抑制信息,对所述待处理音频进行噪声抑制处理。
另一方面,提供了一种音频处理装置,所述装置包括:
特征获取模块,用于获取待处理音频的频谱特征;
信息确定模块,用于根据所述频谱特征,确定所述待处理音频的分类概率信息和第一噪声抑制信息,所述分类概率信息用于指示所述待处理音频为非语音的概率,所述第一噪声抑制信息用于指示以将所述待处理音频处理为纯语音为目标,对所述待处理音频中噪声的抑制程度;
信息更新模块,用于根据所述分类概率信息,对所述第一噪声抑制信息进行更新,得到第二噪声抑制信息;
噪声抑制模块,用于根据所述第二噪声抑制信息,对所述待处理音频进行噪声抑制处理。
在一种可选的实现方式中,所述信息确定模块,包括:
第一信息确定单元,用于将所述频谱特征输入声音识别模型,得到所述声音识别模型输出的所述待处理音频的分类概率信息,所述声音识别模型用于对所述待处理音频进行分类;
第二信息确定单元,用于将所述频谱特征输入噪声抑制模型,得到所述噪声抑制模型输出的所述待处理音频的第一噪声抑制信息,所述噪声抑制模型用于确定以将所述待处理音频处理为纯语音为目标,对所述待处理音频中噪声的抑制程度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010924136.7/2.html,转载请声明来源钻瓜专利网。





