[发明专利]音频处理方法、装置、计算机设备及存储介质在审

申请号：	202010924136.7	申请日：	2020-09-04
公开（公告）号：	CN111986691A	公开（公告）日：	2020-11-24
发明（设计）人：	夏咸军	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G10L21/0208	分类号：	G10L21/0208;G10L21/0232;G10L25/27;G10L25/30
代理公司：	北京三高永信知识产权代理有限责任公司 11138	代理人：	徐立
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	音频处理方法装置计算机设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供了一种音频处理方法、装置、计算机设备及存储介质，属于多媒体技术领域。该方法包括：获取待处理音频的频谱特征；根据该频谱特征，确定该待处理音频的分类概率信息和第一噪声抑制信息，该分类概率信息用于指示该待处理音频为非语音的概率，该第一噪声抑制信息用于指示以将所述待处理音频处理为纯语音为目标，对所述待处理音频中噪声的抑制程度；根据该分类概率信息，对该第一噪声抑制信息进行更新，得到第二噪声抑制信息；根据该第二噪声抑制信息，对该待处理音频进行噪声抑制处理。上述技术方案，能够对噪声进行大幅度抑制的同时，不对干净语音造成影响，并且通过调整对噪声的抑制程度，不会出现消除用户语音的风险。

技术领域

本申请涉及多媒体技术领域，特别涉及一种音频处理方法、装置、计算机设备及存储介质。

背景技术

随着智能硬件技术的发展，用户能够通过各种各样的智能硬件进行实时通信。在进行实时通信时，智能硬件能够对实时音频流信号进行处理，如噪声抑制、混响消除以及回声消除等。

目前，在对噪声进行抑制时，通常是对当前的音频流进行语音活动的判断，如果判断是语音，则正常进行噪声抑制；如果判断是非语音，则将当前信号完全消除，从而能够将纯噪声段的噪声完全消除干净。

上述方案存在的问题是，虽然能够将纯噪声片段消除的更加干净，但存在误消除用户的语音的风险，导致用户的语音信息丢失。

发明内容

本申请实施例提供了一种音频处理方法、装置、计算机设备及存储介质，能够对噪声进行大幅度抑制的同时，不对干净语音造成影响，并且通过调整对噪声的抑制程度，不会出现消除用户语音的风险。所述技术方案如下：

一方面，提供了一种音频处理方法，所述方法包括：

获取待处理音频的频谱特征；

根据所述频谱特征，确定所述待处理音频的分类概率信息和第一噪声抑制信息，所述分类概率信息用于指示所述待处理音频为非语音的概率，所述第一噪声抑制信息用于指示以将所述待处理音频处理为纯语音为目标，对所述待处理音频中噪声的抑制程度；

根据所述分类概率信息，对所述第一噪声抑制信息进行更新，得到第二噪声抑制信息；

根据所述第二噪声抑制信息，对所述待处理音频进行噪声抑制处理。

另一方面，提供了一种音频处理装置，所述装置包括：

特征获取模块，用于获取待处理音频的频谱特征；

信息确定模块，用于根据所述频谱特征，确定所述待处理音频的分类概率信息和第一噪声抑制信息，所述分类概率信息用于指示所述待处理音频为非语音的概率，所述第一噪声抑制信息用于指示以将所述待处理音频处理为纯语音为目标，对所述待处理音频中噪声的抑制程度；

信息更新模块，用于根据所述分类概率信息，对所述第一噪声抑制信息进行更新，得到第二噪声抑制信息；

噪声抑制模块，用于根据所述第二噪声抑制信息，对所述待处理音频进行噪声抑制处理。

在一种可选的实现方式中，所述信息确定模块，包括：

第一信息确定单元，用于将所述频谱特征输入声音识别模型，得到所述声音识别模型输出的所述待处理音频的分类概率信息，所述声音识别模型用于对所述待处理音频进行分类；

第二信息确定单元，用于将所述频谱特征输入噪声抑制模型，得到所述噪声抑制模型输出的所述待处理音频的第一噪声抑制信息，所述噪声抑制模型用于确定以将所述待处理音频处理为纯语音为目标，对所述待处理音频中噪声的抑制程度。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于腾讯科技（深圳）有限公司，未经腾讯科技（深圳）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010924136.7/2.html，转载请声明来源钻瓜专利网。

上一篇：一种手持式冰箱除冰清洁设备
下一篇：好友推荐方法、好友推荐显示方法、装置及设备

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]音频处理方法、装置、计算机设备及存储介质在审

专利文献下载