[发明专利]音频处理方法、装置、电子设备及存储介质在审
申请号: | 202110793296.7 | 申请日: | 2021-07-14 |
公开(公告)号: | CN115620735A | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 李罡;张锐;陶廉洁 | 申请(专利权)人: | 北京小米移动软件有限公司;北京小米松果电子有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216;G10L25/51 |
代理公司: | 北京善任知识产权代理有限公司 11650 | 代理人: | 张振伟 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 处理 方法 装置 电子设备 存储 介质 | ||
本公开提供了一种音频处理方法、装置、电子设备及存储介质,所述方法包括:获取环境中的声音,得到第一环境音,所述第一环境音至少包括:第一音频回声,其中,所述第一音频回声指的是第一音频被所述扬声器播放后被麦克风采集到的声音信号;根据第一音频参考音去除所述第一环境音中的第一音频回声,得到第二环境音;若所述第二环境音不包含语音声且包含机械声,则对待播放的第二音频进行处理,得到第三音频;将所述第三音频发送给所述扬声器,以由所述扬声器播放所述第三音频。本公开实施处理噪声的方式有效降低了对第一音频数据的误调整现象,提高了对第一音频数据调节的准确性,改善了用户的听觉体验。
技术领域
本公开涉及通信技术领域,尤其涉及一种音频处理方法、装置、电子设备及存储介质。
背景技术
以智能电视、平板电脑、个人计算机为代表的影音娱乐设备往往以扬声器为载体进行影音播放任务。在影音节目中,有超过一半的节目以语音为主要声源。在日常家庭环境中,通过扬声器播放的影音节目不可避免的受到环境噪声干扰,其中最主要的干扰源为家电噪声,而语音声源极易被家电噪声掩蔽,用户难以在噪声环境中有效获取节目声音信息。目前的降噪技术中,认定造成周围环境中的所有声音均属于噪声,无法区分以家电噪声为代表的真正干扰源,这种不区分场景的降噪方案会导致对语音声源的误调整,降低了用户体验。
发明内容
本公开提供一种音频处理方法、装置、电子设备及存储介质。
根据本公开第一方面实施例,提供一种音频处理方法,所述方法包括:
获取环境中的声音,得到第一环境音,所述第一环境音至少包括:第一音频回声,其中,所述第一音频回声指的是第一音频被所述扬声器播放后被麦克风采集到的声音信号;
根据第一音频参考音去除所述第一环境音中的第一音频回声,得到第二环境音,其中,所述第一音频参考音指的是所述第一音频在未被所述扬声器播放时的音频源数据;
若所述第二环境音不包含语音声且包含机械声,则对待播放的第二音频进行处理,得到第三音频;
将所述第三音频发送给所述扬声器,以由所述扬声器播放所述第三音频。
在一些实施例中,根据如下步骤确定所述第二环境音是否包含语音声或机械声;
确定所述第二环境音是否包含所述语音声;
若所述第二环境音不包含所述语音声,则确定所述第二环境音是否包含机械声。
在一些实施例中,根据如下步骤确定所述第二环境音是否包含语音声:
确定预设时间段内的所述第二环境音中多个音频帧的声音能量;
根据在所述预设时间段内,所述第二环境音中多个音频帧的声音能量的波动,确定所述第二环境音中是否包含所述语音声。
在一些实施例中,所述确定预设时间段内的所述第二环境音的声音能量,包括:
确定在所述预设时间段内的最大帧能量和最小帧能量;其中,所述最大帧能量为所述预设时间段包括的多个音频帧中声音能量最大的音频帧;所述最小帧能量为所述预设时间段包括的多个音频帧中声音能量最小的音频帧:
所述根据在所述预设时间段内,所述第二环境音的声音能量的波动,确定所述第二环境音中是否包含所述语音声,包括:
确定所述最大帧能量和所述最小帧能量的比值;
若所述比值大于或等于第一阈值,确定所述第二环境音中包含所述语音声。
在一些实施例中,所述根据在所述预设时间段内,所述第二环境音的声音能量的波动,确定所述第二环境音中是否包含所述语音声,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司;北京小米松果电子有限公司,未经北京小米移动软件有限公司;北京小米松果电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110793296.7/2.html,转载请声明来源钻瓜专利网。