[发明专利]音频信号处理方法、装置、可读存储介质及耳机在审
申请号: | 202111093716.7 | 申请日: | 2021-09-17 |
公开(公告)号: | CN113810828A | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 周岭松;王昭;相非 | 申请(专利权)人: | 北京小米移动软件有限公司;北京小米松果电子有限公司 |
主分类号: | H04R3/00 | 分类号: | H04R3/00;H04R1/10 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 魏嘉熹 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 信号 处理 方法 装置 可读 存储 介质 耳机 | ||
本公开涉及一种音频信号处理方法、装置、可读存储介质及耳机。方法包括:获取环境音信号;根据预设的通透滤波器对环境音信号进行滤波处理,得到第一音频信号;提取环境音信号中的人声信号,得到第二音频信号;将第一音频信号和第二音频信号发送给扬声器,控制所述扬声器同步播放所述第一音频信号和第二音频信号。这样,通过提取环境音信号中的人声信号,叠加滤波处理后的环境音信号,通过同步播放,可在不损失语音的前提下,对通透后的环境音信号中的人声部分进行增强,提供通透模式下清晰的人声感知,为用户提供良好的环境通透体验。另外,由于叠加的是人声信号,因此不会对噪声进行增强,使得用户听到的人声更加清晰。
技术领域
本公开涉及音频处理领域,尤其涉及一种音频信号处理方法、装置、可读存储介质及耳机。
背景技术
为适应不同场景,现有的很多耳机设有降噪模式和通透模式,降噪模式用于阻挡外界的声音信号,通透模式用于让外界的声音信号进入人耳。当用户戴着耳机,要与其他人进行对话,可以不用摘下耳机,切换到通透模式,则等同于摘下耳机的效果,从而实现与对方的清晰对话。但环境中通常有噪声,我们期望交谈时能听到更多的人声和更少的噪声,因而增设了使人声更清晰的人声增强功能。
因为语音频带范围为300Hz~3400Hz,现阶段的人声增强方法通常对不同频段的声音分别处理:对于300Hz以下的低频噪声,通过施加反向声波来抵消;对于300Hz~3400Hz的语音频段,利用通透滤波器进行滤波,然后通过带通滤波器对降噪后的语音进行滤波和能量放大;最后,反相声波叠加带通放大后的声波,由扬声器播放。但实际环境中,噪声是全频带分布的,在300Hz~3400Hz频段也会包含噪声,放大语音的同时也会放大噪声,实际用户体验只是噪声和人声一起增强了。并且,300Hz以下也存在语音的可能,通过声波抵消,可能会损伤语音。
发明内容
为克服相关技术中存在的问题,本公开提供一种音频信号处理方法、装置、可读存储介质及耳机。
根据本公开实施例的第一方面,提供一种音频信号处理方法,应用于耳机,包括:
获取环境音信号,其中,所述环境音信号为所述耳机周围环境中的声音信号;
根据预设的通透滤波器对所述环境音信号进行滤波处理,得到第一音频信号;
提取所述环境音信号中的人声信号,得到第二音频信号;
将所述第一音频信号和所述第二音频信号发送给扬声器,控制所述扬声器同步播放所述第一音频信号和所述第二音频信号。
可选地,所述提取所述环境音信号中的人声信号,包括:
通过维纳滤波提取所述环境音信号中的人声信号。
可选地,所述通过维纳滤波提取所述环境音信号中的人声信号,包括:
通过傅里叶变换将所述环境音信号从时域变换到频域,得到所述环境音信号对应的频域信号;
针对所述频域信号中的每一音频帧,确定所述音频帧对应的维纳滤波系数;
利用所述音频帧对应的维纳滤波系数对所述音频帧进行滤波,得到所述音频帧中的频域人声信号;
对所述频域人声信号进行逆傅里叶变换,得到所述音频帧对应的时域信号中的人声信号。
可选地,所述确定所述音频帧对应的维纳滤波系数,包括:
确定所述音频帧对应的功率谱,并对所述音频帧进行噪声估计,得到所述音频帧中噪声信号对应的功率谱;
根据所述音频帧对应的功率谱、所述音频帧中噪声信号对应的功率谱以及所述音频帧的前一音频帧中噪声信号对应的功率谱,确定所述音频帧对应的维纳滤波系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司;北京小米松果电子有限公司,未经北京小米移动软件有限公司;北京小米松果电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111093716.7/2.html,转载请声明来源钻瓜专利网。