[发明专利]音频处理方法、装置及存储介质有效
| 申请号: | 201810878964.4 | 申请日: | 2018-08-03 |
| 公开(公告)号: | CN110797042B | 公开(公告)日: | 2022-04-15 |
| 发明(设计)人: | 钱能锋;陈扬坤;陈展 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
| 主分类号: | G10L21/0216 | 分类号: | G10L21/0216 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 韩东艳 |
| 地址: | 310051 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 处理 方法 装置 存储 介质 | ||
本申请公开了一种音频处理方法、装置及存储介质,属于语音处理技术领域。该方法包括:获取多个音频采样频点对应的波束形成系数矩阵,获取到的多个波束形成系数矩阵是基于从麦克风阵列对应的圆形区域内选取的目标扇形区域确定的,多个波束形成系数矩阵用于控制在目标扇形区域指代的音频采集区域内采集的音频信号为静音状态,分别确定麦克风阵列中每个麦克风采集的音频信号在多个音频采样频点下的频域信号,将每个波束形成系数矩阵作为每个麦克风在对应音频采样频点下的频域信号的系数,对确定的频域信号进行变换处理,得到目标音频信号。本申请在不影响采集需求的音频信号的情况下,可以抑制掉需要静音的目标扇形区域的音频信号。
技术领域
本申请实施例涉及语音处理技术领域,特别涉及一种音频处理方法、装置及存储介质。
背景技术
目前,麦克风阵列被广泛应用于音频信号采集中,其中包括的多个麦克风一般呈圆形状均匀分布。在一些情况下,麦克风阵列采集的音频信号中可能包括有噪音,譬如,在视频会议环境中,桌面上键盘的声音、纸的沙沙声等均属于噪音。为此,通常需要对麦克风阵列的某个特定区域所采集的音频信号进行抑制处理,即,使该特定区域的音频信号处于静音状态。
在相关技术中,可以为麦克风阵列设置静音按钮,当环境中存在噪音时,用户可以按动该静音按钮,以暂时关闭该麦克风阵列。此时,该麦克风阵列暂停采集操作,如此,可以避免采集到噪音。
然而,当关闭麦克风阵列后,不仅暂停了对噪音的采集,同时也无法再对需求的音频信号进行采集。
发明内容
本申请实施例提供了一种音频处理方法、装置及存储介质,可以解决关闭麦克风阵列导致无法再对需求的音频信号进行采集的问题。所述技术方案如下:
第一方面,提供了一种音频处理方法,所述方法包括:
获取多个音频采样频点对应的波束形成系数矩阵,获取到的多个波束形成系数矩阵是基于从麦克风阵列对应的圆形区域内选取的目标扇形区域确定的,所述圆形区域用于指代所述麦克风阵列的音频采集区域,所述多个波束形成系数矩阵用于控制在所述目标扇形区域指代的音频采集区域内采集的音频信号为静音状态;
分别确定所述麦克风阵列中每个麦克风采集的音频信号在所述多个音频采样频点下的频域信号;
将每个波束形成系数矩阵作为所述每个麦克风在对应音频采样频点下的频域信号的系数,对所确定的频域信号进行变换处理,得到目标音频信号。
可选地,所述方法还包括:
获取所述多个音频采样频点对应的预设阵列流形矩阵;
基于所述目标扇形区域,生成目标响应向量,所述目标响应向量包括与所述圆形区域内预先划分的K个单位扇形区域一一对应的K个响应数值,K为正整数,所述目标扇形区域不包括的单位扇形区域对应的响应数值为第一数值,所述目标扇形区域包括的单位扇形区域对应的响应数值为第二数值,所述第一数值用于表示非静音,所述第二数值用于表示静音;
基于所述目标响应向量和获取到的预设阵列流形矩阵,获取所述多个音频采样频点对应的波束形成系数矩阵。
可选地,所述基于所述目标响应向量和获取到的预设阵列流形矩阵,获取所述多个音频采样频点对应的波束形成系数矩阵,包括:
基于所述目标响应向量和获取到的预设阵列流形矩阵,通过指定公式,获取所述多个音频采样频点对应的波束形成系数矩阵,所述指定公式为:
其中,所述A(i)为第i个预设阵列流形矩阵,所述pd(Θ)为所述目标响应向量,所述wi为第i个波束形成系数矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810878964.4/2.html,转载请声明来源钻瓜专利网。





