[发明专利]音频处理方法、装置及存储介质有效
| 申请号: | 201810878964.4 | 申请日: | 2018-08-03 |
| 公开(公告)号: | CN110797042B | 公开(公告)日: | 2022-04-15 |
| 发明(设计)人: | 钱能锋;陈扬坤;陈展 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
| 主分类号: | G10L21/0216 | 分类号: | G10L21/0216 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 韩东艳 |
| 地址: | 310051 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 处理 方法 装置 存储 介质 | ||
1.一种音频处理方法,其特征在于,所述方法包括:
获取多个音频采样频点对应的波束形成系数矩阵,获取到的多个波束形成系数矩阵是基于从麦克风阵列对应的圆形区域内选取的目标扇形区域确定的,所述圆形区域用于指代所述麦克风阵列的音频采集区域,所述多个波束形成系数矩阵用于控制在所述目标扇形区域指代的音频采集区域内采集的音频信号为静音状态;
分别确定所述麦克风阵列中每个麦克风采集的音频信号在所述多个音频采样频点下的频域信号;
将每个波束形成系数矩阵作为所述每个麦克风在对应音频采样频点下的频域信号的系数,对所确定的频域信号进行变换处理,得到目标音频信号;
其中,所述方法还包括:
获取所述多个音频采样频点对应的预设阵列流形矩阵;
基于所述目标扇形区域,生成目标响应向量,所述目标响应向量包括与所述圆形区域内预先划分的K个单位扇形区域一一对应的K个响应数值,K为正整数,所述目标扇形区域不包括的单位扇形区域对应的响应数值为第一数值,所述目标扇形区域包括的单位扇形区域对应的响应数值为第二数值,所述第一数值用于表示非静音,所述第二数值用于表示静音;
基于所述目标响应向量和获取到的预设阵列流形矩阵,获取所述多个音频采样频点对应的波束形成系数矩阵。
2.如权利要求1所述的方法,其特征在于,所述基于所述目标响应向量和获取到的预设阵列流形矩阵,获取所述多个音频采样频点对应的波束形成系数矩阵,包括:
基于所述目标响应向量和获取到的预设阵列流形矩阵,通过指定公式,获取所述多个音频采样频点对应的波束形成系数矩阵,所述指定公式为:
其中,所述A(i)为第i个预设阵列流形矩阵,所述pd(Θ)为所述目标响应向量,所述wi为第i个波束形成系数矩阵。
3.如权利要求1所述的方法,其特征在于,所述将每个波束形成系数矩阵作为所述每个麦克风在对应音频采样频点下的频域信号的系数,对所确定的频域信号进行变换处理,得到目标音频信号,包括:
对于所述多个音频采样频点中的每个音频采样频点,将所述每个麦克风采集的音频信号在所述音频采样频点下的频域信号进行组合,得到组合矩阵;
确定所述组合矩阵与所述音频采样频点对应的预设波束形成系数矩阵之间的乘积,得到所述麦克风阵列在所述音频采样频点下的频域信号;
对所述麦克风阵列在所述多个音频采样频点下的频域信号进行组合,并将组合后的频域信号进行傅里叶反变换处理,得到所述目标音频信号。
4.如权利要求1所述的方法,其特征在于,所述分别确定所述麦克风阵列中每个麦克风采集的音频信号在所述多个音频采样频点下的频域信号,包括:
分别对所述麦克风阵列中每个麦克风采集的音频信号进行分帧处理,得到所述每个麦克风采集的音频信号的分帧信号;
按照预设窗口大小,对所述每个麦克风采集的音频信号的分帧信号进行加窗处理,得到所述每个麦克风采集的音频信号的加窗信号;
基于所述多个音频采样频点,分别对所述每个麦克风采集的音频信号的加窗信号进行傅里叶变换处理,得到所述每个麦克风采集的音频信号在所述多个音频采样频点下的频域信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810878964.4/1.html,转载请声明来源钻瓜专利网。





