[发明专利]一种定向拾音方法、装置及电子设备有效
| 申请号: | 201710592299.8 | 申请日: | 2017-07-19 |
| 公开(公告)号: | CN109285557B | 公开(公告)日: | 2022-11-01 |
| 发明(设计)人: | 陈展;杨茜;任烨 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
| 主分类号: | G10L21/028 | 分类号: | G10L21/028;G10L21/0216 |
| 代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
| 地址: | 310051 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 定向 方法 装置 电子设备 | ||
1.一种定向拾音方法,其特征在于,所述方法包括:
按照预设的帧长和帧移参数,对两个麦克风采集的两路初始语音信号分别进行分帧处理;
针对每一帧对应的两路初始语音信号分别进行频域转换,得到该帧对应的两路频域信号;
根据每一帧对应的两路频域信号,计算该帧的初始分离矩阵;
基于预先设置的定向角度,对每一帧的初始分离矩阵进行帧内排序修正,得到每一帧的参考分离矩阵;
确定每一帧对应的语音信号的声源方向相对于所述两个麦克风的角度,并根据每一帧中目标语音信号的声源方向相对于所述两个麦克风的角度,对所有帧对应的所述参考分离矩阵进行帧间排序修正,得到该帧的目标分离矩阵,其中,所述定向角度表示预设的拾音方向相对于两个麦克风的角度;
根据每一帧的目标分离矩阵,从该帧对应的两路初始语音信号中分离出目标语音信号在该帧对应的频域信号,其中,所述目标语音信号为所述定向角度上的语音信号;
分别对所述目标语音信号在每一帧对应的频域信号进行时域转换,得到所述目标语音信号。
2.根据权利要求1所述的方法,其特征在于,在所述基于预先设置的定向角度,对每一帧对应的初始分离矩阵进行排序修正,得到该帧对应的目标分离矩阵的步骤之前,还包括:
对每一帧的初始分离矩阵进行尺度修正,得到该帧的中间分离矩阵;
所述基于预先设置的定向角度,对每一帧对应的初始分离矩阵进行排序修正,得到该帧对应的目标分离矩阵的步骤,包括:
基于预先设置的定向角度,对每一帧对应的中间分离矩阵进行排序修正,得到该帧对应的目标分离矩阵。
3.根据权利要求1所述的方法,其特征在于,所述基于预先设置的定向角度,对每一帧对应的初始分离矩阵进行帧内排序修正的步骤,包括:
对每一帧的初始分离矩阵进行近似态相干变换分析,并基于近似态相干变换分析的结果和预先设置的定向角度,对每一帧对应的初始分离矩阵进行帧内排序修正。
4.根据权利要求1所述的方法,其特征在于,所述每一帧对应的语音信号的声源方向相对于所述两个麦克风的角度的步骤,包括:
根据每一帧的初始分离矩阵和参考分离矩阵对该帧对应的两路初始语音信号进行峰值检测,确定每一帧对应的语音信号的声源方向相对于所述两个麦克风的角度。
5.根据权利要求1所述的方法,其特征在于,在所述按照预设的帧长和帧移参数,对两个麦克风采集的两路初始语音信号进行分帧的步骤之后,还包括:
根据预设的窗函数,对每一帧对应的两路初始语音信号分别进行加窗处理;
所述针对每一帧对应的两路语音信号分别进行频域转换,得到该帧对应的两路频域信号的步骤,包括:
针对加窗处理后的每一帧对应的两路初始语音信号分别进行频域转换,得到该帧对应的两路频域信号。
6.根据权利要求1所述的方法,其特征在于,在所述分别对所述目标语音信号在每一帧对应的频域信号进行时域转换的步骤之后,还包括:
利用每一帧对应的两路初始语音信号,对所述目标语音信号在该帧对应的时域信号进行滤波处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710592299.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:音频处理方法、装置、设备以及存储介质
- 下一篇:用于处理信号的方法和装置





