[发明专利]音频信号处理方法、音频信号处理装置及存储介质在审
申请号: | 202110679785.X | 申请日: | 2021-06-18 |
公开(公告)号: | CN113488066A | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 侯海宁 | 申请(专利权)人: | 北京小米移动软件有限公司;北京小米松果电子有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0272 |
代理公司: | 北京钲霖知识产权代理有限公司 11722 | 代理人: | 李志新;刘亚平 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 信号 处理 方法 装置 存储 介质 | ||
1.一种音频信号处理方法,其特征在于,所述音频信号处理方法包括:
获取麦克风所采集的观测数据,其中,所述观测数据为多声源音频信号,所述多声源音频信号为至少两个声源发声而被所述麦克风所采集的音频信号;
响应于存在直达声和早期反射声的协方差矩阵估计更新值,基于所述直达声和早期反射声的协方差矩阵估计更新值,对所述观测数据进行去混响处理,得到直达声和早期反射声的估计值;
基于所述直达声和早期反射声的估计值,对所述多声源音频信号进行盲源分离处理,得到各声源的时域声源信号。
2.根据权利要求1所述的音频信号处理方法,其特征在于,基于所述直达声和早期反射声的估计值,对所述多声源音频信号进行盲源分离处理,包括:
根据第一分离矩阵,对所述直达声和早期反射声的估计值进行盲源分离,得到所述至少两个声源中每个声源对应声源信号的先验频域估计;
根据所述先验频域估计,得到加权系数以及对比函数,并基于所述加权系数和所述对比函数,对第一加权协方差矩阵进行更新,得到第二加权协方差矩阵;
基于所述第二加权协方差矩阵,对所述第一分离矩阵进行更新,得到第二分离矩阵;
基于所述第二分离矩阵,对所述直达声和早期反射声的估计值进行盲源分离,得到所述至少两个声源中每个声源对应声源信号的后验频域估计;
根据所述后验频域估计,得到直达声和早期反射声的协方差矩阵估计更新值,更新直达声和早期声的协方差矩阵估计,并根据所述后验频域估计,得到各声源的时域声源信号。
3.根据权利要求2所述的音频信号处理方法,其特征在于,所述根据所述后验频域估计,得到直达声和早期反射声的协方差矩阵估计更新值,包括:
根据所述后验频域估计和马尔可夫决策MDP算法,得到所述至少两个声源中每个声源在每个麦克风的观测信号中的直达声和早期反射声的估计值;
根据每个声源在每个麦克风的观测信号中的直达声和早期反射声的估计值,得到直达声和早期反射声的协方差矩阵估计更新值。
4.根据权利要求3所述的音频信号处理方法,其特征在于,所述根据所述后验频域估计和MDP算法,得到所述至少两个声源中每个声源在每个麦克风的观测信号中的直达声和早期反射声的估计值,包括:
基于MDP算法,通过所述后验频域估计的对角矩阵以及所述第二分离矩阵的逆矩阵,得到所述至少两个声源中每个声源在每个麦克风处的观测信号中的直达声和早期反射声的估计值。
5.根据权利要求3或4所述的音频信号处理方法,其特征在于,根据每个声源在每个麦克风的观测信号中的直达声和早期反射声的估计值,得到直达声和早期反射声的协方差矩阵估计更新值,包括:
根据每个声源在每个麦克风的观测信号中的直达声和早期反射声的估计值,得到所述至少两个声源中每个声源在每个麦克风处的观测信号中的直达声和早期反射声的增广矩阵;
基于所述增广矩阵,确定直达声和早期反射声的协方差矩阵估计更新值。
6.根据权利要求5所述的音频信号处理方法,其特征在于,所述基于所述增广矩阵,确定直达声和早期反射声的协方差矩阵估计更新值,包括:
确定直达声和早期反射声的协方差矩阵在τ-1帧直达声和早期反射声的协方差矩阵估计值,其中,τ为自然数,τ且大于1;
以预设的平滑系数,对所述τ-1帧直达声和早期反射声的协方差矩阵估计值进行平滑处理,得到第τ帧对应的直达声和早期反射声的协方差矩阵估计值。
7.一种音频信号处理装置,其特征在于,所述音频信号处理装置包括:
获取单元,用于获取麦克风所采集的观测数据,其中,所述观测数据为多声源音频信号,所述多声源音频信号为至少两个声源发声而被所述麦克风所采集的音频信号;
去混响单元,用于响应于存在直达声和早期反射声的协方差矩阵估计更新值,基于所述直达声和早期反射声的协方差矩阵估计更新值,对所述观测数据进行去混响处理,得到直达声和早期反射声的估计值;
分离单元,用于基于所述直达声和早期反射声的估计值,对所述多声源音频信号进行盲源分离处理,得到各声源的时域声源信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司;北京小米松果电子有限公司,未经北京小米移动软件有限公司;北京小米松果电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110679785.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种建筑施工用防护栏杆
- 下一篇:一种铸铁生产用抖砂装置及其实施方法