[发明专利]基于深度学习的多通道音视频会议降噪的方法及系统在审
| 申请号: | 201911378821.8 | 申请日: | 2019-12-27 |
| 公开(公告)号: | CN111028857A | 公开(公告)日: | 2020-04-17 |
| 发明(设计)人: | 辛鑫 | 申请(专利权)人: | 苏州蛙声科技有限公司 |
| 主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L21/0232;G10L21/0264;G10L25/30 |
| 代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 张荣 |
| 地址: | 215000 江苏省苏州市工业*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 学习 通道 视频会议 方法 系统 | ||
1.一种基于深度学习的多通道音视频会议降噪的方法,其特征在于,包括如下步骤:
步骤S1:采集原始多通道信号,将采集的时域信号转换成频域信号;
步骤S2:利用神经网络计算各个频段上存在的噪音概率,通过所述噪音概率计算噪音的协方差矩阵;
步骤S3:通过所述噪音的协方差矩阵计算噪音的协方差矩阵的特征向量,根据所述噪音的协方差矩阵以及所述噪音的协方差矩阵的特征向量计算合并多通道的权值;
步骤S4:根据所述合并多通道的权值以及所述频域信号输出降噪结果。
2.根据权利要求1所述的基于深度学习的多通道音视频会议降噪方法,其特征在于:所述采集原始多通道信号的方法为:通过麦克风阵列采集所述原始多通道信号。
3.根据权利要求1所述的基于深度学习的多通道音视频会议降噪的方法,其特征在于:将采集的时域信号转换成频域信号的方法为:利用单个滤波器或者多个滤波器通过快速傅里叶变化,将采集的时域信号转换成所述频域信号。
4.根据权利要求1所述的基于深度学习的多通道音视频会议降噪的方法,其特征在于:利用神经网络计算各个频段上存在的噪音概率的方法为:将提前标注好的数据输入至所述神经网络中,通过所述神经网络的计算后输出在各个频段上存在的噪音概率。
5.根据权利要求1所述的基于深度学习的多通道音视频会议降噪的方法,其特征在于:所述噪音的协方差矩阵的计算方法为:若所述噪音的协方差矩阵为Φf,频域信号为Yi,t,则其中Yi,t表示第i个信道在t时刻的频域信号,N表示通道的数量,是Yi,t的共轭转置。
6.根据权利要求5所述的基于深度学习的多通道音视频会议降噪的方法,其特征在于:所述噪音的协方差矩阵的特征向量计算方法为φfWf=Wf∧,其中所述噪音的协方差矩阵的特征向量为Wf,噪音的协方差矩阵为Φf,∧表示特征值的矩阵。
7.根据权利要求6所述的基于深度学习的多通道音视频会议降噪的方法,其特征在于:计算合并多通道的权值的方法为:
其中所述合并多通道的权值为是Wf的共轭转置。
8.根据权利要求7所述的基于深度学习的多通道音视频会议降噪的方法,其特征在于:根据所述合并多通道的权值以及所述频域信号输出降噪结果的方法为:
9.一种基于深度学习的多通道音视频会议降噪的系统,其特征在于,包括:
采集模块,用于采集原始多通道信号,将采集的时域信号转换成频域信号;
第一计算模块,用于利用神经网络计算各个频段上存在的噪音概率,通过所述噪音概率计算噪音的协方差矩阵;
第二计算模块,用于通过所述噪音的协方差矩阵计算噪音的协方差矩阵的特征向量,根据所述噪音的协方差矩阵以及所述噪音的协方差矩阵的特征向量计算合并多通道的权值;
输出模块,用于根据所述合并多通道的权值以及所述频域信号输出降噪结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州蛙声科技有限公司,未经苏州蛙声科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911378821.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种户外使用防堵塞排污自吸泵
- 下一篇:一种多激光AGV的避让方法





