[发明专利]基于深度学习的多通道音视频会议降噪的方法及系统在审

专利信息
申请号: 201911378821.8 申请日: 2019-12-27
公开(公告)号: CN111028857A 公开(公告)日: 2020-04-17
发明(设计)人: 辛鑫 申请(专利权)人: 苏州蛙声科技有限公司
主分类号: G10L21/0216 分类号: G10L21/0216;G10L21/0232;G10L21/0264;G10L25/30
代理公司: 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 代理人: 张荣
地址: 215000 江苏省苏州市工业*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 深度 学习 通道 视频会议 方法 系统
【说明书】:

发明涉及一种基于深度学习的多通道音视频会议降噪的方法及系统,包括:采集原始多通道信号,将采集的时域信号转换成频域信号;利用神经网络计算各个频段上存在的噪音概率,通过所述噪音概率计算噪音的协方差矩阵;通过所述噪音的协方差矩阵计算噪音的协方差矩阵的特征向量,根据所述噪音的协方差矩阵以及所述噪音的协方差矩阵的特征向量计算合并多通道的权值;根据所述合并多通道的权值以及所述频域信号输出降噪结果。本发明利不但识别效率高,而且计算量小,实际使用的效果差。

技术领域

本发明涉及降噪处理的技术领域,尤其是指一种基于深度学习的多通道音视频会议降噪的方法。

背景技术

在音视频会议中通常会产生噪音,例如敲桌子声音、敲键盘的声音,桌子发出的吱悠吱悠的声音等,都会极大影响会议的质量,除此之外,视频会议的另外一端也会产生比较大的噪音,例如处在音视频对面的一方可能位于火车上,或者在运动中。当噪音很大的时候,通常参会者需要集中精力才能听清楚对方说什么,由此会使得参与会议的人耗费很大的脑力,导致非常疲惫。

为了解决会议噪声问题,通常涉及到声学处理,需要利用声学特性去除声学信号中的噪声。声学信号是一个一维的时域信号,通常的处理方法是利用傅立叶变化等数学方法把信号分解成二维的时频信号来处理。然而,人声和噪音比如敲桌子等产生的声音在时频空间是重合的,因此并没有非常好的方法将两者区分开来。

近几年,随着深度学习的发展,开始有人利用深度学习的方法来解决降噪问题,例如“Recurrent Neural Networks for Noise Reduction in Robust ASR”中,作者利用RNN来做声学信号降燥,然而在实际使用过程中,存在以下问题:理论需要3-5秒的时间来估计噪音,然而实际使用中需要8-16秒内才能估计出噪音,导致实际使用的速度过慢;对于没有训练过的噪音数据类型,识别效率非常低;计算量过大,导致在实际使用时,效果很差。

发明内容

为此,本发明所要解决的技术问题在于克服现有技术中会损失声音本身的质量,导致使用效果差的问题,从而提供一种不会损失声音本身的质量,且实际使用效果好的基于深度学习的多通道音视频会议降噪的方法及系统。

为解决上述技术问题,本发明的一种基于深度学习的多通道音视频会议降噪的方法,包括如下步骤:采集原始多通道信号,将采集的时域信号转换成频域信号;利用神经网络计算各个频段上存在的噪音概率,通过所述噪音概率计算噪音的协方差矩阵;通过所述噪音的协方差矩阵计算噪音的协方差矩阵的特征向量,根据所述噪音的协方差矩阵以及所述噪音的协方差矩阵的特征向量计算合并多通道的权值;根据所述合并多通道的权值以及所述频域信号输出降噪结果。

在本发明的一个实施例中,所述采集原始多通道信号的方法为:通过麦克风阵列采集所述原始多通道信号。

在本发明的一个实施例中,将采集的时域信号转换成频域信号的方法为:利用单个滤波器或者多个滤波器通过快速傅里叶变化,将采集的时域信号转换成所述频域信号。

在本发明的一个实施例中,利用神经网络计算各个频段上存在的噪音概率的方法为:将提前标注好的数据输入至所述神经网络中,通过所述神经网络的计算后输出在各个频段上存在的噪音概率。

在本发明的一个实施例中,所述噪音的协方差矩阵的计算方法为:若所述噪音的协方差矩阵为Φf,频域信号为Yi,t,则其中Yi,t表示第i个信道在t时刻的频域信号,N表示通道的数量,是Yi,t的共轭转置。

在本发明的一个实施例中,所述噪音的协方差矩阵的特征向量计算方法为ΦfWf=WfΛ,其中所述噪音的协方差矩阵的特征向量为Wf,噪音的协方差矩阵为Φf,Λ表示特征值的矩阵。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州蛙声科技有限公司,未经苏州蛙声科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911378821.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top