[发明专利]一种基于RNN的实时会议降噪方法及装置有效

申请号：	201810904699.2	申请日：	2018-08-09
公开（公告）号：	CN109273021B	公开（公告）日：	2021-11-30
发明（设计）人：	康元勋	申请（专利权）人：	厦门亿联网络技术股份有限公司
主分类号：	G10L21/0216	分类号：	G10L21/0216;G10L21/0224;G10L21/0232;G10L25/18;G10L25/45
代理公司：	广州三环专利商标代理有限公司 44202	代理人：	颜希文;郝传鑫
地址：	361000 福建省厦门市***	国省代码：	福建;35
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于 rnn 实时会议方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于RNN的实时会议降噪方法，其特征在于，包括以下步骤：

S1，对使用GRU的RNN模型进行训练确定RNN模型的合适参数，得到训练完成的RNN模型；其中，训练所述RNN模型的过程包括：S11，采集纯净语音信号和噪音语音信号，对纯净语音信号和噪音语音信号进行时域上的叠加，产生带噪语音信号；S12,对带噪语音信号和纯净语音信号分别进行分帧加窗，计算每帧在频域上的对数谱，将带噪语音信号的对数谱和纯净语音信号的对数谱进行对比得到对应的准确抑制参数；S22，将分帧加窗后得到的带噪语音信号的对数谱作为使用GRU的RNN模型的输入；S23，带噪语音信号的对数谱经过一个全连接层和两个GRU层后生成对应的估计对数谱，根据估计对数谱和带噪语音信号的对数谱得到期望抑制参数；S24,使用期望抑制参数和准确抑制参数计算均方误差，判断均方误差是否小于阈值，是则结束步骤，不是则利用均方误差进行求导，更新使用GRU的RNN模型的参数并返回步骤S11；

S2，对采集单元传输的语音信号进行分帧加窗，计算得到语音信号每帧在频域上的对数谱；

S3，将当前帧的对数谱放入训练完成的RNN模型进行估算，得到当前语音的估计对数谱；

S4，根据估计对数谱与原始信号的对数谱进行估计，算出当前帧的信噪比，根据信噪比计算出当前的降噪抑制系数；

S5,应用降噪抑制系数到原始信号的对数谱，对结果进行窗重叠和傅里叶逆变换，通过网络发送到对应的播放设备上，对处理后的信号进行播放。

2.根据权利要求1所述的一种基于RNN的实时会议降噪方法，其特征在于，所述全连接层的激活函数采用tanh函数，所述tanh函数的均值为0。

3.根据权利要求1所述的一种基于RNN的实时会议降噪方法，其特征在于，所述降噪抑制系数为期望抑制参数进行平滑处理得到，所述期望抑制参数为计对数谱与原始信号的对数谱进行估计得到。

4.根据权利要求1-3任一项所述的一种基于RNN的实时会议降噪方法，其特征在于，对信号进行分帧加窗,设置窗长为256样本，对分帧信号进行50％重叠。

5.一种基于RNN的实时会议降噪装置，其特征在于，包括采集装置，计算装置和播放装置；所述采集装置采集带噪语音信号发送至计算装置，所述计算装置处理带噪语音信号得到降噪语音信号发送至播放装置；所述计算装置为采用权利要求1-3任一项所述的一种基于RNN的实时会议降噪方法的计算装置。

6.一种基于RNN的实时会议降噪装置，其特征在于，包括采集装置，计算装置和播放装置；所述采集装置采集带噪语音信号发送至计算装置，所述计算装置处理带噪语音信号得到降噪语音信号发送至播放装置；所述计算装置为采用权利要求4所述的一种基于RNN的实时会议降噪方法的计算装置。

7.根据权利要求6所述的一种基于RNN的实时会议降噪装置，其特征在于，所述采集装置包括麦克风和AD转换器，所述麦克风通过AD转换器与计算装置连接；所述播放装置通过网络与计算装置连接。

8.根据权利要求7所述的一种基于RNN的实时会议降噪装置，其特征在于，所述采集装置还包括远程接收单元，所述远程接收单元与计算装置连接。

9.根据权利要求6-8任一项所述的一种基于RNN的实时会议降噪装置，其特征在于，所述计算装置为具有计算指令功能的多CPU硬件设备。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于厦门亿联网络技术股份有限公司，未经厦门亿联网络技术股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810904699.2/1.html，转载请声明来源钻瓜专利网。

上一篇：用于回声抑制的双重通话检测的方法及回声抑制
下一篇：一种数据评测方法、装置、设备及可读存储介质

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于RNN的实时会议降噪方法及装置有效

专利文献下载