[发明专利]一种语音处理方法、装置和用于语音处理的装置在审

申请号：	202110431564.0	申请日：	2021-04-21
公开（公告）号：	CN113299301A	公开（公告）日：	2021-08-24
发明（设计）人：	崔国辉	申请（专利权）人：	北京搜狗科技发展有限公司
主分类号：	G10L21/0208	分类号：	G10L21/0208;G10L21/0216;G10L21/0264;G10L25/30
代理公司：	北京润泽恒知识产权代理有限公司 11319	代理人：	苏培华
地址：	100084 北京市海淀区中关***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音处理方法装置用于
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种语音处理方法，其特征在于，所述方法包括：

利用多通道语音信号上一帧的滤波处理参数计算当前帧的输出预测值和增益向量，所述滤波处理参数包括滤波器系数、协方差矩阵、遗忘因子；

根据当前帧的输出预测值、当前帧的增益向量、以及上一帧的遗忘因子，更新当前帧的滤波器系数和协方差矩阵，并根据更新的滤波器系数和协方差矩阵对当前帧进行滤波处理，得到当前帧的输出值；

对下一帧进行处理。

2.根据权利要求1所述的方法，其特征在于，所述对下一帧进行处理，包括：

在当前帧的输出值相对于上一帧的输出值满足预设变化条件的情况下，对所述遗忘因子进行更新，并利用更新的遗忘因子对下一帧进行处理。

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

计算当前帧的滤波器系数变化值与上一帧的滤波器系数变化值的比值；

若所述比值超过预设阈值，则确定当前帧的输出值相对于上一帧的输出值满足预设变化条件。

4.根据权利要求1所述的方法，其特征在于，所述利用多通道语音信号上一帧的滤波处理参数计算当前帧的输出预测值和增益向量，包括：

利用多通道语音信号上一帧的滤波器系数计算当前帧的输出预测值；

根据当前帧的语音方差、上一帧的遗忘因子、以及上一帧的协方差矩阵，计算当前帧的增益向量。

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

将多通道语音信号以帧为单位进行短时傅里叶变换，得到多通道语音信号的每一帧频域信号；

将所述多通道语音信号的每一帧频域信号求和后进行求模，得到每一帧的语音幅度谱；

将所述每一帧的语音幅度谱依次进行语音方差估计，得到每一帧的语音方差。

6.根据权利要求5所述的方法，其特征在于，所述将所述每一帧的语音幅度谱依次进行语音方差估计，得到每一帧的语音方差，包括：

将每一帧的语音幅度谱依次输入已训练的神经网络模型，通过所述神经网络模型输出每一帧的语音方差。

7.根据权利要求1所述的方法，其特征在于，所述得到当前帧的输出值之后，所述方法还包括：

确定当前帧的输出幅度大于当前帧的输入幅度的情况下，调节当前帧的输出幅度。

8.根据权利要求1所述的方法，其特征在于，所述更新当前帧的滤波器系数和协方差矩阵，包括：

确定当前帧为语音帧的情况下，更新当前帧的滤波器系数和协方差矩阵。

9.一种语音处理装置，其特征在于，所述装置包括：

参数计算模块，用于利用多通道语音信号上一帧的滤波处理参数计算当前帧的输出预测值和增益向量，所述滤波处理参数包括滤波器系数、协方差矩阵、遗忘因子；

第一处理模块，用于根据当前帧的输出预测值、当前帧的增益向量、以及上一帧的遗忘因子，更新当前帧的滤波器系数和协方差矩阵，并根据更新的滤波器系数和协方差矩阵对当前帧进行滤波处理，得到当前帧的输出值；

第二处理模块，用于对下一帧进行处理。

10.根据权利要求9所述的装置，其特征在于，所述第二处理模块，具体用于在当前帧的输出值相对于上一帧的输出值满足预设变化条件的情况下，对所述遗忘因子进行更新，并利用更新的遗忘因子对下一帧进行处理。

11.根据权利要求10所述的装置，其特征在于，所述装置还包括：

比值计算模块，用于计算当前帧的滤波器系数变化值与上一帧的滤波器系数变化值的比值；

条件判断模块，用于若所述比值超过预设阈值，则确定当前帧的输出值相对于上一帧的输出值满足预设变化条件。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司，未经北京搜狗科技发展有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110431564.0/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载