[发明专利]一种基于性别融合信息的语音降噪方法有效
申请号: | 201710139644.2 | 申请日: | 2017-03-09 |
公开(公告)号: | CN108573698B | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 李军锋;李煦;颜永红 | 申请(专利权)人: | 中国科学院声学研究所 |
主分类号: | G10L15/20 | 分类号: | G10L15/20 |
代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 王宇杨;陈琳琳 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 性别 融合 信息 语音 方法 | ||
1.一种基于性别融合信息的语音降噪方法,所述方法包括:
步骤1)采集大量语音训练数据,训练得到男性说话人DNN-NMF模型和女性说话人DNN-NMF模型;
步骤2)提取测试语音的频谱,确定测试语音说话人的性别;
步骤3)根据步骤2)确定的性别,将测试语音的幅度谱输入相应的DNN-NMF模型,得到降噪后的语音;
所述步骤2)具体包括:
步骤201)对测试语音进行预处理,提取其频谱;
步骤202)根据测试语音幅度谱X,利用性别鉴定算法确定测试语音说话人的性别;
所述步骤202)具体包括:
步骤202-1)对测试语音幅度谱X进行无监督非负矩阵分解,解决如下最优化问题:
其中,W=[Ws WN],H=[HST HNT]T,以及
目标函数的第二项为稀疏惩罚函数,β为系数,ε1为系数;
在进行分解时,步骤202-1)具体包括:
步骤202-1-1)计算X和WH的相似度V:
V=X./(WH)
其中,./表示逐点相除;
步骤202-1-2)更新权重向量H:
其中,.*表示逐点相乘;
步骤202-1-3)对中的语音权重矩阵HS进行稀惩罚,更新
λ2和ε2为系数;
步骤202-1-4)更新噪声矩阵WN,并对其进行归一化:
步骤202-1-5)判断步骤202-1-4)是否收敛;如果判断结果是肯定的,转入步骤202-2);否则,令转入步骤202-1-1);
步骤202-2)通过比较权重矩阵和的大小判断该说话人的性别;
如果||·||1表示矩阵的第一范式;判断该说话人为男性,反之则判断为女性。
2.根据权利要求1所述的基于性别融合信息的语音降噪方法,其特征在于,所述步骤1)具体包括:
步骤101)采集大量语音训练数据,所述语音训练数据包括:不含噪声的语音训练数据和纯噪声语音训练数据;
步骤102)对语音训练数据进行预处理,然后通过快速傅里叶变换提取语音训练数据的频谱;
步骤103)对不含噪声的语音训练数据按照性别进行分类:男性说话人训练数据和女性说话人训练数据,然后分别对男性说话人训练数据幅度谱和女性说话人训练数据幅度谱进行非负矩阵分解:
从中得到男性说话人和女性说话人对应的字典矩阵和
步骤104)对纯噪声语音训练数据的幅度谱进行非负矩阵分解,得到噪声字典WN;
步骤105)训练女性说话人DNN-NMF模型;
步骤106)训练男性说话人DNN-NMF模型。
3.根据权利要求2所述的基于性别融合信息的语音降噪方法,其特征在于,所述步骤105)具体包括:
步骤105-1)随机初始化女性说话人DNN-NMF模型参数;
步骤105-2)将不含噪声的女性说话人训练数据和纯噪声训练数据进行混合,形成混合训练数据,对混合训练数据进行快速傅里叶变换,提取其幅度谱,作为女性说话人DNN-NMF模型的输入x;
步骤105-3)根据前向传播算法计算女性说话人DNN-NMF模型最终的目标函数:
其中,xS是步骤105-2)中的不含噪声的女性说话人训练数据的幅度谱,xN是步骤105-2)中的纯噪声训练数据的幅度谱,和是DNN模型的输出,表示NMF的权重向量,通过DNN前向传播算法得到,是模型的一个中间变量,用于和字典相乘重构语音和噪声信号;λ1为系数;
步骤105-4)计算步骤105-3)中目标函数关于女性说话人DNN-NMF模型参数的导数,然后采用后向传播算法估计女性说话人DNN-NMF的参数,参数包括模型层与层之间的权重矩阵和偏置向量,得到女性说话人的DNN-NMF模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710139644.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语言模型更新方法、装置及设备
- 下一篇:语音共享识别方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置