[发明专利]训练盲源分离模型的方法、装置及存储介质在审
申请号: | 201810717811.1 | 申请日: | 2018-07-03 |
公开(公告)号: | CN108922517A | 公开(公告)日: | 2018-11-30 |
发明(设计)人: | 李超;朱唯鑫 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L25/24;G10L25/30 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 于江微;刘芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 盲源分离 存储介质 控制参数 训练语音 卷积神经网络 背景音 前景音 预设 噪声 损伤 | ||
1.一种训练盲源分离模型的方法,其特征在于,包括:
根据加噪控制参数在线加噪确定训练语音信号,其中,所述加噪控制参数为满足预设分布的用于控制噪声的参数;
采用所述训练语音信号训练卷积神经网络,得到盲源分离模型。
2.根据权利要求1所述的方法,其特征在于,所述加噪控制参数为信噪比。
3.根据权利要求1所述的方法,其特征在于,所述预设分布为均匀分布或高斯分布。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述根据加噪控制参数在线加噪确定训练语音信号,包括:
获取所述加噪控制参数、语音信号和噪声;
根据所述加噪控制参数计算所述语音信号和所述噪声的混合系数;
根据所述混合系数、所述语音信号和所述噪声,确定所述训练语音信号。
5.根据权利要求1至3任一项所述的方法,其特征在于,所述采用所述训练语音信号训练卷积神经网络,得到盲源分离模型,包括:
对所述训练语音信号进行分帧处理,得到多帧语音信号;
采用所述多帧语音信号训练所述卷积神经网络,得到所述盲源分离模型。
6.根据权利要求5所述的方法,其特征在于,所述采用所述多帧语音信号训练所述卷积神经网络,得到所述盲源分离模型,包括:
对每一帧语音信号,通过以下任一方式提取所述语音信号的特征值:
方式一:提取所述语音信号的幅值谱;
方式二:提取所述语音信号的梅尔频谱;
方式三:提取所述语音信号的梅尔频率倒谱系数MFCC;
将所述语音信号对应的特征值作为所述卷积神经网络的入参,通过控制所述卷积神经网络的均方误差得到所述盲源分离模型。
7.一种训练盲源分离模型的装置,其特征在于,包括:
确定模块,用于根据加噪控制参数在线加噪确定训练语音信号,其中,所述加噪控制参数为满足预设分布的用于控制噪声的参数;
处理模块,用于采用所述训练语音信号训练卷积神经网络,得到盲源分离模型。
8.根据权利要求7所述的装置,其特征在于,所述加噪控制参数为信噪比。
9.根据权利要求7所述的装置,其特征在于,所述预设分布为均匀分布或高斯分布。
10.根据权利要求7至9任一项所述的装置,其特征在于,所述确定模块具体用于:
获取所述加噪控制参数、语音信号和噪声;
根据所述加噪控制参数计算所述语音信号和所述噪声的混合系数;
根据所述混合系数、所述语音信号和所述噪声,确定所述训练语音信号。
11.根据权利要求7至9任一项所述的装置,其特征在于,所述处理模块包括:
分帧单元,用于对所述训练语音信号进行分帧处理,得到多帧语音信号;
训练单元,用于采用所述多帧语音信号训练所述卷积神经网络,得到所述盲源分离模型。
12.根据权利要求11所述的装置,其特征在于,所述训练单元具体用于:
对每一帧语音信号,通过以下任一方式提取所述语音信号的特征值:
方式一:提取所述语音信号的幅值谱;
方式二:提取所述语音信号的梅尔频谱;
方式三:提取所述语音信号的梅尔频率倒谱系数MFCC;
将所述语音信号对应的特征值作为所述卷积神经网络的入参,通过控制所述卷积神经网络的均方误差得到所述盲源分离模型。
13.一种训练盲源分离模型的装置,其特征在于,包括:处理器和存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,使得所述处理器执行如权利要求1至6任一项所述的训练盲源分离模型的方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至6任一项所述的训练盲源分离模型的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810717811.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:检测调域值的方法和装置
- 下一篇:具有语音控制功能的图像处理系统