[发明专利]一种环境自适应的语音混响消除方法和系统有效
申请号: | 201510761023.9 | 申请日: | 2015-11-10 |
公开(公告)号: | CN105448302B | 公开(公告)日: | 2019-06-25 |
发明(设计)人: | 卓鹏鹏;李稀敏;肖龙源 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L15/02;G10L15/06;G10L15/20 |
代理公司: | 厦门市新华专利商标代理有限公司 35203 | 代理人: | 朱凌 |
地址: | 361000 福建省厦*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 环境 自适应 语音 混响 消除 方法 系统 | ||
1.一种环境自适应的语音混响消除方法,其特征在于:包括有以下步骤:
步骤100 :使用混响模型训练装置训练混响模型,并且将训练得到混响模型的存储于音频处理装置的第二存储器中;
步骤200 :采用RT60获取装置获取当前环境下的RT60值,并且发送给音频处理装置;
步骤300 :输入获取到的数字语音信号;
步骤400 :使用音频处理装置中的第二特征提取模块提取输入语音的MFCC,具体步骤与混响模型训练装置中的特征提取一致;
步骤500 :将原始的特征经过前5帧后4帧的扩展,形成320维数据,再将320维数据的每一维进行均值方差归一化处理;
步骤600 :根据获取到的RT60值,读取第二存储器里对应的混响模型;
步骤700 :根据输入的归一化MFCC特征及混响模型,通过混响模型的参数对输入的语音特征进行映射得到混响消除后的语音特征,也就是将提取的归一化MFCC特征作为输入,根据混响模型的参数得到不带混响的语音特征;
步骤800 :输出混响消除后的语音特征,该输出作为鲁棒性语音特征供语音识别或说话人识别使用。
2.根据权利要求1所述的一种环境自适应的语音混响消除方法,其特征在于:所述步骤100中包括有以下步骤:
步骤101: 整理语料,混响语音采用在安静语音的基础上卷积加入房间脉冲响应获得;
步骤102 :按所在的混响时间区间分别使用第一特征提取模块提取带混响的语音及安静语音的MFCC;
步骤103 :将原始的特征经过前5帧后4帧的扩展,形成320维数据,再将320维数据的每一维进行均值方差归一化处理;
步骤104:构建编码器,编码器的形式采用DAE的形式,使用RBM堆叠的方式构建深度置信网络;
步骤105:训练编码器,分别训练各个混响时间区间内的语音特征,并得到对应的混响模型;
步骤106:将第二存储器中的所有混响模型及对应的一些参数存储到音频处理装置中的第二存储器里。
3.根据权利要求1所述的一种环境自适应的语音混响消除方法,其特征在于:所述步骤200中包括有以下步骤:
步骤201:使用RT60获取模块获取当前时刻的RT60估计值;
步骤202:使用第一存储器存储RT60获取模块测得的RT60值;
步骤203:使用算数平均模块,估计出当前时刻的RT60“真值”;
步骤204 :采用第一无线接口向音频处理装置发送RT60的“真值”。
4.一种环境自适应的语音混响消除系统,其特征在于:包括有混响模型训练装置、RT60获取装置以及音频处理装置;该混响模型训练装置包括有第一特征提取模块、编码模块和模型存储器,该第一特征提取模块连接编码模块,该编码模块连接模型存储器;该RT60获取装置包括有RT60获取模块、第一存储器、算数平均模块和第一无线接口,该RT60获取模块连接第一存储器,该第一存储器连接算数平均模块,该算数平均模块连接第一无线接口;该音频处理装置包括有第二特征提取模块、解码模块、第二无线接口和第二存储器,该第二特征提取模块连接解码模块,该第二无线接口连接第二存储器,该第二存储器连接解码模块,前述第一无线接口无线连接第二无线接口,前述模型存储器连接第二存储器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510761023.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:语音信号的处理方法和装置
- 下一篇:一种基于声纹识别的音频处理方法及系统