[发明专利]一种环境自适应的语音混响消除方法和系统有效
申请号: | 201510761023.9 | 申请日: | 2015-11-10 |
公开(公告)号: | CN105448302B | 公开(公告)日: | 2019-06-25 |
发明(设计)人: | 卓鹏鹏;李稀敏;肖龙源 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L15/02;G10L15/06;G10L15/20 |
代理公司: | 厦门市新华专利商标代理有限公司 35203 | 代理人: | 朱凌 |
地址: | 361000 福建省厦*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种环境自适应的语音混响消除方法和系统,该系统包括有混响模型训练装置、RT60获取装置以及音频处理装置;首先,考虑到RT60值的大小可以近似表征房间的混响量的大小及特殊的室内应用环境(RT60的值会在一个较小的范围内),本发明中将RT60值按大小分成多个区间,使用区间内的语音特征来训练混响模型,使得数据训练的更加充分,混响模型更有针对性;其次,通过结合当前环境的RT60值所在区间和使用对应区间的混响模型进行解码的方法实现了对不同房间环境的自适应;再者,由于采用深度网络训练模型,在实际应用时就不需要估计混响分量,直接根据模型参数进行解码即可得到混响消除后的语音特征,减少了计算量。 | ||
搜索关键词: | 一种 环境 自适应 语音 混响 消除 方法 系统 | ||
【主权项】:
1.一种环境自适应的语音混响消除方法,其特征在于:包括有以下步骤:步骤100 :使用混响模型训练装置训练混响模型,并且将训练得到混响模型的存储于音频处理装置的第二存储器中;步骤200 :采用RT60获取装置获取当前环境下的RT60值,并且发送给音频处理装置;步骤300 :输入获取到的数字语音信号;步骤400 :使用音频处理装置中的第二特征提取模块提取输入语音的MFCC,具体步骤与混响模型训练装置中的特征提取一致;步骤500 :将原始的特征经过前5帧后4帧的扩展,形成320维数据,再将320维数据的每一维进行均值方差归一化处理;步骤600 :根据获取到的RT60值,读取第二存储器里对应的混响模型;步骤700 :根据输入的归一化MFCC特征及混响模型,通过混响模型的参数对输入的语音特征进行映射得到混响消除后的语音特征,也就是将提取的归一化MFCC特征作为输入,根据混响模型的参数得到不带混响的语音特征;步骤800 :输出混响消除后的语音特征,该输出作为鲁棒性语音特征供语音识别或说话人识别使用。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510761023.9/,转载请声明来源钻瓜专利网。
- 上一篇:语音信号的处理方法和装置
- 下一篇:一种基于声纹识别的音频处理方法及系统