[发明专利]一种基于声学特征转换的语音清晰度增强方法有效

专利信息
申请号: 201910281080.5 申请日: 2019-04-09
公开(公告)号: CN110085245B 公开(公告)日: 2021-06-15
发明(设计)人: 胡瑞敏;李罡;张锐;柯善发;王晓晨 申请(专利权)人: 武汉大学
主分类号: G10L21/02 分类号: G10L21/02;G10L15/06;G10L15/20;G10L25/18;G10L25/30
代理公司: 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人: 鲁力
地址: 430072 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于声学特征转换的语音清晰度增强方法,本方法包括训练阶段和使用阶段;在训练阶段,结合说话人噪声对抗发声机理,使用普通语音信号与Lombard效应下的抗噪语音信号作为数据集,训练具有声学特征转换能力的映射模型,其映射特征包括语音帧频谱倾斜度、基频系数和能量系数,使用长短时记忆网络学习频谱倾斜度的特征映射能力,使用贝叶斯高斯混合模型学习基频系数和能量系数的特征映射能力;在使用阶段,基于已经训练好的特征映射模型和相应的预处理、后处理技术,将通信设备或交互设备解码后的语音信号逐帧转换为具备抗噪特性的语音信号,提升语音信号在噪声环境中播放时的听觉清晰度和感知可懂度。
搜索关键词: 一种 基于 声学 特征 转换 语音 清晰度 增强 方法
【主权项】:
1.一种基于声学特征转换的语音清晰度增强方法,其特征在于,包括:步骤A、训练训练贝叶斯高斯混合模型,具体包括:步骤A1:搜集语音资料构建训练数据集,语音资料包括普通语音和抗噪语音两部分;步骤A2:使用时长对齐算法,将每一句Lombard语音的时长匹配至与对应普通语音时长相等;步骤A3:对数据集中的普通语音进行编解码处理,获得解码后的语音信号;步骤A4:使用重叠窗对所有语音信号分帧;步骤A5:提取每帧普通语音的对数幅度谱、能量系数、基频系数,提取Lombard语音的线谱频率、能量系数、基频系数;将对数幅度谱作为普通语音的频谱倾斜度特征表达式,将线谱频率作为Lombard语音的频谱倾斜度特征表达式;步骤A6:使用普通语音的对数幅度谱作为输入数据,使用Lombard语音的线谱频率作为输出数据,训练长短时记忆(Long Short‑Term Memory,LSTM)网络作为频谱倾斜度特征映射模型;步骤A7:使用普通语音的能量系数、基频系数作为输入数据,使用Lombard语音的能量系数、基频系数作为输出数据训练贝叶斯高斯混合模型(Bayesian Gaussian Mixture Model,BGMM)作为能量和基频特征映射模型;步骤B、采用步骤A中训练好的模型进行语音清晰度增强,具体包括:步骤B1:逐帧获取实时语音通信终端设备或实时语音交互设备解码后的语音信号,提取解码信号的对数幅度谱、能量系数、基频系数,作为待映射的参数;根据步骤B3中合成声码器的差异,若合成声码器需要非映射参数则提取相应的参数,若合不需要非映射参数则不提取;因本发明不限定声码器的种类,故既不限定非映射参数是否提取,也不限定提取的数量和种类;步骤B2:使用由LSTM网络构成的频谱倾斜度特征映射模型将对数幅度谱映射为具备Lombard语音特性的线谱频率,使用由BGMM模型构成的能量和基频特征映射模型将能量系数、基频系数映射为具备Lombard语音特性的能量系数、基频系数;步骤B3:根据映射后的特征参数和步骤B1中提取的所需非映射参数,使用声码器合成Lombard语音;步骤B4:根据环境噪声,使用自适应增益控制算法实时调整输出语音信号的增益。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910281080.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top