[发明专利]一种改进的多目标准则学习的语音增强方法在审

申请号：	201910233182.X	申请日：	2019-03-26
公开（公告）号：	CN110060704A	公开（公告）日：	2019-07-26
发明（设计）人：	张涛;邵洋洋	申请（专利权）人：	天津大学
主分类号：	G10L25/60	分类号：	G10L25/60;G10L25/21;G10L25/24;G10L25/30;G10L25/45;G10L21/02;G10L15/06
代理公司：	天津市北洋有限责任专利代理事务所 12201	代理人：	杜文茹
地址：	300072***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种改进的多目标准则学习的语音增强方法，包括：信号预处理，包括获取训练数据集和测试数据集，并对训练数据集和测试数据集的数据进行分帧及加窗，分别确定窗函数类型、分帧时长和帧移参数；计算分帧加窗后的训练数据集和测试数据集中的带噪语音的每帧信号的对数功率谱；计算多目标训练的目标函数；训练深度神经网络；测试网络，用所述的测试数据集的带噪语音的每帧信号的对数功率谱作为特征，输入到深度神经网络中进行神经网络的测试；将语音可懂度、主观语音质量评估和语音质量分别作为语音增强后可懂度、感知效果以及语音质量的评价指标。本发明消除了带噪语音信号的相位信息对增强语音的可懂度和语音质量的不利影响，实施较为方便容易。
搜索关键词：	语音测试数据集训练数据集神经网络语音增强多目标可懂度分帧对数功率谱加窗语音质量评估信号预处理测试数据测试网络目标函数评价指标相位信息语音信号窗函数时长感知改进测试学习主观
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种改进的多目标准则学习的语音增强方法，其特征在于，包括如下步骤：1)信号预处理，包括获取训练数据集和测试数据集，并对训练数据集和测试数据集的数据进行分帧及加窗，分别确定窗函数类型、分帧时长和帧移参数；2)计算分帧加窗后的训练数据集和测试数据集中的带噪语音的每帧信号的对数功率谱；3)计算多目标训练的目标函数；4)训练深度神经网络；5)测试网络，用所述的测试数据集的带噪语音的每帧信号的对数功率谱作为特征，输入到深度神经网络中进行神经网络的测试；将语音可懂度、主观语音质量评估和语音质量分别作为语音增强后可懂度、感知效果以及语音质量的评价指标。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于天津大学，未经天津大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910233182.X/，转载请声明来源钻瓜专利网。

上一篇：一种检测并定位语音片段内的平滑处理的方法
下一篇：磁头组件以及磁盘装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种改进的多目标准则学习的语音增强方法在审

专利文献下载