[发明专利]一种基于深度自编码器的语音信号重建方法有效
| 申请号: | 201910775558.X | 申请日: | 2019-08-21 |
| 公开(公告)号: | CN110491400B | 公开(公告)日: | 2021-05-28 |
| 发明(设计)人: | 吴建锋;秦会斌;秦宏帅 | 申请(专利权)人: | 浙江树人学院(浙江树人大学) |
| 主分类号: | G10L19/035 | 分类号: | G10L19/035;G10L19/16;G10L25/30 |
| 代理公司: | 杭州昱呈专利代理事务所(普通合伙) 33303 | 代理人: | 雷仕荣 |
| 地址: | 312028 浙江省绍*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于深度自编码器的语音信号重建方法,包括以下步骤:步骤S101:获取编码数据并将其输入解码单元;步骤S102:解码单元通过深度解码器神经网络对编码数据进行处理并输出解码数据;步骤S103:对解码数据进行反归一化;步骤S104:对经步骤S103处理后的数据进行离散傅里叶逆变换;步骤S105:对经步骤S104处理后的数据通过叠接相加得到重建的语音信号;其中,编码数据通过以下步骤得到:步骤S201:对原始语音信号进行分帧;步骤S202:对分帧后的数据进行离散傅里叶变换;步骤S203:对步骤S202处理的数据进行归一化;步骤S204:将经归一化的数据输入编码单元;步骤S205:编码单元通过深度编码器神经网络对经步骤S203归一化的数据进行处理得到编码数据。 | ||
| 搜索关键词: | 一种 基于 深度 编码器 语音 信号 重建 方法 | ||
【主权项】:
1.一种基于深度自编码器的语音信号重建方法,其特征在于,包括以下步骤:/n步骤S101:获取编码数据并将其输入解码单元;/n步骤S102:解码单元通过深度解码器神经网络对编码数据进行处理并输出解码数据;/n步骤S103:对解码数据进行反归一化;/n步骤S104:对经步骤S103处理后的数据进行离散傅里叶逆变换;/n步骤S105:对经步骤S104处理后的数据通过叠接相加得到重建的语音信号;/n其中,所述编码数据通过以下步骤得到:/n步骤S201:对原始语音信号进行分帧;/n步骤S202:对分帧后的数据进行离散傅里叶变换;/n步骤S203:对步骤S202处理的数据进行归一化;/n步骤S204:将经归一化的数据输入编码单元;/n步骤S205:编码单元通过深度编码器神经网络对经步骤S203归一化的数据进行处理得到编码数据;/n深度编码器神经网络和深度解码器神经网络采用级联多个自编码器形成深度自编码器结构,深度自编码器结构通过以下步骤训练:/n步骤301:获取训练数据,训练数据为语音信号经步骤201至步骤204预处理得到;/n步骤302:将训练数据输入深度自编码器神经网络并使其输出误差最小化以获得优化参数;/n其中,优化参数通过最小化下式(1)得到:/n /n其中,n表示训练数据样本的个数,θ={W,b}和θ′={WT,b′}分别表示编码器和解码器的参数矩阵,θ*和θ′*表示优化后的参数矩阵;x(i)为自编码器的输入,z(i)=f′θ(fθ(x(i)))为自编码器输出,L(x,z)为损失函数,采用如下公式(2);/nL(x,z)=E(x,z)+αP(x)(2)/n式(2)中,P(x)为惩罚项,α为惩罚项权重,E(x,z)采用如下公式(3):/n /nN为向量维度,k为维度下标;/n步骤S303:得到优化后的深度自编码器神经网络并分别作为深度编码器神经网络和深度解码器神经网络,其中,fθ(x)表示深度编码器神经网络的映射函数,表征输入向量x到编码层表示向量y=fθ(x)之间的非线性映射关系,输出y作为编码数据;f′θ(y)表示深度解码器神经网络的映射函数,表征编码层表示向量y到重建向量z=f′θ(y)之间的非线性映射关系,输出z作为解码数据。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江树人学院(浙江树人大学),未经浙江树人学院(浙江树人大学)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910775558.X/,转载请声明来源钻瓜专利网。





