[发明专利]一种基于深度自编码器的语音信号重建方法有效

申请号：	201910775558.X	申请日：	2019-08-21
公开（公告）号：	CN110491400B	公开（公告）日：	2021-05-28
发明（设计）人：	吴建锋;秦会斌;秦宏帅	申请（专利权）人：	浙江树人学院(浙江树人大学)
主分类号：	G10L19/035	分类号：	G10L19/035;G10L19/16;G10L25/30
代理公司：	杭州昱呈专利代理事务所(普通合伙) 33303	代理人：	雷仕荣
地址：	312028 浙江省绍***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于深度自编码器的语音信号重建方法，包括以下步骤：步骤S101：获取编码数据并将其输入解码单元；步骤S102：解码单元通过深度解码器神经网络对编码数据进行处理并输出解码数据；步骤S103：对解码数据进行反归一化；步骤S104：对经步骤S103处理后的数据进行离散傅里叶逆变换；步骤S105：对经步骤S104处理后的数据通过叠接相加得到重建的语音信号；其中，编码数据通过以下步骤得到：步骤S201：对原始语音信号进行分帧；步骤S202：对分帧后的数据进行离散傅里叶变换；步骤S203：对步骤S202处理的数据进行归一化；步骤S204：将经归一化的数据输入编码单元；步骤S205：编码单元通过深度编码器神经网络对经步骤S203归一化的数据进行处理得到编码数据。
搜索关键词：	一种基于深度编码器语音信号重建方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于深度自编码器的语音信号重建方法，其特征在于，包括以下步骤：/n步骤S101：获取编码数据并将其输入解码单元；/n步骤S102：解码单元通过深度解码器神经网络对编码数据进行处理并输出解码数据；/n步骤S103：对解码数据进行反归一化；/n步骤S104：对经步骤S103处理后的数据进行离散傅里叶逆变换；/n步骤S105：对经步骤S104处理后的数据通过叠接相加得到重建的语音信号；/n其中，所述编码数据通过以下步骤得到：/n步骤S201：对原始语音信号进行分帧；/n步骤S202：对分帧后的数据进行离散傅里叶变换；/n步骤S203：对步骤S202处理的数据进行归一化；/n步骤S204：将经归一化的数据输入编码单元；/n步骤S205：编码单元通过深度编码器神经网络对经步骤S203归一化的数据进行处理得到编码数据；/n深度编码器神经网络和深度解码器神经网络采用级联多个自编码器形成深度自编码器结构，深度自编码器结构通过以下步骤训练：/n步骤301：获取训练数据，训练数据为语音信号经步骤201至步骤204预处理得到；/n步骤302：将训练数据输入深度自编码器神经网络并使其输出误差最小化以获得优化参数；/n其中，优化参数通过最小化下式(1)得到：/n /n其中，n表示训练数据样本的个数，θ＝{W,b}和θ′＝{W^T,b′}分别表示编码器和解码器的参数矩阵，θ^*和θ^′*表示优化后的参数矩阵；x⁽ⁱ⁾为自编码器的输入，z⁽ⁱ⁾＝f′_θ(f_θ(x⁽ⁱ⁾))为自编码器输出，L(x,z)为损失函数，采用如下公式(2)；/nL(x,z)＝E(x,z)+αP(x)(2)/n式(2)中，P(x)为惩罚项，α为惩罚项权重，E(x,z)采用如下公式(3)：/n /nN为向量维度，k为维度下标；/n步骤S303：得到优化后的深度自编码器神经网络并分别作为深度编码器神经网络和深度解码器神经网络，其中，f_θ(x)表示深度编码器神经网络的映射函数，表征输入向量x到编码层表示向量y＝f_θ(x)之间的非线性映射关系，输出y作为编码数据；f′_θ(y)表示深度解码器神经网络的映射函数，表征编码层表示向量y到重建向量z＝f′_θ(y)之间的非线性映射关系，输出z作为解码数据。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江树人学院(浙江树人大学)，未经浙江树人学院(浙江树人大学)许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910775558.X/，转载请声明来源钻瓜专利网。

上一篇：编码方法、编码装置以及记录介质
下一篇：周期性综合包络序列生成装置、方法、记录介质

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度自编码器的语音信号重建方法有效

专利文献下载