[发明专利]语音信号重建方法、装置、设备和存储介质有效
| 申请号: | 201911418438.0 | 申请日: | 2019-12-31 |
| 公开(公告)号: | CN111128230B | 公开(公告)日: | 2022-03-04 |
| 发明(设计)人: | 吴晓婕;崔智语 | 申请(专利权)人: | 广州市百果园信息技术有限公司 |
| 主分类号: | G10L25/18 | 分类号: | G10L25/18;G10L25/30;G10L25/03 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 511400 广东省广州市番*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 信号 重建 方法 装置 设备 存储 介质 | ||
本发明实施例公开了一种语音信号重建方法、装置、设备和存储介质,语音信号重建方法包括:根据语音信号的原始幅度谱确定初始相位谱;采用原始幅度谱和初始相位谱构建第一频谱;对第一频谱进行傅里叶逆变换和傅里叶变换迭代得到第二频谱;根据第二频谱和原始幅度谱判断是否停止对第一频谱进行迭代;若是,根据第二频谱的相位谱和原始幅度谱重建语音信号;若否,将第二频谱的相位谱确定为初始相位谱以构建第一频谱重新进行迭代。相对于随机化初始相位谱和以迭代次数达到总迭代次数为停止迭代条件,减少了迭代运算的次数,降低了运算耗时,同时迭代后的相位谱更接近真实值,提高了相位谱的准确度,通过相位谱和原始幅度谱能够重建高质量的语音信号。
技术领域
本发明实施例涉及信号处理技术领域,尤其涉及一种语音信号重建方法、语音信号重建装置、设备和存储介质。
背景技术
在语音信号应用领域中,语音频谱图以其包含原始语音特征信息丰富等优势被选为现代语音功能系统的输入,而在语音信号重建中,语音信号的幅度谱和相位谱需要被获得以构成语音信号的频谱图。
在实际应用中,由于人们更多关注语音信号的幅度谱,出现了只能获得语音信号的幅度谱来重建语音信号的需求。Griffin-Lim算法以其原理清晰、实现简单的优势成为实现上述功能使用最广的传统信号处理算法。
Griffin-Lim算法在已获得幅度谱的情况下,随机初始化相位,以初始相位和幅度谱进行迭代计算实现语音信号重建,而每次迭代需分别计算一次正反傅里叶变换,停止迭代条件为迭代次数达到设置的总迭代次数,导致Griffin-Lim算法耗时较大,且由于相位的重建完全依靠迭代去更新生成新的语音信号使其与目标语音信号在范数约束层面的距离最小,导致重建后的语音信号的音质往往较差。
发明内容
本发明实施例提供一种语音信号重建方法、语音信号重建装置、设备和存储介质,以解决现有技术中语音信号重建前随机化初始相位后设定停止迭代条件为迭代次数达到总次数造成耗时长和准确度差的问题。
第一方面,本发明实施例提供了一种语音信号重建方法,包括:
根据语音信号的原始幅度谱确定所述语音信号的初始相位谱;
采用所述原始幅度谱和所述初始相位谱构建第一频谱;
对所述第一频谱进行傅里叶逆变换和傅里叶变换迭代得到第二频谱;
根据所述第二频谱和所述原始幅度谱判断是否停止对所述第一频谱进行迭代;
若是,根据所述第二频谱的相位谱和所述原始幅度谱重建所述语音信号;
若否,将所述第二频谱的相位谱确定为所述初始相位谱,返回采用所述原始幅度谱和所述初始相位谱构建第一频谱的步骤。
第二方面,本发明实施例提供了一种语音信号重建装置,包括:
初始相位谱确定模块,用于根据语音信号的原始幅度谱确定所述语音信号的初始相位谱;
第一频谱构建模块,用于采用所述原始幅度谱和所述初始相位谱构建第一频谱;
迭代模块,用于对所述第一频谱进行傅里叶逆变换和傅里叶变换迭代得到第二频谱;
停止迭代判断模块,用于根据所述第二频谱和所述原始幅度谱判断是否停止对所述第一频谱进行迭代;
语音信号重建模块,用于根据所述第二频谱的相位谱和所述原始幅度谱重建所述语音信号;
初始相位谱更新模块,用于将所述第二频谱的相位谱确定为所述初始相位谱,返回第一频谱构建模块。
第三方面,本发明实施例提供了一种设备,所述设备包括:
一个或多个处理器;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市百果园信息技术有限公司,未经广州市百果园信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911418438.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电子设备
- 下一篇:一种轧机入口导板装置





