[发明专利]一种语音信号变换方法、装置、设备和存储介质有效
申请号: | 201811628761.6 | 申请日: | 2018-12-28 |
公开(公告)号: | CN111383646B | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 吴晓婕 | 申请(专利权)人: | 广州市百果园信息技术有限公司 |
主分类号: | G10L21/013 | 分类号: | G10L21/013 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 511400 广东省广州市番禺区南村镇万博*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 信号 变换 方法 装置 设备 存储 介质 | ||
本发明公开了一种语音信号变换方法、装置、设备和存储介质。其中,该方法包括:分别对原始语音信号和由原始语音信号变调得到的初始目标语音信号分段后进行傅里叶变换,得到分段原始频域信号和分段目标频域信号;通过原始分段窗函数对分段原始频域信号滤波,得到对应的原始共振峰包络,以及,通过目标分段窗函数对分段目标频域信号滤波,得到对应的目标共振峰包络;根据分段目标频域信号、原始共振峰包络和目标共振峰包络,确定变调语音信号。本发明实施例提供的技术方案,消除目标共振峰包络对变调的影响,使得变调前后具备相同的共振峰包络,从而保证变调前后的语音信号中声音特征的一致性,提高变调语音信号的语音质量。
技术领域
本发明实施例涉及语音识别技术领域,尤其涉及一种语音信号变换方法、装置、设备和存储介质。
背景技术
随着互联网技术的快速发展,一种通过声音变调算法(Pitch Shift)对原始语音进行音调变化的娱乐软件开始广泛的应用到人们的日常生活中,通过播放变调后的语音为用户提供一种新型的娱乐放松方式,如对某一歌唱家的原始录音进行修音时,会对存在瑕疵的声音进行变调,使得歌曲更加完美。
在通过声音变调算法处理原始语音时,虽然达到了调节音调的目的,但是可能会使该语音用户的声音特征发生改变,使得播放的语音与该语音用户的实际声音存在较大的差别,如将一个男音信号调高4个半音时,会导致听起来像一个女生的声音,存在一定的声音误差。
目前通常采用固定长度的窗函数,直接对变调前后的语音信号的共振峰包络进行处理,由于不同语音信号中的共振峰位置和变化情况也相应不同,此时会使得求取的共振峰包络存在一定误差,导致最终得到的语音信号质量较差。
发明内容
本发明实施例提供了一种语音信号变换方法、装置、设备和存储介质,在对原始语音信号进行变调的基础上,保证变调前后的语音信号中声音特征的一致性,提高变调语音信号的质量。
第一方面,本发明实施例提供了一种语音信号变换方法,该方法包括:
分别对原始语音信号和由原始语音信号变调得到的初始目标语音信号分段后进行傅里叶变换,得到分段原始频域信号和分段目标频域信号;
通过原始分段窗函数对分段原始频域信号滤波,得到对应的原始共振峰包络,以及,通过目标分段窗函数对分段目标频域信号滤波,得到对应的目标共振峰包络,所述原始分段窗函数根据所述分段原始频域信号的基频和分段比例确定,所述目标分段窗函数根据所述分段目标频域信号的基频和分段比例确定;
根据分段目标频域信号、原始共振峰包络和目标共振峰包络,确定变调语音信号。
进一步的,所述语音信号变换方法,还包括:
获取变调幅度;
根据所述变调幅度对所述原始语音信号变调,得到初始目标语音信号。
进一步的,所述分段目标频域信号的基频为所述分段原始频域信号的基频与所述变调幅度的乘积。
进一步的,在通过原始分段窗函数对分段原始频域信号滤波之前,还包括:
如果当前分段原始频域信号中携带基频,则携带的基频作为当前分段原始频域信号的基频;
如果当前分段原始频域信号中未携带基频,则根据前一分段原始频域信号的基频和后一分段原始频域信号的基频,确定当前分段原始频域信号的基频。
进一步的,所述根据前一分段原始频域信号的基频和后一分段原始频域信号的基频,确定当前分段原始频域信号的基频,包括:
通过插值算法计算前一分段原始频域信号的基频和后一分段原始频域信号的基频,得到当前分段原始频域信号的基频。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市百果园信息技术有限公司,未经广州市百果园信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811628761.6/2.html,转载请声明来源钻瓜专利网。