[发明专利]基于清浊音实现的语音信号变速方法、装置和音频设备有效
申请号: | 202110452075.3 | 申请日: | 2021-04-26 |
公开(公告)号: | CN113611325B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 方桂萍;肖全之;闫玉凤 | 申请(专利权)人: | 珠海市杰理科技股份有限公司 |
主分类号: | G10L21/043 | 分类号: | G10L21/043;G10L21/0272 |
代理公司: | 深圳市君之泉知识产权代理有限公司 44366 | 代理人: | 程苗 |
地址: | 519075 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 浊音 实现 语音 信号 变速 方法 装置 音频设备 | ||
1.一种基于清浊音实现的语音信号变速方法,其特征在于,包括:
步骤S100,对待变速音频信号帧进行子带分解,得到多个带宽小于预设值的子带信号;
步骤S200,对每个所述子带信号进行分析得到每个子带信号的子带分析结果,所述子带分析结果为对应的子带信号为清音信号或浊音信号;
步骤S300,通过变速因子对各个子带信号进行相位合成,得到合成相位后的子带集合;其中:
当子带信号为清音信号时,将对应子带信号的变速因子确定为定常数1;
当子带信号为浊音信号时,将对应子带信号的变速因子确定为与音频节奏和/或词长相关的系数;
步骤S400,对所述合成相位后的子带集合进行子带合成得到变速后的音频信号。
2.如权利要求1所述的基于清浊音实现的语音信号变速方法,其特征在于,所述步骤S100包括:
利用高通滤波器和低通滤波器构成的二叉树状分解方式对所述待变速音频信号帧进行子带分解。
3.如权利要求1所述的基于清浊音实现的语音信号变速方法,其特征在于,所述步骤S200包括:
步骤S211,求取2k以内的频线能量平均值与2k以内的幅度谱平均能量值之间的第一比值(A1);
步骤S212,判断所述第一比值(A1)是否小于第一阈值;如果所述第一比值(A1)小于第一阈值,则确定所述待变速音频信号帧为清音信号,所述待变速音频信号帧中的各个子带信号为清音信号。
4.如权利要求3所述的基于清浊音实现的语音信号变速方法,其特征在于,如果所述第一比值(A1)大于第一阈值,则顺次执行步骤S213、步骤S214;
步骤S213,求取2k以内的频线能量最大值与2k以内的频线能量平均能值之间的第二比值(A2);
步骤S214,判断所述第二比值(A2)是否小于第二阈值;如果所述第二比值(A2)小于第二阈值,则确定所述待变速音频信号帧为清音信号,所述待变速音频信号帧中的各个子带信号为清音信号。
5.如权利要求4所述的基于清浊音实现的语音信号变速方法,其特征在于,如果所述第二比值(A2)大于第二阈值,则顺次执行步骤S215、步骤S216;
步骤S215,求取第1个子带频线能量平均值与第i个子带幅度谱平均能量值之间的第三比值(A3),其中,2≤i≤N,N为所述待变速音频信号帧被分解的子带数量;
步骤S216,判断所述第三比值(A3)是否小于第三阈值;如果所述第三比值(A3)小于第三阈值,则确定所述待变速音频信号帧为清音信号,所述待变速音频信号帧中的各个子带信号为清音信号。
6.如权利要求5所述的基于清浊音实现的语音信号变速方法,其特征在于,在所述步骤S216中,如果所述第三比值(A3)大于第三阈值,则执行步骤S217;
步骤S217,对i自加1,并顺次执行步骤S215、步骤S216;
当i=N,且各个所述第三比值(A3)大于第三阈值,则确定所述待变速音频信号帧为浊音信号。
7.如权利要求1-6任意一项所述的基于清浊音实现的语音信号变速方法,其特征在于,在所述步骤S300中,当子带信号为浊音信号时,包括:
将上一帧音频信号帧对应频线输出的合成相位与新产生的变化相位相加得到本帧音频信号帧对应频线输出的合成相位。
8.如权利要求7所述的基于清浊音实现的语音信号变速方法,其特征在于,所述新产生的变化相位包括随着上一帧周期拓展的角度外产生的变化角度与变速因子的乘积,以及上一帧到本帧滑动块滑动的相位。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海市杰理科技股份有限公司,未经珠海市杰理科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110452075.3/1.html,转载请声明来源钻瓜专利网。