[发明专利]基于清浊音实现的语音信号变速方法、装置和音频设备有效
申请号: | 202110452075.3 | 申请日: | 2021-04-26 |
公开(公告)号: | CN113611325B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 方桂萍;肖全之;闫玉凤 | 申请(专利权)人: | 珠海市杰理科技股份有限公司 |
主分类号: | G10L21/043 | 分类号: | G10L21/043;G10L21/0272 |
代理公司: | 深圳市君之泉知识产权代理有限公司 44366 | 代理人: | 程苗 |
地址: | 519075 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 浊音 实现 语音 信号 变速 方法 装置 音频设备 | ||
本发明公开了一种基于清浊音实现的语音信号变速方法、装置和音频设备,其中,所述方法包括:步骤S100,对待变速音频信号帧进行子带分解;步骤S200,对每个子带信号进行分析得到每个子带信号的子带分析结果;步骤S300,通过变速因子对各个子带信号进行相位合成,得到合成相位后的子带集合;其中:当子带信号为清音信号时,将对应子带信号的变速因子确定为定常数1;当子带信号为浊音信号时,将对应子带信号的变速因子确定为与音频节奏和/或词长相关的系数;步骤S400,对合成相位后的子带集合进行子带合成得到变速后的音频信号。从而,实现了区分清、浊音进行分类变速,更贴合人的说话习惯,改善了用户听感的用户体验。
技术领域
本发明涉及音频信号处理技术领域,具体涉及一种基于清浊音实现的语音信号变速方法、装置和音频设备。
背景技术
目前,涉及音频输出的电子产品,尤其涉及音乐播放发的电子产品。音频的播放速度会随着目标速度(播放倍数)进行拉伸缩短变化。比如:复读机,变速耳机,变速音箱等。其人声播放速度会随着背景音乐节拍的变化而变化,当背景音乐节奏感快的时候,人声的单音词长的播放速度会被拉伸或压缩。比如:k歌宝、直播声卡等。
传统方案中,一般通过在软体内嵌变速音效的算法,其通过设置固定的播放倍数,比如:1.5倍、2倍、2.5倍等的方式,进行就近变速匹配,该变速的效果不能实时贴近目标音乐需要的节奏来变化。
对于包含语音的音频信号而言,如果设置过快或过慢,都会导致音频内容听感不自然,严重影响内容的收听体验。经申请人研究发现,导致听感不自然的原因是,在变速处理过程中,当进行拉长音时,会同时将清音和浊音一起拉长,导致合成声音不自然。
因此,针对包含语音的音频信号而言,如何区分清、浊音进行分类变速,以改善用户的听感成为亟待解决的技术问题。
发明内容
基于上述现状,本发明的主要目的在于提供一种基于清浊音实现的语音信号变速方法、装置和音频设备,以针对包含语音的音频信号而言,如何区分清、浊音进行分类变速,以改善用户的听感。
为实现上述目的,本发明采用的技术方案如下:
第一方面,本发明实施例公开了一种基于清浊音实现的语音信号变速方法,包括:
步骤S100,对待变速音频信号帧进行子带分解,得到多个带宽小于预设值的子带信号;
步骤S200,对每个子带信号进行分析得到每个子带信号的子带分析结果,子带分析结果为对应的子带信号为清音信号或浊音信号;
步骤S300,通过变速因子对各个子带信号进行相位合成,得到合成相位后的子带集合;其中:
当子带信号为清音信号时,将对应子带信号的变速因子确定为定常数1;
当子带信号为浊音信号时,将对应子带信号的变速因子确定为与音频节奏和/或词长相关的系数;
步骤S400,对合成相位后的子带集合进行子带合成得到变速后的音频信号。
可选地,步骤S100包括:
利用高通滤波器和低通滤波器构成的二叉树状分解方式对待变速音频信号帧进行子带分解。
可选地,步骤S200包括:
步骤S211,求取2k以内的频线能量平均值与2k以内的幅度谱平均能量值之间的第一比值;
步骤S212,判断第一比值是否小于第一阈值;如果第一比值小于第一阈值,则确定待变速音频信号帧为清音信号,待变速音频信号帧中的各个子带信号为清音信号。
可选地,如果第一比值大于第一阈值,则顺次执行步骤S213、步骤S214;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海市杰理科技股份有限公司,未经珠海市杰理科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110452075.3/2.html,转载请声明来源钻瓜专利网。