[发明专利]一种语音时长规整系统及方法有效
申请号: | 201710192687.7 | 申请日: | 2017-03-28 |
公开(公告)号: | CN107068160B | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 陈喆;殷福亮;张鹤鸣 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G10L21/00 | 分类号: | G10L21/00;G10L21/04 |
代理公司: | 大连格智知识产权代理有限公司 21238 | 代理人: | 刘晓琴;张亚男 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 规整 系统 方法 | ||
本发明公开了一种语音时长规整系统,包括:对输入的语音信号通过自相关函数法进行基音周期计算的基音周期检测单元;依据基音周期将输入的语音信号进行分帧的分帧单元;通过变速系数及基音周期计算获取各帧语音信号规整长度的规整长度计算单元;对分帧单元获取的各帧信号通过正弦分解法改变各帧信号波形的重复长度的时长规整单元;对时长规整单元规整后的语音信号进行信号波形平滑处理的平滑处理单元。本系统通过当前帧语音信号的特点动态计算展开项数,大幅减少了运算量和噪声,改善了输出语音的质量。有效的解决了规整后相邻帧信号相位不连续问题。另外,采用了定位搜索算法寻找相位连续点,大大减小了搜索范围,进而大幅减少了运算量。
技术领域
本发明涉及一种语音时长规整系统及方法。
背景技术
语音时长规整是一种通过压缩或者扩展语音长度从而改变语音播放速度的技术。在进行时域压缩或扩展的同时,应尽量保持语音信号的基音频率、音色、语义等特性不变。经过时长规整后的语音听起来就像说话人自己在改变说话速度一样。语音时长规整广泛应用于语音压缩、语言教学、影视制作以及人机交互等领域,研究语音时长规整对现代化及信息化发展意义重大。
专利号为ZL200610164672.1的“语音变速的方法”发明专利中提出了一种语音规整方法。该方法包含下列步骤:接收原始语音信号;计算出该原始语音信号的基音周期;依据该基音周期定义搜寻范围;在该原始语音信号的每个该搜寻范围内寻找最大值;依据该最大值将该原始语音信号划分为多个语音区段;依据变速指令对该原始语音信号的每个该语音区段进行变速运算,而取得变速语音信号。该方法在做变速运算时采用波形叠加法,即将各语音区段乘以一比重函数,在变速指令为加速时,两语音区段叠加后取代原两段语音区段,使得变速语音信号短于原语音信号;在变速指令为减速时,两语音区段叠加后插入原两段语音区段之间,使得变速语音信号长于原语音信号。在做变速运算时,将相邻两语音区段乘以比重函数后直接叠加,没有考虑相位连续性问题,影响了输出语音质量。同时,由于各语音区段长度一般并不相同,使得规整比例的精度达不到预期效果。
发明内容
本发明针对现有技术存在的:①在做规整处理时没有考虑相位连续性问题,或者相位连续处理效果不佳,导致输出语音质量较差;②采用波形叠加法,对语音信号统一规整而不考虑其感知特性,导致语音转折区的模糊或者信息丢失,并且在采样率较低或规整比例较大时,输出语音质量严重下降等问题而研发一种语音时长规整系统及方法。具体技术方案如下:
一种语音时长规整系统,其特征在于包括:
对输入的语音信号通过自相关函数法进行基音周期计算的基音周期检测单元;
根据基音周期检测单元获取的基音周期大小,将输入的语音信号进行分帧的分帧单元;
根据基音周期检测单元获取的基音周期大小,通过变速系数计算获取语音规整长度的规整长度计算单元;
根据规整长度计算单元计算出的语音规整长度,对分帧单元获取的各帧信号通过正弦分解法改变各帧信号波形的重复长度的时长规整单元。
还包括:对时长规整单元规整后的语音信号进行信号波形平滑处理的平滑处理单元;
所述平滑处理单元通过渐变法或重叠相加法进行信号波形平滑处理。
基音周期检测单元进行基音检测的过程如下:
定义x(im)为输入语音信号的第im+1个数据,假设x(im)为第m帧信号的第一点,即x(im)点前的语音信号均已分帧完毕;定义长度为N的序列r(n2),0≤n2<N,令r(n2)=x(im+n2-N/2);N为设定值,即N=1440;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710192687.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于音频载体的信息隐藏方法及系统
- 下一篇:音频处理装置以及音频处理方法