[发明专利]一种语音时长规整系统及方法有效

申请号：	201710192687.7	申请日：	2017-03-28
公开（公告）号：	CN107068160B	公开（公告）日：	2020-04-28
发明（设计）人：	陈喆;殷福亮;张鹤鸣	申请（专利权）人：	大连理工大学
主分类号：	G10L21/00	分类号：	G10L21/00;G10L21/04
代理公司：	大连格智知识产权代理有限公司 21238	代理人：	刘晓琴;张亚男
地址：	116024 辽***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音规整系统方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种语音时长规整系统，其特征在于包括：

对输入的语音信号通过自相关函数法进行基音周期计算的基音周期检测单元；

根据基音周期检测单元获取的基音周期大小，将输入的语音信号进行分帧的分帧单元；

根据基音周期检测单元获取的基音周期大小，通过变速系数计算获取语音规整长度的规整长度计算单元；

根据规整长度计算单元计算出的语音规整长度，对分帧单元获取的各帧信号通过正弦分解法改变各帧信号波形的重复长度的时长规整单元；

其中，规整单元进行规整的过程如下：

定义变速系数为α，定义第m帧信号x_m(n₃)规整后的长度为N_L_m，则

其中，L_m为x_m(n₃)的长度，表示与最接近且小于等于的整数；

使用正弦分解法改变信号波形的重复长度，具体过程如下：

其中，

x′_m(n₄)为正弦分解后的第m帧信号，x_m(n₃)为规整前的第m帧信号，L_m为x_m(n₃)的长度；展开项数I_m需要根据x_m(n₃)的特征进行自适应选取，n₄的取值范围需要根据相位连续点的位置选取；

展开项数I_m的自适应选取过程如下：

第m帧信号x_m(n₃)的能量为

x_m(n₃)经正弦分解后的能量为

其中，a₀、a_i、b_i可分别由式(4)～式(6)求出，I为展开项数变量；S为定值，S′的值随I的增加而增加；

经正弦分解后的信号能量与原信号能量比值为

β值随I的增加而增加；I_m应取使β满足条件β0.999999的最小的I值；

寻找相位连续点的过程如下：

定义x_m(p_m)为第m帧信号的相位连续点(x_m(p_m)为序列x_m(n₃)的第p_m+1点，p_m为其序号且p₁＝0)，则式(3)中n₄的取值范围为p_m≤n₄p_m+N_L_m；

首先，计算相位偏离程度：

其中,V(n₃)代表第m帧信号x_m(n₃)中各点相位与点x′_m-1(n₀)相位的偏离程度，点x′_m-1(n₀)为经过规整后的第m-1帧信号序列的最后一点；

n₀＝p_m-1+N_L_m-1-1 (11)

p_m-1为第m-1帧信号相位连续点的序号，N_L_m-1为第m-1帧信号规整后的长度，L_m-1为第m-1帧信号的长度；a_i、b_i可由式(5)、式(6)求出；a_i′、b_i′为第m-1帧信号的展开系数

然后，定位搜索相位连续点：

语音信号具有类周期性，相邻两帧信号波形相似，可以利用前一帧信号最后一点的位置来确定后一帧信号相位连续点的大概位置，以减小搜索范围；定义

start′_m＝(N_L_m％L_m+p_m-1)％L_m-λ*L_m,end′_m＝(N_L_m％L_m+p_m-1)％L_m+λ*L_m

其中，x％y表示x除以y的余数，x，y为不为零的常数；λ为搜索范围系数，取值范围为0≤λ≤0.5，start_m、end_m分别为第m帧信号相位连续点搜索范围的起始点与结束点；则式(10)中n₃的取值范围改为start_m≤n₃≤end_m；

再计算p_m：

V_min＝min{V(start_m),V(start_m+1),…,V(end_m)} (14)

其中，V_min为序列V(n)的最小值，min{}表示大括号内数据的最小值；

若V(Z)＝V_min，start_m≤Z≤end_m，则令p_m＝Z；

最后，得到输出序列：

第m帧信号x_m(n₃)经过正弦分解后的输出为

第m帧信号x_m(n₃)经过时长规整后的实际输出为

y_m(n₇)＝x′_m(n₇+p_m),0≤n₇N_L_m+U (16)

其中，n₇的取值范围多取U点是平滑处理需要，U的取值范围为30≤U≤90。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于大连理工大学，未经大连理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710192687.7/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于音频载体的信息隐藏方法及系统
下一篇：音频处理装置以及音频处理方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种语音时长规整系统及方法有效

专利文献下载