[发明专利]一种基于动态分割逆离散余弦变换倒谱系数的音声特征提取算法有效

申请号：	201910087494.4	申请日：	2019-01-29
公开（公告）号：	CN109767756B	公开（公告）日：	2021-07-16
发明（设计）人：	左毅;马赫;李铁山;贺培超;刘君霞;艾佳琪;肖杨;于仁海	申请（专利权）人：	大连海事大学
主分类号：	G10L15/02	分类号：	G10L15/02;G10L25/24;G10L25/27
代理公司：	大连东方专利代理有限责任公司 21212	代理人：	陈丽;王思宇
地址：	116026 辽***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于动态分割离散余弦变换谱系特征提取算法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于动态分割逆离散余弦变换倒谱系数的音声特征提取算法，其特征在于如下步骤：

S1、对m个人的音声信号进行预处理：

对m个人的音声信号依次进行预加重、分帧和加窗处理；

所述预加重通过数字滤波器实现，具体过程通过以下公式进行：

Y(n)＝X(n)-aX(n-l)；

其中，Y(n)是预加重后的输出信号，X(n)输入的音声信号，a为预加重系数，n为时刻；所述分帧为将所述预加重后的输出信号分段为20ms一帧；

S2、对预处理后的m个人的音声信号进行从时域到频域的变换形式处理：

预处理后的m个人的音声信号转换成频域，即将预处理后的m个人的音声信号从时域卷积转换为频域谱乘法形式，对其取对数，得到的分量以相加形式表示，得到m个人的逆离散余弦变换倒谱系数，具体过程通过以下公式进行

C(q)＝IDCTlog|DCT{x(k)}|；

其中，DCT和IDCT分别是离散余弦变换和逆离散余弦变换，x(k)为输入音声信号，即预处理后的m个人的音声信号，C(q)为输出语音信号，即m个人的逆离散余弦变换倒谱系数；

S3、利用分层聚类分析算法，计算步骤S2得到的m个人的逆离散余弦变换倒谱系数之间的相似度，并把相似度最大的相邻两列依次合并；迭代以上过程，直至聚类至24列，得到的动态分割逆离散余弦变换倒谱系数即为m个人的音声特征；具体步骤如下：

矩阵A代表步骤S2求得的m个人n维的逆离散余弦变换倒谱系数，把逆离散余弦变换倒谱系数的每一维向量V₁，V₂…V_n看成n类，求得V_i和V_j的欧式距离为

下面为聚类分析的具体步骤：

第一次聚类：

l₁＝Dis(V₁,V₂)

l₂＝Dis(V₂,V₃)

…

l_n-1＝Dis(V_n-1,V_n)

如果i＝arg min(l₁,l₂,l₃…l_n-1),则聚类结果为

(V₁),(V₂),…(V_i+V_i+1),…(V_n)即

更新：

l_i-1＝Dis(V_i-1,(V_i+V_i+1))

l_i＝Dis((V_i+V_i+1),V_i+2)

l_i+1＝l_i+2

…

l_n-1＝l_n-2

Delete l_n-1

第二次聚类：

如果j＝arg min(l₁,l₂,l₃…l_n-2),则聚类结果为

(V₁),(V₂),…(V_i+V_i+1),…(V_j+V_j+1),…(V_n)即

再次更新：

l_j-1＝Dis(V_j-1,(V_j+V_j+1))

l_j＝Dis((V_j+V_j+1),V_j+2)

l_j+1＝l_j+2

…

l_n-3＝l_n-2

Delete l_n-2

以此类推进行层次聚类直至最后聚类结果为24列，得到动态分割逆离散余弦变换倒谱系数即为音声特征。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于大连海事大学，未经大连海事大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910087494.4/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于动态分割逆离散余弦变换倒谱系数的音声特征提取算法有效

专利文献下载