[发明专利]一种基于模糊支持向量机的语音情感识别方法在审

申请号：	201410331505.6	申请日：	2014-07-11
公开（公告）号：	CN104091602A	公开（公告）日：	2014-10-08
发明（设计）人：	周代英;谭发曾;贾继超;田兵兵;寥阔	申请（专利权）人：	电子科技大学
主分类号：	G10L25/63	分类号：	G10L25/63;G10L17/02;G10L15/06;G10L17/04
代理公司：	成都宏顺专利代理事务所(普通合伙) 51227	代理人：	李玉兴
地址：	611731 四川省成***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于模糊支持向量语音情感识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及语音情感识别技术，具体的说是涉及一种基于模糊支持向量机的语音情感识别方法。

背景技术

专家已经从生理和心理两个领域对情感研究了很长一段时间，随着人工智能的快速发展，人机交互中的情感研究引起了广大专家的极大兴趣。在人机交互中，希望人类跟机器能更自然的进行交流，这就需要机器能够理解人类的情感，所以机器对情感的分类识别显得尤其重要了。在人类交流中，语音包含了丰富的信息，所以机器可以通过语音对情感进行分类识别。专家们对语音情感分类识别已经进行了大量的研究和分析，一般包括语音情感库的建立、情感特征提取、分类识别方法的研究。前人为了提高语音情感的识别率，对每一个环节都进行了改进研究，但没有形成一个统一的系统，识别率也不是很高。前人用梅尔倒谱系数(MFCC)作为识别特征，但在识别之前没有对此特征做进一步处理，这就会出现很多冗余的信息影响识别效果。前人在使用分类器的时候发现噪声或孤立点对识别率影响特别大，为了消除这种影响提高识别率，选择一个合适的分类器成了研究的重点。为了提高语音情感识别率，对情感特征作适当处理和选择合适的分类方法尤其重要。

发明内容

本发明所要解决的，就是针对传统技术存在的问题，提出一种基于模糊支持向量机的语音情感识别方法。

本发明解决上述技术问题所采用的技术方案是：一种基于模糊支持向量机的语音情感识别方法，其特征在于，包括以下步骤：

a.对输入的语音信号预处理；所述预处理包括预加重滤波和加窗分帧，其中预加重滤波的预加重系数α为0.97，加窗分帧的帧长为30ms；

b.提取处理后的语音信号的特征信息；所述特征信息为梅尔倒普系数(MFCC)；其中，特征信息为26维，包括13维梅尔倒普系数以及13维由梅尔倒普系数推导出的一阶差分倒普系数；

c.对提取的梅尔倒普系数进行降维处理；所述降维处理具体为采用核主成份分析(KPCA)进行降维；KPCA的处理过程如下：

c1.将所获得的n个指标(每一指标有m个样品)的一批数据写成一个(m×n)维数据矩阵

c2.计算核矩阵，先选定高斯径向核函数中的参数，再由式K_μν:＝(Φ(x_μ)·Φ(x_ν))，计算核矩阵K；

c3.通过Kμv→Kμv-1M(Σw=1MKμw+Σw=1MKwv)+1M2Σw,τ=1MKwτ]]>修正核矩阵得到KL；