[发明专利]一种基于说话人惩罚的独立于说话人语音情感识别方法有效

专利信息
申请号: 201410078383.4 申请日: 2014-03-05
公开(公告)号: CN103854645A 公开(公告)日: 2014-06-11
发明(设计)人: 郑文明;徐新洲;赵力;黄程韦;余华;吴尘;查诚 申请(专利权)人: 东南大学
主分类号: G10L15/08 分类号: G10L15/08;G10L21/003;G10L25/63
代理公司: 南京瑞弘专利商标事务所(普通合伙) 32249 代理人: 杨晓玲
地址: 211189 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于说话人惩罚的独立于说话人语音情感识别方法,对语音信号样本依次进行预处理、语音情感原始特征提取、维数约简、分类器分类判决。其中在维数约简阶段,使用了基于说话人惩罚的图嵌入学习方法,利用说话人标签信息,分别针对属于同一类情感类别但说话人不同,以及属于同一说话人但分属于不同情感类别的语音信号样本对,在图嵌入理论的基础上利用已有理论,进行组合优化运算。与现有方法相比,本发明的方法在独立于说话人的语音情感识别中,能够有效地提升系统的识别性能。
搜索关键词: 一种 基于 说话 惩罚 立于 人语 情感 识别 方法
【主权项】:
1.一种基于说话人惩罚的独立于说话人语音情感识别方法,其特征在于:将语音情感数据库中若干个语音样本按照不同说话人划分为训练样本集和测试样本集,且训练集中任一样本所属的说话人在测试集中不出现,其中每个语音样本均具有语音情感标签信息和说话人标签信息,包括顺序执行的以下步骤:步骤一,语音样本预处理:对语音样本进行预加重,然后对预加重后的语音样本的时域信号进行分帧;步骤二,语音情感特征提取:对经步骤一处理后的每个语音样本,分别提取其能量、基音、过零率、时长、共振峰和Mel频率倒谱系数共6大类语音情感特征组成每个语音样本的原始语音情感特征向量;对所述6大类语音情感特征的每一维特征进行规整化处理后组成每个语音样本的规整化语音情感特征向量;步骤三,特征筛选:使用训练样本语音情感标签信息,对步骤二中得到的规整化语音情感特征向量中每个特征维数的FDR值进行特征筛选,去除规整化语音情感特征向量中对语音情感分析贡献较小的特征,得到每个语音样本的特征筛选后语音情感特征向量;步骤四,基于说话人惩罚的特征维数约简:经步骤三特征筛选得到训练样本特征筛选后语音情感特征向量集X=[x1,x2,...,xN],利用训练样本的语音情感标签信息和说话人标签信息,采用LSPGL算法或KSPGL算法对X进行维数约简训练,生成LSPGL算法对应的线性降维投影矩阵A或KSPGL算法对应的核方法降维映射阵Ρ,同时分别求解得到X的线性映射低维样本集ATX或核映射低维样本集PTK,其中K为训练样本集的Gram阵,选用Gauss核函数;步骤五,训练分类器:对多类SVM分类器进行训练或直接选取1NN分类器;其中多类SVM分类器进行训练的方法为:设训练样本集中有N个分属于Nc个种类的语音样本,在训练样本集中任取两个种类的语音样本,进行训练得到1个两类SVM分类器,每两类重复该训练过程,共得到Nc(Nc-1)/2个两类SVM分类器;步骤六,测试:对于每个测试样本,使用经步骤五训练完成的分类器对每个测试样本进行测试,具体包括顺序执行的以下步骤:(1)对经步骤三得到的每个测试样本的特征筛选后语音情感特征向量使用线性降维投影矩阵A或核方法降维映射阵P进行维数约简,得到经过线性维数约简后的低维样本或经过核方法维数约简后的低维样本PTKi,对于一个测试样本Ki=[K(xitest,x1),K(xitest,x2),...,K(xitest,xN)]T,]]>Gram阵K中的核函数选用步骤四中所述的Gauss核函数;(2)使用分类器对或PTKi进行分类,选择多类SVM分类器或者1NN分类器进行分类:利用多类SVM分类器分类的方法为:将每个测试样本的低维样本或PTKi经所有得到的两类SVM分类器分类之后得到Nc(Nc-1)/2个判断结果,得票最多的判断结果即判决为对应的测试样本所属的情感类别;若出现相同最多票数,则仅选择由最多票数所对应的情感类别两两组成的两类SVM分类器重新对该测试样本的低维样本进行判断,得到新一轮判断结果,上述方法依次递减两类SVM分类器的个数直到得到一个唯一的最多票数即判决为对应测试样本所属的情感类别;如一个测试样本的低维样本按此过程仍有相同最大票数的类别判决时,则在这几类中随机决定对应测试样本的类别;利用1NN分类器分类的方法为:对于每一个测试样本,在全体训练样本中找到与其欧式距离最近的训练样本,使用该训练样本对应的类别标签作为该测试样本的分类判决结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410078383.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top