[发明专利]利用特征结合对语音情感进行识别的方法及其装置无效

专利信息
申请号: 201310199939.0 申请日: 2013-05-24
公开(公告)号: CN103258537A 公开(公告)日: 2013-08-21
发明(设计)人: 张庆莉;王坤侠;安宁;李廉 申请(专利权)人: 安宁
主分类号: G10L17/26 分类号: G10L17/26;G10L25/63;G10L15/02
代理公司: 安徽汇朴律师事务所 34116 代理人: 方荣肖
地址: 230061 安徽省合肥市包河*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 利用 特征 结合 语音 情感 进行 识别 方法 及其 装置
【说明书】:

技术领域

发明涉及一种对语音情感进行识别的方法及对语音情感进行识别的装置,尤其涉及一种利用特征结合对语音情感进行识别的方法及利用特征结合对语音情感进行识别的装置。 

背景技术

近年来,语音情感识别技术越来越受到学者们的关注。说话人情感的识别可以在很多领域帮助人们,例如在学习方面、情感健康方面,以及其他的一些行为方面。在学习方面,研究者可以通过识别学生的情感来提高电脑辅助学习的质量;在情感健康方面,可以识别语音情感的机器宠物已经投放到市场中,这些机器宠物可以很自然地跟人们进行交流,增加人们对它的喜爱程度,帮助人们排解情感困惑,尤其是对独居老人的帮助是最显著的。 

在此之前也有学者对这一方面有所研究,Atassi, Esposito 和 Smekal 识别柏林语音库中的六种情感,准确率达到80%,但是他们的方法是非常多的特征结合在一起,虽然这种方法准确率高,但是花费的时间比较多。还有研究者利用七种语音特征对柏林语料库的三种不同情感进行识别,准确率达到95.1%,利用这种方法识别的情感,虽然准确率非常高,但是识别的情感种类相对较少。 

综上所述,在现有的语音情感识别计算方面的研究中,主要存在的缺点有如下几点:一是利用非常多的语音特征对语音情感识别,多维的特征组合成的多维矩阵在计算过程中非常复杂,时间消耗也是相对较长的,虽然准确率可能会很高,但是花费的时间太多也是必须要面对的问题;二是利用几个语音特征相结合的方法,识别相对较少的语音情感,这种方法的准确率可能也是不低的,但是识别的情感种类太少,在现实中没有太大的应用价值。 

发明内容

本发明结合现有的技术存在的缺点,提出了一种利用特征结合对语音情感进行识别的方法及其装置,本发明用高斯混合模型结合美尔频率倒谱系数和自相关函数系数的方法,对六种语音情感进行识别,准确率达到74.45%,本发明基本解决了上述两种问题。 

本发明是这样实现的,一种利用特征结合对语音情感进行识别的方法,其基于高斯混合模型结合美尔频率倒谱系数和自相关函数系数,对语音情感进行识别;该方法包括以下步骤: 

一、构建和学习高斯混合模型,高斯混合模型满足公式(1):p(x|λ)=Σi=1Mωibi(x)---(1)]]> ;其中, 是D维随机向量;ωi,i=1……M是混合权重; 是单一高斯密度的组合密度,满足公式(2):bi(x)=1(2π)D/2|Σi|1/2exp{-12(x-μi)Σi-1(x-μi)---(2)]]> ;其中, 是平均值;Σi是协方差矩阵;λ是对参数平均值、协方差矩阵以及权重的总体表达形式,满足公式(3):λ={ωi,μi,Σi}i=1,......,M---(3)]]> ; 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安宁,未经安宁许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310199939.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top