[发明专利]一种语音情感维度区域的自动识别方法有效

申请号：	201510976875.X	申请日：	2015-12-23
公开（公告）号：	CN105609116B	公开（公告）日：	2019-03-05
发明（设计）人：	黄程韦;赵力;张昕然;余华;杨晶;徐新洲;陶华伟	申请（专利权）人：	东南大学
主分类号：	G10L25/63	分类号：	G10L25/63;G10L25/15;G10L25/24;G10L15/08
代理公司：	南京瑞弘专利商标事务所(普通合伙) 32249	代理人：	严巧巧
地址：	211189 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种语音情感维度区域的自动识别方法，属于语音识别技术领域。我们采用了一种特征空间重构的方法进行分类器的优化。第一，我们提取和优化基本声学特征作为区分情感区域的基准；第二，我们采用特征空间重构的方法将多个情感特征空间分解和配对，分别采用LDA和PCA模块级联的方法，提高目标类之间的离散程度；第三，我们提出两种情感区域的分割方法，即四个区域和十六个区域的分割方法，进行复合情感的分解，取代传统的基本情感类型，通过相关计算来融合分类器输出，进行情感区域的识别，获得了更高的识别效果。
搜索关键词：	一种语音情感维度区域自动识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种语音情感维度区域的自动识别方法，其特征在于：包括顺序执行的以下步骤：步骤一、采集语音信号，将语音信号按照唤醒维度和效价维度所构成的二维空间按照对唤醒维度和效价维度的维度值从负一到正一的取值区间等分成四个或者十六个情感区域；步骤二、对采集到的语音信号提取声学特征，包括短时能量、过零率、基音频率、前四个共振峰频率、十二阶的梅尔倒谱系数6种，并根据共振峰的范围对上述声学特征进行规整化；步骤三、在步骤一中划分得到的每个情感区域上分别随机产生统计区域，所述统计区域的大小满足时间尺寸大于20ms且小于1s，并在统计区域中对步骤二中的规整化后的6种声学特征分别提取最大、最小、平均和标准偏差，构成语音情感特征；步骤四、从步骤一中划分得到的情感区域中随机选出两个情感区域进行配对，得到情感区域对，按照上述方式完成所有两两情感区域的配对，保存配对的次序；采用级联的主成分分析与线性判别分析对每个情感区域对进行特征优化：首先将步骤四中所述组成情感区域对的两个情感区域中的语音情感特征分别输入主成分分析模块，对主成分分析模块输出截取这两个情感区域中各自的前10个特征维度；然后将所截取的这两个情感区域中各自的前10个特征维度输入级联的线性判别分析模块进行优化，线性判别分析模块的输出为上述情感区域对优化的情感区域对特征；步骤五、根据步骤四中得到的优化的情感区域对特征，通过训练数据，为步骤四中所述的每个情感区域对均构造一个两类分类器，计算每个两类分类器的输出；步骤六、采用相关运算，构造解码器，将步骤五中所述的两类分类器的输出与解码器的码本进行相关运算，最大的相关值对应的情感区域，为情感区域分类结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东南大学，未经东南大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510976875.X/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种语音情感维度区域的自动识别方法有效

专利文献下载