[发明专利]一种语音情感维度区域的自动识别方法有效
| 申请号: | 201510976875.X | 申请日: | 2015-12-23 |
| 公开(公告)号: | CN105609116B | 公开(公告)日: | 2019-03-05 |
| 发明(设计)人: | 黄程韦;赵力;张昕然;余华;杨晶;徐新洲;陶华伟 | 申请(专利权)人: | 东南大学 |
| 主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/15;G10L25/24;G10L15/08 |
| 代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 严巧巧 |
| 地址: | 211189 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语音 情感 维度 区域 自动识别 方法 | ||
本发明公开了一种语音情感维度区域的自动识别方法,属于语音识别技术领域。我们采用了一种特征空间重构的方法进行分类器的优化。第一,我们提取和优化基本声学特征作为区分情感区域的基准;第二,我们采用特征空间重构的方法将多个情感特征空间分解和配对,分别采用LDA和PCA模块级联的方法,提高目标类之间的离散程度;第三,我们提出两种情感区域的分割方法,即四个区域和十六个区域的分割方法,进行复合情感的分解,取代传统的基本情感类型,通过相关计算来融合分类器输出,进行情感区域的识别,获得了更高的识别效果。
技术领域
本发明涉及语音识别技术领域,特别是一种语音情感维度区域的自动识别方法。
背景技术
传统的语音情感识别集中在基本情感类别的分析上,例如喜、怒、惊、悲等,对情感的维度很难进行有效识别。传统的情感分类器主要用于离散情感模型,在使用之前,必须对目标的情感的数量和类型做一个假设。目前在实验室环境下,获得了成功的应用,但对于许多实际的情感识别应用时需要自动识别特定类别的情感,传统的方法一般很难估计什么类型的情绪可能发生,从而导致无法识别或错误识别,因此无法处理复杂的人类情感。
目前,对情感维度的辨识可以分为唤醒维度的辨识和效价维度的辨识。目前基于情感维度的语音情感识别方法,直接对维度值进行准确的估计,如唤醒维度的具体数值,这样的方法在实际中受到噪声等多种因素的干扰,准确度较低。因此直接对这两个维度进行精确的识别是非常困难的,并且由于唤醒维度和效价维度不能直接对应到实际的情感类别上,因此单纯的维度识别的实际意义并不明确。
发明内容
发明目的:为了克服现有技术中存在的不足,本发明提供一种语音情感维度区域的自动识别方法,用于解决现有的语音情感识别方法无法对任意情感进行有效识别的技术问题。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种语音情感维度区域的自动识别方法,包括顺序执行的以下步骤:
步骤一、采集语音信号,将语音信号按照唤醒维度和效价维度所构成的二维空间按照对唤醒维度和效价维度的维度值从负一到正一的取值区间等分成四个或者十六个情感区域;这里维度值的正负与情感的积极度有关,一般维度值的正区域为积极,维度值的负区域为消极;划分的区间越多,情感越细分。
步骤二、对采集到的语音信号提取声学特征,包括短时能量、过零率、基音频率、前四个共振峰频率、十二阶的梅尔倒谱系数6种,并根据共振峰的范围对上述声学特征进行规整化;规整化时按照频段分段进行,共振峰分度区域类别根据实际文本语义的差异情况进行确定,将共振峰频率段划分为0-2000、2000-3000、3000-5000等三个频段,以消除文本差异的干扰。
步骤三、在步骤一中划分得到的每个情感区域上分别随机产生统计区域,所述统计区域的大小满足时间尺寸大于20ms且小于1s,并在统计区域中对步骤二中的规整化后的6种情感特征分别提取最大、最小、平均和标准偏差,构成语音情感特征。
步骤四、对唤醒维度和效价维度构成的维度空间进行分解,从步骤一中划分得到的情感区域中随机选出两个区域进行配对,得到情感区域对,按照上述方式完成所有两两情感区域的配对,保存配对的次序;采用级联的主成分分析与线性判别分析对步骤三中所述语音情感特征,在每个情感区域对上,进行特征优化:
首先将步骤三中所述组成情感区域对的两个情感区域中的语音情感特征分别输入主成分分析模块,对主成分分析模块输出截取这两个情感区域中各自的前10个特征维度;然后将所截取的这两个情感区域中各自的前10个特征维度输入级联的线性判别分析模块进行优化,线性判别分析模块的输出为上述情感区域对优化的情感区域对特征,是用于区分该情感区域对中的两个情感区域最优的特征;
步骤五、根据步骤四中得到的最佳语音情感特征,通过训练数据,为步骤四中所述的每个情感区域对均构造一个两类分类器,计算每个两类分类器的输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510976875.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种空中字幕图案烟花的发射装置
- 下一篇:智能铺砖机





