[发明专利]一种基于特征融合与集成学习的语音情感分类方法有效
申请号: | 202110209708.8 | 申请日: | 2021-02-25 |
公开(公告)号: | CN112861984B | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 郭奕;熊雪军;徐亮;黄永茂;卿朝进;黄文韬 | 申请(专利权)人: | 西华大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/20;G10L25/63 |
代理公司: | 北京正华智诚专利代理事务所(普通合伙) 11870 | 代理人: | 杨浩林 |
地址: | 610039 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 融合 集成 学习 语音 情感 分类 方法 | ||
1.一种基于特征融合与集成学习的语音情感分类方法,其特征在于,包括以下步骤:
S1、采集若干语音数据,并对语音数据进行预处理;
S2、对预处理后的数据进行特征提取,并构建特征集;
S3、采用多分类器构建集成学习分类模型,并对集成学习分类模型进行训练;
S4、采用训练后的集成学习分类模型对待识别语音数据对应特征集进行识别,获取分类结果,得到语音情感分类结果;
所述步骤S2具体为:
S2.1、对预处理后的数据进行特征提取,得到若干特征;
S2.2、将若干特征组成若干维的特征向量;
S2.3、基于已训练的LightGBM模型,获取特征向量中每个特征的重要性,并按重要性将特征进行降序排序;
S2.3、获取特征重要度平均值,并将重要性低于平均值的特征滤除;
S2.4、采用序列前向算法选择最优特征子集,完成特征集的构建;
所述步骤S2.1中特征包括特征1至特征809;
所述特征1-8具体为:短时能量及其一阶差分的均值、方差、最大值以及最小值;
特征9-14具体为:声音强度及其一阶差分的均值、方差以及最大值;
特征15具体为:平均语速;
特征16-23具体为:基音频率及其一阶差分的均值、方差、最大值以及最小值;
特征24-53具体为:第一、第二、第三共振峰频率及其一阶差分的均值、方差、最大值、最小值以及中值;
特征54-137具体为:1-12阶梅尔倒谱系数MFCC的均值、方差、最大值、最小值、中值、极差以及和;
特征138-221具体为:1-12阶伽马倒谱系数GFCC的均值、方差、最大值、最小值、中值、极差以及和;
特征222-305具体为:1-12阶巴克倒谱系数BFCC的均值、方差、最大值、最小值、中值、极差以及和;
特征306-389具体为:1-12阶线性预测系数LPC的均值、方差、最大值、最小值、中值、极差以及和;
特征390-473具体为:1-12阶线性预测倒谱系数LPCC的均值、方差、最大值、最小值、中值、极差以及和;
特征474-557具体为:1-12阶标准化伽马啁啾倒谱系数NGCC的均值、方差、最大值、最小值、中值、极差以及和;
特征558-641具体为:1-12阶基于幅度的谱根倒谱系数MSRCC的均值、方差、最大值、最小值、中值、极差以及和;
特征642-725具体为:1-12阶基于相位的谱根倒谱系数PSRCC的均值、方差、最大值、最小值、中值、极差以及和;
特征726-809具体为:1-12阶线性频率倒谱系数LFCC的均值、方差、最大值、最小值、中值、极差以及和。
2.根据权利要求1所述的基于特征融合与集成学习的语音情感分类方法,其特征在于,所述步骤S1中对语音数据进行预处理具体包括预加重、消除趋势项、端点处理、分帧处理以及加窗处理。
3.根据权利要求1所述的基于特征融合与集成学习的语音情感分类方法,其特征在于,所述步骤S3中集成学习分类模型中分类器包括支持向量机SVM、K邻近算法、XGBoost算法和LightGBM算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西华大学,未经西华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110209708.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:移动式恒压密封性检测系统
- 下一篇:一种具备三合一复合弹簧结构的断路器