[发明专利]一种语音情绪识别方法及系统在审
| 申请号: | 202010592149.9 | 申请日: | 2020-06-24 |
| 公开(公告)号: | CN111798874A | 公开(公告)日: | 2020-10-20 |
| 发明(设计)人: | 鲁小勇;石代敏;刘阳;原静仪;安海珍;李艳芹;李仁均 | 申请(专利权)人: | 西北师范大学 |
| 主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/45;G10L25/24;G10L25/18;G10L25/30 |
| 代理公司: | 北京劲创知识产权代理事务所(普通合伙) 11589 | 代理人: | 张铁兰 |
| 地址: | 730000 *** | 国省代码: | 甘肃;62 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语音 情绪 识别 方法 系统 | ||
1.一种语音情绪识别方法,其特征在于,包括:
获取数据库中的语音样本数据;
对所述语音样本数据进行预处理、数据扩充和特征选择,得到特征数据;
利用所述特征数据对递归神经网络进行训练,得到递归神经网络模型;所述递归神经网络模型用于对特征数据进行分类,判断特征数据对应的语音样本数据是否为异常情绪语音样本数据;
获取待识别语音数据;
对所述待识别语音数据进行预处理,得到待识别特征数据;
将所述待识别特征数据输入所述递归神经网络模型,得到待识别语音数据的分类结果。
2.根据权利要求1所述的语音情绪识别方法,其特征在于,所述对所述语音样本数据进行预处理、数据扩充和特征选择,得到特征数据,具体包括:
对所述语音样本数据进行快速傅立叶变换、梅尔滤波和离散余弦变换,得到梅尔频率倒谱系数;
利用条件深度卷积生成对抗网络对所述梅尔频率倒谱系数的数据数量进行扩充,得到扩充数据集;
利用Fisher准则的特征选择方法对所述扩充数据集中的数据进行特征选择,得到特征数据。
3.根据权利要求2所述的语音情绪识别方法,其特征在于,所述对所述语音样本数据进行快速傅立叶变换、梅尔滤波和离散余弦变换,得到梅尔频率倒谱系数,具体包括:
对所述语音样本数据进行预加重处理,得到预加重语音样本数据;
对所述预加重语音样本数据进行分帧处理,得到多个语音片段;
对所述语音片段分别进行加窗处理,得到语音波形信号;
对所述语音波形信号进行快速傅立叶变换,得到频谱信号;
对所述频谱信号进行平方值处理,得到语音平方值;
对所述语音平方值进行梅尔滤波处理,得到梅尔频率;
对所述梅尔频率进行取对数处理,得到对数数据;
对所述对数数据进行离散余弦变换,得到动态特征值;
将所述动态特征值转换为特征向量,得到梅尔频率倒谱系数。
4.根据权利要求2所述的语音情绪识别方法,其特征在于,所述利用条件深度卷积生成对抗网络对所述梅尔频率倒谱系数的数据数量进行扩充,得到扩充数据集,具体包括:
获取条件深度卷积生成对抗网络的生成网络的生成约束条件;
将所述生成约束条件和所述梅尔频率倒谱系数输入所述生成网络,得到生成数据;
将所述生成数据和所述梅尔频率倒谱系数输入所述条件深度卷积生成对抗网络的判别网络,得到扩充数据;
将所述扩充数据与所述梅尔频率倒谱系数组成扩充数据集。
5.根据权利要求1所述的语音情绪识别方法,其特征在于,所述对所述待识别语音数据进行预处理,得到待识别特征数据,具体包括:
对所述待识别语音数据进行快速傅立叶变换、梅尔滤波和离散余弦变换,得到待识别梅尔频率倒谱系数;
利用Fisher准则的特征选择方法对所述待识别梅尔频率倒谱系数进行特征选择,得到待识别特征数据。
6.一种语音情绪识别系统,其特征在于,包括:
第一获取模块,用于获取数据库中的语音样本数据;
特征数据获取模块,用于对所述语音样本数据进行预处理、数据扩充和特征选择,得到特征数据;
递归神经网络训练模块,用于利用所述特征数据对递归神经网络进行训练,得到递归神经网络模型;所述递归神经网络模型用于对特征数据进行分类,判断特征数据对应的语音样本数据是否为异常情绪语音样本数据;
第二获取模块,用于获取待识别语音数据;
待识别特征数据获取模块,用于对所述待识别语音数据进行预处理,得到待识别特征数据;
分类结果获取模块,用于将所述待识别特征数据输入所述递归神经网络模型,得到待识别语音数据的分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北师范大学,未经西北师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010592149.9/1.html,转载请声明来源钻瓜专利网。





