[发明专利]一种语音情绪识别方法及系统在审
| 申请号: | 202010592149.9 | 申请日: | 2020-06-24 |
| 公开(公告)号: | CN111798874A | 公开(公告)日: | 2020-10-20 |
| 发明(设计)人: | 鲁小勇;石代敏;刘阳;原静仪;安海珍;李艳芹;李仁均 | 申请(专利权)人: | 西北师范大学 |
| 主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/45;G10L25/24;G10L25/18;G10L25/30 |
| 代理公司: | 北京劲创知识产权代理事务所(普通合伙) 11589 | 代理人: | 张铁兰 |
| 地址: | 730000 *** | 国省代码: | 甘肃;62 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语音 情绪 识别 方法 系统 | ||
本发明涉及一种语音情绪识别方法及系统,涉及机器学习技术领域。该方法包括:对数据库中的语音样本数据进行预处理、数据扩充和特征选择,得到特征数据;利用特征数据对递归神经网络进行训练,得到递归神经网络模型;递归神经网络模型用于对特征数据进行分类,判断特征数据对应的语音样本数据是否为异常情绪语音样本数据;获取待识别语音数据;对待识别语音数据进行预处理,得到待识别特征数据;将待识别特征数据输入递归神经网络模型,得到待识别语音数据的分类结果。本发明对语音样本数据进行数据扩充,减轻数据分布不均引起的偏差,对语音样本数据进行特征选择能准确的提取出语音的情绪特征,提高了语音情绪识别的准确度。
技术领域
本发明涉及机器学习技术领域,特别是涉及一种语音情绪识别方法及系统。
背景技术
语音和语调表情(Intonation Expression)是表达情绪的重要形式。朗朗笑声表达了愉快的情绪,而呻吟表达了痛苦的情绪。言语是人们沟通思想的工具,同时,语音的高低、强弱和抑扬顿挫等,也是表达说话者情绪的手段。通过语音可以判断和识别说话者的情绪是否异常。消沉的情绪为异常情绪,例如闷闷不乐、悲痛欲绝、木僵、焦虑和运动性激越。语音是一种非侵入式和非侵略式极易获取的信息,可以以更加灵活高效的形式辅助判断说话者的情绪是否正常。
当前,主要有两种方法被采用来判断说话者的情绪是否正常,一种是手动设计的方法,一种是深度学习的方法。手动设计的方法为手动提取语音的声学特征和手动分类,将手动提取的频率特征、倒谱特征、韵律特征和声音质量等声学特征输入到神经网络来进行判断,然后对提取的特征进行分类,但是这种手动提取的方法提取的是低级语音特征,不能充分表征语音特征的更深层次的特征,降低了语音情绪判断的准确度。深度学习的自动语音识别方法也有两种类型,类型一:将原始语音信号作为神经网络的输入;类型二:将手动提取的语音信号特征作为神经网络的输入。基于深度学习的方法比手动设计的方法更有优越性。但是,深度学习对异常情绪语音进行识别的方法存在样本少和样本不平衡的缺点,导致语音情绪判断的准确度低。因此,现有判断语音情绪的方法存在准确度低的问题。
发明内容
本发明的目的是提供一种语音情绪识别方法及系统,解决了现有判断语音情绪的方法存在准确度低的问题。
为实现上述目的,本发明提供了如下方案:
一种语音情绪识别方法,包括:
获取数据库中的语音样本数据;
对所述语音样本数据进行预处理、数据扩充和特征选择,得到特征数据;
利用所述特征数据对递归神经网络进行训练,得到递归神经网络模型;所述递归神经网络模型用于对特征数据进行分类,判断特征数据对应的语音样本数据是否为异常情绪语音样本数据;
获取待识别语音数据;
对所述待识别语音数据进行预处理,得到待识别特征数据;
将所述待识别特征数据输入所述递归神经网络模型,得到待识别语音数据的分类结果。
可选的,所述对所述语音样本数据进行预处理、数据扩充和特征选择,得到特征数据,具体包括:
对所述语音样本数据进行快速傅立叶变换、梅尔滤波和离散余弦变换,得到梅尔频率倒谱系数;
利用条件深度卷积生成对抗网络对所述梅尔频率倒谱系数的数据数量进行扩充,得到扩充数据集;
利用Fisher准则的特征选择方法对所述扩充数据集中的数据进行特征选择,得到特征数据。
可选的,所述对所述语音样本数据进行快速傅立叶变换、梅尔滤波和离散余弦变换,得到梅尔频率倒谱系数,具体包括:
对所述语音样本数据进行预加重处理,得到预加重语音样本数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北师范大学,未经西北师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010592149.9/2.html,转载请声明来源钻瓜专利网。





