[发明专利]语音情绪识别方法、装置、计算机设备和存储介质有效
| 申请号: | 202110352926.7 | 申请日: | 2021-03-31 |
| 公开(公告)号: | CN112735479B | 公开(公告)日: | 2021-07-06 |
| 发明(设计)人: | 李鹏;黄文琦;梁凌宇;唐国亮;衡星辰;林志达 | 申请(专利权)人: | 南方电网数字电网研究院有限公司 |
| 主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L15/02;G10L15/06;G10L15/16 |
| 代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 卢晓霞 |
| 地址: | 510700 广东省广州市黄*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 情绪 识别 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种语音情绪识别方法、装置、计算机设备和存储介质。所述方法包括:获取待识别的客户语音数据;通过对客户语音数据进行特征提取,得到语音特征集;对语音特征集中的语音特征进行组合拼接,得到客户语音数据对应的语音特征向量;通过训练好的语音情绪识别模型对语音特征向量进行识别,得到客户语音数据对应的语音情感类别;语音情绪识别模型包括卷积神经网络和长短期记忆网络。采用本方法能够提高语音情绪识别的准确性。
技术领域
本申请涉及语音处理技术领域,特别是涉及一种语音情绪识别方法、装置、计算机设备和存储介质。
背景技术
随着人工智能技术的发展,人机交互也越来越频繁;语音技术在人机交互中占据重要的角色,即语音技术渐渐成为信息传输中人机接口的关键技术。语音是人类表达信息的重要载体,通过语音不仅可以传递人类的语义信息,还可以传递情感信息。语音情感识别是一个综合模式识别、信号处理等多种学科的综合性技术,语音情感识别技术可以判断人类的当前情感,通过语音情感识别可以提高用户对人工智能的需求。
然而,目前的语音情绪识别通过基于深度学习的神经网络进行处理,对语音进行局部特征提取识别,得到对应的语音情绪类别,导致语音情绪识别的准确性低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够语音情绪识别的准确性的语音情绪识别方法、装置、计算机设备和存储介质。
一种语音情绪识别方法,所述方法包括:
获取待识别的客户语音数据;
通过对所述客户语音数据进行特征提取,得到语音特征集;
对所述语音特征集中的语音特征进行组合拼接,得到所述客户语音数据对应的语音特征向量;
通过训练好的语音情绪识别模型对所述语音特征向量进行识别,得到所述客户语音数据对应的语音情感类别;所述语音情绪识别模型包括卷积神经网络和长短期记忆网络。
在其中一个实施例中,所述对所述语音特征集中的语音特征进行组合拼接,得到所述客户语音数据对应的语音特征向量,包括:
将所述语音特征集中的梅尔倒谱系数参数、过零率、短时能量、谱平面和色谱图进行组合拼接,得到所述客户语音数据对应的语音特征向量。
在其中一个实施例中,所述通过训练好的语音情绪识别模型对所述语音特征向量进行识别,得到所述客户语音数据对应的语音情感类别,包括:
通过训练好的语音情绪识别模型的卷积神经网络和长短期记忆网络对所述语音特征向量进行卷积、递归处理,得到所述客户语音数据对应的语音情感类别。
在其中一个实施例中,所述语音情绪识别模型的训练,包括:
获取语音训练样本数据;
对所述语音训练样本数据进行特征提取,得到对应的语音样本特征集;
对各所述语音样本特征集中的语音特征进行组合拼接,得到各所述语音样本特征集对应的语音样本特征向量;
根据各所述语音样本特征向量训练构建的语音情绪识别模型中,直到所述语音情绪识别模型收敛,得到训练好的语音情绪识别模型。
在其中一个实施例中,所述获取语音训练样本数据,包括:
获取源语音样本数据;
对所述源语音样本数据进行转码处理,得到转码后的源语音样本数据;
获取所述源语音样本数据的标注信息;
根据所述标注信息对所述源语音样本数据进行切割,得到语音训练样本数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南方电网数字电网研究院有限公司,未经南方电网数字电网研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110352926.7/2.html,转载请声明来源钻瓜专利网。





